Nortable Research
다유전자 위험 점수(polygenic risk score, PRS)는 다양한 유전적 위험 변이를 종합하여 개인의 질병 소인을 예측합니다. 이를 통해 위험을 예측하고 질병을 조기에 발견하며 적절한 조치를 취함으로써 건강을 개선할 수 있는 가능성이 대두되고 있습니다. 그러나 여전히 몇 가지 해결되지 않은 과제들이 남아있습니다. PRS는 주로 유럽 혈통의 개인을 대상으로 한 GWAS 데이터를 사용하여 생성되는 경우가 많기 때문에 비유럽 인구에 대한 예측 정확도가 제한적입니다. 다양한 인종의 코호트를 활용하고 유전적 정보와 비유전적 정보를 통합함으로써 PRS 정확도를 개선할 수 있지만, 일차 진료에서 PRS를 임상적으로 구현하기 위해서는 대규모 다기관 연구를 통한 추가 연구가 필요합니다. 이러한 목적으로 Electronic Medical Records and Genomics (eMERGE) 네트워크에서는 다양한 인구 집단을 대상으로 PRS 예측 성능 개선 및 결과의 해석, 의료진과 환자에게 결과를 전달하기 위한 프레임워크와 파이프라인을 개발하였습니다. 해당 연구에서는 다양한 인구 통계를 대상으로 하였으며 10개 등록 기관 중 6개 기관에서 참가자의 75%를 소수 인종 또는 소수 민족 또는 의료 취약 계층으로 등록하는 것을 목표로 하였습니다. 또한 10가지 만성 질환에 대한 PRS 평가를 수행하고 그 결과를 의료 전문가와 환자에게 제공했습니다. 또한 다양한 인종 집단에 대해 각 질환에 대한 PRS 최적화 및 검증을 시행하고, 유전적으로 유추한 연구 참여자의 인종을 기반으로 z-score를 보정하는 데 사용된 절차와 개인별 임상 보고서를 생성하는데 사용된 파이프라인을 설명합니다. 이 파이프라인을 사용하여 평가한 2,500명의 대상자 중 581명에서 10가지 질환 중 하나 이상에서 높은 PRS 점수가 확인되었습니다. 향후 연구에서는 질병 예방 또는 조기 발견을 위한 적절한 조처를 통해 이러한 PRS 결과가 건강 개선에 도움이 되는지 평가할 필요가 있습니다.
PRS auditing and evaluation eMERGE 네트워크는 다단계 평가 프로세스를 통해 유병률, 유전력(heritability), PRS의 성능, 임상적 특성, 다양한 인구집단에 대한 데이터 이용 가능성 등의 요소를 기반으로 23개 질환에 초점을 맞춰 임상 적용을 위한 다유전성 위험 점수(PRS)를 선정했습니다. 여기에는 유방암, 관상동맥 심장 질환, 당뇨병, 고혈압과 같은 유병률이 높은 질병이 포함되었습니다. 해당 질환군의 PRS에 대해 분석 가능성, 타당성, 임상적 유용성, 공중보건에 미치는 영향력을 중심으로 검토하였고, 소아와 성인 등 다양한 발병 연령대를 포함하는 질환군을 고려하였으며, 소수 인종 집단을 포함한 다양한 인구 집단의 적용 가능성에 초점을 맞추었습니다. 이러한 검토를 통해 12개의 질환군을 우선 선정하였습니다.
Selection, optimization and validation 12가지 PRS의 성능을 체계적으로 평가하기 위해 프레임워크를 개발하는 과정에서 아프리카와 히스패닉 인구에 초점을 맞추었으며, 여러 인종에 적용할 수 있는 일반화 가능성을 검증하는 것을 목표로 하였습니다. 연구진은 PRS 검증 및 다양한 인종 간 적용 가능성을 위해 eMERGE, UK Biobank, Million Veteran Program 등 광범위한 데이터를 활용하였습니다. PRS 중 5개는 성능을 개선하기 위해 추가로 최적화 작업을 진행했으며, 만성 신장 질환의 경우 APOL1 유전자형을 추가하여 최적화를 시행했습니다. PRS의 성능과 임상적 유용성을 고려하여 복부 대동맥류와 대장암이 제외되었으며, 최종적으로 천식, 심방세동, 유방암, 만성 신장 질환, 관상동맥 질환, 고지혈증, 비만/BMI, 전립선암, 1형 당뇨병, 2형 당뇨병까지 10개의 질환이 선정되었습니다.
그림 1
타임라인 및 프로세스 개요. a, 임상 PRS 테스트 파이프라인의 선택, 평가, 최적화, 이전, 검증 및 구현을 위한 타임라인 및 프로세스. b, eMERGE PRS 프로세스 개요.
그림 2
2,500명의 eMERGE 대상자의 결과 요약. a, 10개 질환 중 하나라도 ‘고위험’ 결과가 나온 대상자(빨간색 점)와 모든 질환에서 ‘고위험-아님’인 대상자(회색 점)의 혈통 비교 PCA. b, 대상자 당 발견된 ‘고위험’ 수. c, 질환 별 ‘고위험’의 예상값(파란 점)과 관찰값(빨간 점).
Population-based z-score calibration 이 연구에서는 새로운 PRS 개발보다는 임상에서 검증된 PRS를 통합하고 구현하는 데 중점을 두었으며, 궁극적으로는 cross-ancestry PRS 를 검증하고 결과를 도출하는 방법론을 구축하는 것을 목표로 하였습니다. 그러나 cross-ancestry PRS 점수를 사용하더라도 유전적 혈통 간의 z-score 분포 차이로 인하여 위험도 분류의 일관성이 저해될 수 있습니다. 이 문제를 해결하기 위하여 해당 연구진은 대상자의 혈통을 유전적으로 추정하고, 인구 기반 보정 모델(population-based calibration model)을 이용하여 z-score를 보정하는 방법을 개발하였습니다. 또한 실제 생물학적 위험도 차이뿐만 아니라 인구 집단 간 대립 유전자 빈도 및 연관 불균형(linkage disequilibrium) 차이에 의해 PRS 점수의 평균과 표준편차가 달라질 수 있습니다. 이 때문에 PRS를 개발하는 데 사용된 혈통 집단과 다른 혈통을 가진 개인에 대해 해당 PRS를 적용할 때 위험도 분류가 달라질 가능성이 있습니다. 따라서 임상적으로 시행되는 PRS 검사는 혈통 배경에 따른 차이를 고려한 조정이 필요합니다. 해당 연구에서는 평균만 모델링했던 기존 PCA 기반 보정 방법을 평균과 분산 모두 모델링하도록 수정하였습니다. 이러한 방식을 통해 다양한 집단에서 보다 정확하게 위험도를 추정할 수 있었습니다.
Transfer and implementation 최종 선정된 10가지 질환 별 PRS 모델을 이용하여 Broad Institute연구진이 샘플과 데이터를 분석하였습니다. 해당 모델은 여러 차례 반복적으로 평가되었으며, 다양한 인종의 참조 세포주(reference cell line)와 혈액 및 타액 검체를 사용하여 파이프라인의 기술적 정확성, 재현성, 성능을 평가하였습니다. 임상적 유효성(clinical validity)은 eMERGE 3상 데이터 세트를 사용하여 PRS 성능을 확인하였으며, 보고서는 CLIA 규정에 따른 검사실 책임자에 의해 보고되었고, 인력 교육 및 표준 운영 절차를 마련하였습니다.
Creation of pipeline for report creation, review, sign-out and release 데이터 검토와 임상 보고서 생성을 간소화하기 위해 소프트웨어 파이프라인을 개발하여 PDF 문서와 JSON 구조의 데이터를 생성했습니다. 여성은 유방암에 대해서만, 남성은 전립선암에 대해서만 PRS를 계산하는 등 출생 시 연령과 성별에 따라 사례를 분류하기 위한 자동화된 규칙이 마련되었습니다. 데이터는 정확성과 적절한 질관리를 위해 z-score 범위, PCA 플롯, fingerprinting assay 등의 요소를 활용하여 검토하였습니다. 반복적인 검토 과정을 통해 작성된 최종 임상 보고서는 결과를 ‘고위험’ 또는 ‘고위험 아님’으로 정성적 분류를 하였으며, 추가로 유방암 및 관상동맥 질환에 대해서는 z-score를 포함하였습니다.
Overview of the first 2,500 clinical samples processed 2022년 7월부터 2023년 5월까지 2,500명의 대상자에 대해 임상 PRS 파이프라인을 시행하였습니다. 평균 연령은 51세, 여성 비율이 64.5% 였습니다. 가장 많은 그룹은 백인과 흑인/아프리카계 미국인(각 32.8%)이었고 히스패닉/라티노(25.4%)가 그 뒤를 이었습니다. 대상자들 중 20.6%는 10가지 질환 중 하나에 대해 높은 PRS 점수를 보였으며, 혈통에 따라 조정했을 때 고위험군 PRS 점수의 분포는 예측과 잘 일치하는 것으로 나타났습니다.
다유전성 위험 점수(PRS)의 예측 성능은 크게 향상되었지만, 다양한 인구집단에서 그 성능을 보장하는 데는 여전히 어려움이 있습니다. 대부분의 GWAS 연구는 유럽 혈통의 인구집단을 대상으로 하기 때문에 비유럽권 인구의 PRS 예측 정확도가 떨어지고 이에 따라 잠재적으로 건강 격차를 증가시킬 수 있습니다. 해당 연구는 다양한 주요 인종 집단에 대한 PRS 적용 및 임상적 활용과 질관리를 위한 프레임워크를 개발하였습니다. PRS 기반 위험 평가는 특정 위험 요소에 대한 조처를 가능하게 함으로써 질병에 대한 부담과 건강 격차를 줄일 수 있는 가능성을 보여줍니다. 그러나 특정 인구 집단이 과대표되는 경향, 유전적 결정론, 효율적이고 신뢰할만한 질관리 방안, 예방 전략에 대한 효과적인 의사소통 및 실행과 같은 문제는 여전히 남아있습니다. PRS 개발에 적합하다고 여겨지는 질환 혹은 표현형의 약 절반만이 임상적으로 실현되었으며, 이는 PRS를 적용할 수 있는 대상 표현형에 대해 신중한 고려가 필요하다는 것을 의미합니다. 향후 임상 현장에 PRS를 통합, 구현하기 위한 가이드라인의 개발이 필요합니다.
[References]
[1] Selection, optimization and validation of ten chronic disease polygenic risk scores for clinical implementation in diverse US populations. Nat Med. 2024;30:480-487.