Nortable Research
Schizophrenia의 유전적 배경에 대해 첫 번째 연구가 발표된 이후, 해당 질환에 유전적 원인이 기여할 것이라는 많은 연구 결과들이 보고되었습니다. Schizophrenia의 inheritance는 유전적 요인과 비유전적 요인이 복합적으로 작용하며, pedigree-heritability는 약 60-65%, twin-heritability는 81%로 알려져 있습니다. 이 질환의 유전적 원인을 밝히기 위해 많은 연구가 진행되었고, 주로 genome-wide association study (GWAS)나 whole exome sequencing (WES)이 이용되었습니다.
하지만 GWAS나 WES는 전체 genome의 일부에 대해서만 정보를 얻는 한계점이 있어, 최근에는 highcoverage (30x) WGS 데이터를 이용한 분석이 시도되고 있습니다. 21,620명의 WGS 데이터를 이용한 TOPMed 연구에서는 낮은 linkage disequilibrium (LD)를 보이는 영역에 존재하는 드문 genetic variation (minor allele frequency 0.0001-0.1)와 protein-coding region 밖에 존재하는 변이들을 이용하여 키와 body mass index에 관한 heritability를 밝힌 바 있습니다 [1]. 이렇듯, WGS는 structural variants (SVs)를 포함하여 염기서열 수준의 해상도에서 전체 genome의 변이를 검출할 수 있으며, GWAS나 WES에서 확인할 수 없는 regulatory variant나 드문 SVs를 확인할 수 있어 기존의 방법에 비해 유전적 원인을 더 완벽하게 밝혀낼 수 있을 것으로 기대됩니다.
이렇듯, WGS는 structural variants (SVs)를 포함하여 염기서열 수준의 해상도에서 전체 genome의 변이를 검출할 수 있으며, GWAS나 WES에서 확인할 수 없는 regulatory variant나 드문 SVs를 확인할 수 있어 기존의 방법에 비해 유전적 원인을 더 완벽하게 밝혀낼 수 있을 것으로 기대됩니다.
[Fig 1] Burden of coding ultra-rare SNVs and indels
최근 1162명의 스웨덴 schizophrenia 환자와 936명의 ancestry-matched 대조군에 대해 high-coverage WGS을 시행한 분석 결과가 출판되었습니다[2]. 이 연구의 목적은 기존 기술로는 밝혀낼 수 없었으나 WGS로는 확인 가능한 유전 변이들이 schizophrenia에 미치는 영향을 알아내는 것이었습니다. 또한 드문 변이에 의한 임상 양상의 차이를 설명하기 위해 WGS를 이용한 heritability를 분석하였고, noncoding variants의 역할을 확인하기 위해 기존에 알려진 sequence constraints와 인간 뇌를 이용한 functional genomic annotation을 참고했습니다. 특히, 기존WES와 CNV 연구에서 schizophrenia의 위험도에 기여한다고 알려진 극희귀 변이 (ultra-rare variant, URVs)에 초점을 맞추어 분석하였습니다.
1) SNVs와 indel을 포함한 URVs는 WGS case/control 코호트에서 한 차례 보고되고 독립된 인구집단에서 보고된 바 없는 변이로 정의하였습니다. 또한 환자군과 대조군 사이의 대조 분석을 위해 관심있는 유전 영역에서 발견된 모든 event를 이용하여 burden test를 시행하였습니다. 1104명의 환자군과 921명의 대조군에서 URVs의 burden test를 시행한 결과, 환자군에서는 인당 평균 4262개, 대조군에서는 4249개의 URV가 발견되어 통계적으로 유의한 차이를 보이지 않았습니다 (P=0.4225). Damaging protein-coding URVs를 중심으로 분석한 결과에서는 환자군에서 LOF URVs가 더 많이 발견되었으며, 특히 LOF intolerant genes (pLI > 0.9 in non psychiatric subset of ExAC)에서 뚜렷한 것으로 나타났습니다. [Fig 1] 이는 동일 환자들에서 시행한WES의 LOF intolerable genes에 대한 OR보다 높은 수치로, protein-coding region 분석에 있어 WGS가 WES보다 design, coverage, exome capture에 의한 영향을 받지 않으므로 더 나은 장점이 있음을 보여줍니다.
2) Noncoding ultra-rare SNV/indels는 GENCODE protein-coding transcripts의 splice dinucleotide나 coding region의 서열을 변화시키지 않는 변이로 정의하였습니다. 또한 highly constrained region의 변이에 중점을 두어 분석하였으며, 이는 context-dependent tolerance score (CDTS) 1% 미만, 혹은 genomic evolutionary rate profiling (GERP) 4 이상으로 정의하였습니다. 이 조건을 만족하는 noncoding URVs는 환자군과 대조군 사이에 통계적인 차이가 관찰되지 않았습니다 (OR = 1.009, P=0.0342).
3) Ultra-rare SVs는 1162명의 환자군과 936명의 대조군 데이터로 시행되었으며, 기존에 알려진 pathogenic CNV나 드문 CNV를 가진 환자는 제외되었습니다. 총 6809개의 deletion, 1917개의 duplication, 729개의 inversion이 관찰되었습니다. 이 중 ultra-rare SVs는 WGS case/control 코호트에서 한 차례 보고되고 독립된 인구집단에서 보고된 바 없는 변이로 정의하였습니다. 기존 연구결과와 동일하게, ultra-rare deletion은 환자군에서 유의하게 더 많이 관찰되었고 (OR=1.086, P=0.0001, BH-FDR multiple-testing adjusted P=0.0029), ultra-rare duplication과 inversion은 두 집단간 비슷한 결과를 보였습니다. (duplication: OR=1.06, P=0.0920, adjusted P=0.2052; inversion: OR=1.015, P=0.2903, adjusted P=0.4009)
4) Human brain의 epigenomic annotation을 이용한 burden 분석은 유전자 조절에 영향을 미치는 functional elements를 침범하는 ultra-rare SVs의 양이 환자에서 더 많을 것이라는 가정 하에 시행되었습니다. 특히 functional element의 10% 이상을 침범하는 ultra-rare SVs에 중점을 두어 분석한 결과, 환자군에서 topopogically associated domains (TADs) 경계에 영향을 주는 ultrarare SVs가 더 많은 것을 확인할 수 있었습니다. (adult brain: OR=1.613, P=0.0037, adjusted P=0.0283; fetal brain: OR=1.581, P=0.0039, adjusted P=0.0283). TAD 경계 부위의 ultra-rare SVs는 유전자 발현의 비정상적인 조절을 유발할 것으로 추정됩니다. 그 외 다른 functional element 간의 차이는 관찰되지 않았습니다. [Fig 2] Schizophrenia 환자에서 TAD 경계 부위의 ultrarare SVs가 더 많이 발견된다는 사실이 아주 놀라운 것은 아닙니다. 이러한 변이들은 질환 발생에 있어 상대적인 위험도에 기여할 것으로 생각되며, 이 영역의 결실과 다른 질환들과의 연관성이 이미 보고된 바 있습니다. TAD 경계부위는 chromatic 구조를 유지하고 만드는데 중요한 역할을 합니다. 이 부위가 훼손될 경우 유전자가 적합하게 발현하기 위한 regulatory elements가 손상되며, 쥐를 이용한 실험에서는 사지 기형이 보고된 바 있습니다. 향후 이러한 변이들이 생물의 기능에 미치는 정확한 효과를 밝히기 위한 추가 실험이 필요할 것으로 생각됩니다. WGS 데이터에서 noncoding variant를 분석하는 것은 데이터의 방대한 양과 사용할 수 있는 방법이 제한적이기 때문에 어려움이 있습니다. 최근, category-wise association study (CWAS)라는 방법이 autism spectrum disorder 환자의 WGS를 대상으로 시행된 바 있습니다[3]. 이 방법은 수만개의 annotation category를 만든 다음 반복적으로 연관성을 분석하는 방법으로 위양성과 위음성의 가능성 사이에서 분석 방법의 조율이 필요합니다. 이 연구에서는 CWAS 방법을 적용하면서 인간과 포유류 사이에 잘 보존된 DNA 서열을 반영하였고, 인간의 뇌에서 얻어진 다양한 epigenomic annotation 정보를 이용하였으며, 신경정신 질환에 연관성이 알려진 유전자와 영역을 대상으로 분석함으로써 위양성과 위음성을 줄일 수 있었습니다.
[Fig 2] Burden of ultra-rare SVs in brain epigenomic annotations and related analysis.
결론적으로, WGS는 새로운 유전적 원인을 밝힐 수 있는 방법이지만, schizophrenia의 발생에 기여하는 드문 변이를 밝혀내기 위해서는 기존에 시행된 흔한 변이를 이용한 GWAS의 청사진을 참고해야 합니다. 또한 WGS는 저렴하지 않으며 대량의 데이터를 생산하므로 결과를 저장하거나 분석하는데 어려움이 있습니다. 따라서 이를 해결하기 위해 다양한 방면의 협력이 필수적이라 할 수 있습니다.