Technology Trend
차세대 시퀀싱(Next-generation sequencing, NGS) 기술을 활용한 전장 유전체 시퀀싱(whole-genome sequencing, WGS) 및 전장 엑솜 시퀀싱(whole-exome sequencing, WES)은 유전체 전체를 편향 없이 고해상 도로 연구할 수 있도록 해 줍니다. 이러한 assay는 유전 질환 관련 유전자 변이의 식별 및 특성 확인을 비롯해 다양한 연구 분야에 적합하지만, 랩에서 방대한 양의 WGS/WES 데이터를 분석하고 해석하는 단계에서 상당한 병목 현상이 발생하고는 합니다.
워크플로우를 간소화 해주는 Illumina Connected Analytics
Illumina Connected Analytics는 인포매틱스(informatics) 워크플로우의 운영과 과학적 통찰의 도출을 위한 안전한 유전체 데이터 플랫폼입니다(그림 1). Connected Analytics는
연구자에게 다음과 같은 기능을 제공합니다.
- 분석 파이프라인의 빌드 및 맞춤 설정
- 원하는 규모의 프로덕션 워크플로우 실행
- 데이터와 연구 결과의 탐구 및 공유
클라우드 컴퓨팅이 제공하는 탄력적인 리소스를 활용하는 Illumina Connected Analytics는 동일한 아키텍처를 사용하여 수십에서 수천 개의 세포를 선별 검사해야 하는 복잡한 단일세포(single-cell) 시퀀싱 프로젝트에서 인구집단 규모의 WGS 프로젝트에 이르기까지 다양한 규모의 운영을 지원합니다. 또한 연구자는 Illumina Connected Analytics를 사용 중인 시퀀싱 기기에 원활하게 통합할 수 있습니다.
Fig 1. 데이터 관리 및 분석의 토대가 되는 Illumina Connected Analytics
DRAGEN™ Bio-IT Platform
DRAGEN 플랫폼은 NGS 데이터를 처리하고 더 심층적인 정보를 위한 3차 분석을 가능케 해 주는 2차 분석 소프트웨어 제품군입니다. 또한 다양한 도구로 구성된 매우 정확하고
포괄적이며 효율적인 솔루션을 지원하므로 랩에서 규모나 연구 분야와 관계없이 유전체 데이터를 한층 더 효과적으로 활용할 수 있습니다.
DRAGEN이 제공하는 다양한 파이프라인은 온프레미스(on-premise), 클라우드 또는 기기에 내장된 솔루션을 통해 사용이 가능하므로 랩은 필요에 따라 가장 적합한 솔루션을
선택하면 됩니다.
DRAGEN 2차 분석 파이프라인은 WGS, 인리치먼트 패널(enrichment panel), 단일세포 RNA-Seq(single-cell RNA-Seq), 단일세포 ATAC-Seq(assay for
transposase-accessible chromatin with sequencing), 단일세포 멀티오믹스(multiomics) 연구, 벌크 RNA-Seq(bulk RNA-Seq), 메틸화 분석 (methylation analysis) 등
여러 유형의 실험을 지원합니다. DRAGEN 소프트웨어의 다양한 기능 중 일부만을 재현한다 해도 30개가 넘는 오픈 소스 도구가 필요합니다.1,2
아울러 대용량 NGS 데이터 파일의 저장 공간을 절약할 수 있도록 DRAGEN Original Read Archive(ORA) 기술을 채택하여 FASTQ 파일을 1/5 크기로 무손실 압축(lossless compression)합니다.
XAI를 통한 3차 분석을 제공하는 EmedgeneTM
변이 해석은 많은 시간을 필요로 하는 수작업 단계로, 유전체당 최대 7시간이 소요되며 수많은 반복 단계를 거쳐야 합니다.3
Illumina는 이 문제를 해결할 수 있도록 랩에 연구 소프트웨어 플랫폼인 Emedgene을 제공하고 있습니다. Emedgene은 희귀 질환과 기타 유전 질환 연구시 3차 분석에 활용할 수 있는 자동화된 설명 가능한 인공 지능(explainable artificial intelligence, XAI)을 통한 자동화 지원 솔루션을 제공합니다.
이 포괄적인 플랫폼은 랩의 해석 워크플로우를 간소화하고 변이 큐레이션(curation) 부담을 줄여 주기 위한 목적으로 유전학자가 설계하였습니다. 또한 자동화된 XAI 기반의 유전체 분석 플랫폼을 통해 효율성이 2~5배 높고 분석 건당 총 워크플로우 시간은 50~75% 감소된 고처리량 데이터 해석이 가능합니다.
미국 텍사스주 휴스턴에 위치한 Baylor Genetics의 연구진은 검증 연구를 실시하여 연구 대상으로부터 수집한 180개의 WES 데이터 세트로 구성된 코호트를 이용해 과거의 수동적인 검토 절차를 대체하는 XAI를 통한 변이 해석의 성능을 검증하였습니다. 검증 결과, 96.6%의 샘플에서 원인 변이(casual variant)가 확인되었으며 추가 검토를 요하는 1~10위의 변이로 지정되었습니다 (그림 2).
Fig 2. XAI를 통한 변이 순위 — Baylor Genetics 연구진이 진행한 한 검증 연구에서 XAI를 통한 변이 해석은 96.6%의 분석 건에서 트리오(trio, 주황색) 및 싱글톤(singleton, 노란색)을 비롯한 원인 변이를 1~10위로 올바르게 지정함.
요약
Illumina는 Illumina의 다양한 시퀀싱 시스템과 DRAGEN 플랫폼, Connected Analytics, Emedgene과 같은 소프트웨어를 통합함으로써 3차 분석이 필요한 희귀 질환과
기타 유전 질환 연구를 진행하는 랩에 지속적인 성장의 기회를 제공합니다.
연구 전용입니다. 진단 절차에는 사용할 수 없습니다.
[참고문헌]
1. Illumina. DRAGEN Wins at PrecisionFDA Truth Challenge V2 Showcase Accuracy Gains from Alt-aware Mapping and Graph Reference Genomes.
illumina.com/science/genomics-research/ articles/dragen-wins-precisionfda-challenge-accuracy-gains. html. Accessed March 14, 2022.
2. Internal data on file. Illumina, Inc., 2022.
3. Austin-Tse CA, Jobanputra V, Perry DL, et al.
Best practices for the interpretation and reporting of clinical whole genome sequencing. NPJ Genom Med.
2022;7:27. doi.org/10.1038/s41525-022-00295-z.