long non-coding RNA(lncRNA)는 길이가 200 nucleotides(nt) 이상인 ncRNA로, 단세포 진핵생물부터 식물과 다세포 동물 그리고 인간의 유전체 존재하며, 다양한 조직과 세포에서 발현이 관측되고 있다. Metazoa 이상의 세포에서 대부분의 lncRNA는 mRNA 처럼 RNA polymerase II에 의해서 전사되며, 5' capping과 3'-polyadenylation, splicing과 같은 RNA 프로세싱 과정을 거치게 된다 [1] (그림 1). 과반 이상의 lncRNA는 핵 속에 더 많이 머물게 되며, 나머지는 세포질로 이동하게 된다. 일부는 핵과 세포질을 결합단백질에 따라 순환하게 된다. 이러한 lncRNA는 핵 속에서 크로마틴구조의 조절, 전사 조절, RNA 안정화 조절을 주로 담당하며, 세포질에서는 RNA 안정화 조절, 번역조절, miRNA decoy와 같은 역할을 주로 담당하는 것으로 알려져 있다 [2].
그림 1. lncRNA 구조
현재까지 인간 유전체에서는 약 25,000의 lncRNA 유전자가 발견되었으며, 이는 이미 단백질 유전자 개수를 넘어서는 숫자이다. 가장 많이 사용되는 GENCODE 최신 버전에 lncRNA 유전자는 약 25,000개가 포함되어 있으며 [3], 가장 정확한 것으로 알려진 BIGTranscriptome에는 약 16,000개의 lncRNA 유전자가 동정 되어 있다 [4]. 또한, 암 조직에서 생산된 전사체 데이터로부터 새롭게 발견되는 lncRNA가 계속해서 보고되고 있다. 특히 TCGA, ICGC, GTEx와 같은 대규모 Consortium에서 생산된 전사체 데이터로부터 lncRNA 유전자가 대규모 확보되고 있다 [5]. 하지만, lncRNA 유전자가 단백질 유전자나 전사조절인자보다도 훨씬 세포/조건 특이적인 발현을 보이고 있으며, 만약 소규모 세포타입에서 발현되는 lncRNA 유전자의 경우, 조직 수준의 연구에서는 대부분 탐지되지 못하는 문제점을 안고 있다. 이러한 이유로 세포 타입 별 lncRNA 지도 작성과 탐색을 수행해야 하며, 이를 위해 세포 타입 별로 약 106개 이상의 세포를 유세포 분석을 통해 확보해야 할 것이다 (그림 2). 예를 들어 말초혈액 단핵구 중에 약 0.1% 수준으로 존재하는 T regulatory cell를 106개 확보하려면 수없이 많은 단핵구의 유세포 분석을 필요하게 된다. 이러한 이유로 소규모 세포 타입에서 특이 발현되는 미발굴 lncRNA 유전자가 상당수 존재하고 있는 것으로 알려져 있다.
최근까지 암세포주와 암조직에서 특이 발현하는 lncRNA의 암특이 마커의 보고가 수없이 많이 되어왔으며, 수 백개의 lncRNA가 암발생 및 악화를 조절하는 것으로 보고되고 있다 [6]. 일부 연구를 제외한 대부분의 연구는 단순히 lncRNA 발현을 조절하고, 암악성화 어세이를 통해 기능을 확인하거나, lncRNA 유전자의 체성 돌연변이와 암 발생과의 관계 분석, lncRNA의 발현 패턴과 유사한 단백질 유전자의 기능 분석 등으로 lncRNA 암 관련성을 조사하는 수준에 머물고 있다. 또한, 암 조직 특이적으로 발현하는 것으로 보고되었던 lncRNA중 상당수가 암세포가 아닌 암조직에 침윤되어 있던 면역세포나 기저세포에 발현되고 있는 것이 확인되어, 암면역환경에서 lncRNA의 역할에 대한 면밀한 조사가 필요한 상황이다 [7]. 예를 들어, Oncogenic lncRNA로 알려졌던 MIAT, PVT1이 Cytokine Pathway와 높은 발현 상관관계를 보이고 Cytotoxic T cell에서 발현이 됨이 확인되었다.
그림 2. 조직수준(Bulk) RNA-seq, 세포타입(Cell-type)별 RNA-seq, 단일세포 RNA-seq(scRNA-seq) 에서 lncRNA 동정과 발현 조사
암면역 미세환경(Tumor-immune microenvironment)은 암세포의 다양한 클론과 침윤되거나 주변에 존재하는 선천, 적응 면역세포, 그리고 기저세포들로 구성되며, 암의 성장, 진화, 이동, 전이 등이 주변 세포들과의 상호작용을 통해 조절되고 있음이 알려져 있다. 특히 암세포를 인지하는 면역세포의 면역 관문(Immune Checkpoint) 조절 기능은 항암면역치료제 개발의 전기를 가져올 만큼 큰 연구성과를 거두고 있다. 다양한 암세포와 면역세포 기저세포들에서 일어나는 분자적 수준의 변화와 조절을 이해하기 위해서 세포 특이적 발현을 하는 다양한 RNA의 연구가 필수적이다. 특히, 세포 특이적 발현이 강한 lncRNA를 통한 세포 상호작용과 상태변화 조절 연구는 기존에 존재하지 않던 새로운 연구의 방향과 인사이트를 제공할 것으로 기대된다. 특히, PanCancer 연구를 통해 면역세포 타입별 분포와 lncRNA의 발현의 상관관계를 분석하여 241개의 면역관련 lncRNA를 동정하였으며, 면역세포 관련 lncRNA 개수를 암 종별로 분석한 결과 유방암, 폐암, 간암, 자궁경부암등의 암 종 에서 많은 면역 관련 lncRNA가 동정되었다 [7]. 또한, In-situ hybridization을 통해 암-면역 미세환경에서 면역세포 특이적으로 발현되는 HOTAIR, lncRNA-EPS, Lnc-EGFR등 일부 lncRNA가 보고되고 있다.최근 수십 개의 면역 세포 타입별 RNA-seq데이터에서 특이적으로 발현하는 lncRNA, miRNA, mRNA, circRNA 발현 조사 연구가 수행되었지만, GENCODE에 알려진 lncRNA에 한정되었고, 새로운 lncRNA 동정 연구는 수행되지 못했다. 한편, 유럽과 미국 연구기관들을 중심으로 BLUEPRINT(https://www.blueprintepigenome.eu/) 프로젝트와 Immgen데이터베이스(http://www.immgen.org/)를 통해 인간과 생쥐의 말초혈액 단핵구, 림프구, 골수에서 세포타입별로 RNA-seq을 수행하여 데이터를 공개하였다. 이러한 세포 타입별 RNA-seq 데이터는 전사체를 재구성하고 lncRNA를 동정하는데 활용할 수 있게 하였다. 더 최근에는 인간의 다양한 암 조직에서 CD4, CD8 T cell을 확보하여 Full-length 전사체 데이터를 생산하고 여기에서 lncRNA 유전자 지도를 새롭게 작성하였으며, 9433개의 새로운 T cell 발현 lncRNA을 발굴하였다[8].
암-면역 미세환경에서 세포 타입별 lncRNA 지도를 확보가 완료되면, 비로소 단일세포전사체 데이터에서 lncRNA을 발현을 직접적으로 확인할 수 있게 된다. 예를들어 골수에서 수행된 Human Cell Atlas 데이터로부터 단일세포 수준의 lncRNA 발현을 확인하고 세포 타입별 lncRNA 마커를 확인할 수 있게 된다. 또한, 다발성골수종 단일세포 데이터에서도 플라즈마 세포에서 유래된 암세포와 다양한 면역세포에서 mRNA 뿐 아니라 lncRNA 발현과 마커를 확인할 수 있게 된다. 더 나아가 이러한 세포 타입에서 특이 발현하는 lncRNA의 기능 조사를 통해 암 악성화나 면역활성화를 조절하는 lncRNA 연구를 가능하게 할 것이다. 그림 3은 대장암 단일세포 데이터를 이용하여 새롭게 동정된 lncRNA의 발현을 조사하고 특정 암세포(Malignant)와 기저세포(Endothelial, Fibroblast) 그리고 면역세포(Mast cell, pDC, DC, Macrophage, B cell, Treg, CD8 T cell, T cell)에서 특이 발현하는 lncRNA 마커를 보여주고 있다. 단일세포 수준의 lncRNA 분석을 통해 조직수준에서 발현의 변화를 넘어서 세포수준에서의 lncRNA 발현변화 조사 및 진단, 예후 마커 조사, 더 나아가 새로운 치료 표적 발굴에 도움을 줄 수 있을 것으로 기대하고 있다.
그림 3. 암-면역 미세환경 세포타입별 lncRNA 발현 마커
[References]
[1] Igor Ulitsky and David P. Bartel, lincRNAs: Genomics, Evolution, and Mechanisms. Cell. http://dx.doi.org/10.1016/j.cell.2013.06.020
[2] Sarah Geisler and Jeff Coller, RNA in unexpected places: long non-coding RNA functions in diverse cellular contexts, Nature Review Molecular Cell Biology, https://doi.org/10.1038/nrm3679
[3] Adam Frankish et al., GENCODE reference annotation for the human and mouse genomes, Nucleic Acids Res., https://doi.org/10.1093/nar/gky955
[4] Bohyun You et al., High-Confidence Coding and Noncoding Transcriptome Maps, Genome Res. https://doi.org/10.1101/gr.214288.116
[5] Shuai Jiang et al., An expanded landscape of human long noncoding RNA. Nucleic Acids Res., https://doi.org/10.1093/nar/gkz621.
[6] Adam M. Schmitt and Howard Y. Chang, Long Noncoding RNAs in Cancer Pathways, Cancer Cell, https://doi.org/10.1016/j.ccell.2016.03.010
[7] Yongsheng Li et al., Pan-cancer characterization of immune-related lncRNAs identifies potential oncogenic biomarkers, Nature Comms., https://doi.org/10.1038/s41467-020-14802-2
[8] Single-cell Long Non-coding RNA Landscape of T Cells in Human Cancer Immunity, bioRxiv, https://doi.org/10.1101/2020.07.22.215855