“在許多情況下,lncRNA調控活性更可能源自基因座中的轉錄行為和DNA元件,而不是實際lncRNA轉錄本本身,RNA僅僅是存在或者產生并不一定意味就能體現它的功能。”
——— Joshua T. Mendell教授
在1月25日的《細胞》(Cell)雜志上,來自德克薩斯大學西南醫學中心的Joshua T. Mendell教授和Florian Kopp博士發表了題為“Functional Classification and Experimental Dissection of Long Noncoding RNAs”的綜述文章,從lncRNA的in cis和in trans兩種作用方式進行概念性的闡述,并對lncRNA功能試驗方法框架進行了深入剖析。
作者首先回顧目前對lncRNA功能的理解,將這些轉錄本大致歸類為順式(in cis)調控局部染色質結構和/或基因表達的lncRNA,以及那些離開轉錄位點并反式(in trans)執行細胞功能的lncRNA。
順式
lncRNA在局部基因調控中的功能
對于順式作用的lncRNA來說,將RNA分子自身的功能與所轉錄的DNA區分開來非常具有挑戰性。作者設想三種潛在的機制可以通過lncRNA基因座調節局部染色質或者基因表達。
序列相關的lncRNA順式調控
lncRNA轉錄本本身可以通過招募調控因子到基因座和/或調節其功能,進而調控鄰近基因的表達
lncRNA最顯著的功能,就是順式調控抑制或激活染色質。
代表基因:Xist
轉錄或剪切相關的順式調控lncRNA
lncRNA轉錄和/或拼接的過程會產生一種基因調控功能,這種調控與RNA轉錄本的序列無關
與其他轉錄單位不重疊的lncRNA轉錄,可能也會改變RNA聚合酶II(Pol II)在附近的啟動子和基因體上的占用空間,以及影響局部染色質狀態和轉錄因子對啟動子和增強子區域的結合。
代表基因:Igf2r、linc1319、Blustr、Uph、
lncRNA基因座內的功能性DNA元件
cis順式調控完全取決于lncRNA啟動子或基因位點中的DNA元件,完全獨立于編碼的RNA或其蛋白產物
還有一種lncRNA順式調控活性的情況必需要考慮,其內部的DNA元件的功能與轉錄RNA的產生或序列沒有相關性。
代表基因:lincRNA-p21、Bendr
反式
lncRNA的功能
lncRNA反式調控基因
調控遠離其轉錄位點的染色質狀態和基因表達的lncRNA
HOX antisense intergenic RNA, HOTAIR 是首個被發現能反式調控基因表達的lncRNA。
代表基因: HOTAIR、Ttc39aos1、SLERT
構成細胞核架構的lncRNA
影響細胞核結構和功能的lncRNA
一些lncRNAs似乎影響了核結構來編排轉錄、RNA加工以及基因表達中的其他步驟,以及賦予在這些過程中空間調控。
代表基因:MALAT1、NEAT1、Firre、
調控相互作用蛋白質和RNA的lncRNA
與蛋白質或/和其他RNA分子相互作用和調控的lncRNA
反式作用lncRNA也可以通過調節與其結合的蛋白質或RNA活性和豐度來發揮功能。這些lncRNA的關鍵特性就是需要化學計量與它們相互作用的靶分子,為了發揮可測量的調控作用。因此,在研究這類轉錄本時,必須仔細地對lncRNA及其靶基因的細胞內拷貝數進行定量,以確定該機制的合理性。一般而言,這些調節相互作用可以發生在細胞核或者細胞質中,文章暫先關注細胞質研究案例,以對上文中提到的許多細胞核案例作為補充。除了RNA結合蛋白,lncRNA也能通過堿基對相互結合調節其他RNA的豐度和活性。這類中最突出的就是調節microRNA活性的非編碼RNA,一種被稱為競爭性內源性RNA(ceRNAs)的轉錄本。
代表基因:NORAD、CDR1-AS
lncRNA
lncRNA基因座的識別和初步鑒定
試驗方法 關鍵詞:
CRISPR/Cas9、RACE、RT-PCR、CAGE、RNA-Seq、PAS-Seq、Northern-blotting、PhyloCSF/Pfam預測、Ribosome profiling
挑選一個lncRNA深入研究,通常需要將這個lncRNA與特定的發育、生理或病理生理狀態相關聯。例如許多lncRNA的表達水平在發育和細胞分化和疾病狀態下中表現出動態變化。
在諸如癌癥等疾病中,許多lncRNA都容易發生拷貝數改變和表達水平變化,因為在不同脅迫條件或信號通路激活后,lncRNA的表達受到了差異調控。
作為鑒定改變表型的lncRNA位點的互補性方法,近期出現利用多重CRISPR技術的正向遺傳學篩查方法。利用個別sgRNA將Cas9定位在lncRNA位點的方法并不可靠,原因是這個方法只能得到很短的插入-缺失,并不能導致整個lncRNA的功能性失活。為了將lncRNA喪失功能,已經開始使用成對sgRNA文庫來生成lncRNA位點中更大的缺失。又或者將Cas9與抑制轉錄結構域或激活轉錄結構域融合,使全基因組的lncRNA功能獲得或功能喪失,即CRISPR干擾和CRISPR激活。當解釋這些篩選的結果時,務必要意識到這些技術中每種技術都等同于失活或者超激活lncRNA真實生成的基因和DNA調控元件,例如增強子。因此必須仔細研究從這些系統性方法中浮現出來的候選lncRNA,以確定他們實際上是否是功能性RNA,如果能確定是功能性RNA的話,再搞清楚它們的作用機制。
一旦發現了感興趣的lncRNA位點,就應該搞清楚這個轉錄本在目標細胞類型或目標組織中的完整結果特征。研究方法可以包括rapid amplification of cDNA ends (RACE),或其他確定轉錄本5’和3’末端的方法,再結合逆轉錄PCR證明其中的剪切模式。也可以分析ENCODE和FANTOM這樣的公共開放的高通量測序數據庫。如果有相關類型的細胞和組織,則可能足以了解感興趣的lncRNA結構。這些方法包括基因表達的帽子分析(CAGE),RNA測序(RNA-Seq)和優化檢測PolyA位點的polyA site sequencing (PAS-Seq),這些方法分別能明確研究轉錄本的5’末端、剪切模式和3’末端。如果可能的話,northern blotting還能確定轉錄本的長度。因為通常可用的注釋都來源于高通量數據的自動化分析,所以可能注釋信息可能不準確或者不完整,尤其是如果轉錄本起初是在一種特定的細胞類型中鑒定得到的。此外還應該確定lncRNA轉錄本的細胞拷貝數,因為當系統闡述有關該lncRNA作用機制的合理假設時,最終lncRNA細胞拷貝數信息必將非常重要。由于越來越多被注釋的lncRNA都被證明能編碼短肽,所以排除那些有編碼蛋白可能性的假定非編碼轉錄本就表現得至關重要。用PhyloCSF這樣的算法對感興趣的RNA序列中密碼子替換的進化模式進行分析,就能對這個序列編碼蛋白的可能性進行預測。這種方法利用了編碼轉錄本引入同義替換和保守氨基酸改變,以及相對缺乏生成翻譯終止密碼子的系統進化序列變異的特點,通過電腦模擬翻譯序列與已知的蛋白質家族(Pfam)結構域的相似性,也預測轉錄本編碼蛋白的可能性。最后,利用核糖體圖譜直接觀察假定開放閱讀框的核糖體印記,就可以從非編碼RNA中區分出能編碼蛋白轉錄本。
順式作用lncRNA基因座功能研究
試驗方法 關鍵詞:
CRISPR/Cas9、RNA-Seq、GRO-Seq、qRT-PCR、ASO- or siRNA-mediated knockdown、RIP、pull-down、CLIP
一旦確定想研究的某個lncRNA,理解這個lncRNA功能的第一步就是弄清楚它在局部順式(in cis)調控基因表達,還是它離開轉錄位點并反式(in trans)方式發揮功能。辨別lncRNA是順式調控,還是反式調控作用,最好的方法就是采用功能獲得性和功能喪失性試驗。要評估lncRNA功能喪失后的影響,首先可以直接使用如CRISPR/Cas9介導刪除lncRNA啟動子或整個lncRNA序列。對于多外顯子長lncRNA基因,最好是刪除啟動子區域而不是整個序列,這樣可以減少移除那些嵌入在lncRNA基因內的調控DNA元件的可能性。一旦lncRNA的功能缺失,就該用RNA-Seq和GRO-seq,以及qRT-PCR方法測定鄰近基因的轉錄和穩態表達。lncRNA失活后,如果鄰近基因表達量改變,則這個lncRNA很明確指向順式作用功能。lncRNA的異源表達也不能恢復在lncRNA敲除細胞中的基因表達變化,這樣就進一步證實了這個lncRNA的功能就是順式調控局部基因表達。
如上文描述,調控局部基因表達的lncRNA可能通過嵌入在lncRNA啟動子或基因主體內的DNA調控元件,也許需要或不需要它們轉錄的功能。在其他情況下,轉錄的RNA本身可能是功能實體。為了區分這些可能,在lncRNA的5’端附近插入一段polyA信號序列就能提供很多信息。這種操作將會提早終止轉錄,同時保持啟動子和基因主體中所有DNA元件保持完整。因此這種操作影響了鄰近基因的表達,如果想發揮lncRNA活性就需要其轉錄,不再支持傳統DNA元件的作用作為唯一的功能實體。
這個方法需要注意的是插入一段長polyA序列會增加DNA調控元件之間的距離,因此有可能改變它們的活性。在相同位置插入一段對照序列,例如突變的polyA位點就可以緩解這個問題。如果polyA插入使lncRNA調控活性徹底喪失,那么從基因位點產生的RNA轉錄或剪切可能就是關鍵事件,或者RNA本身可能以一種特定序列的方式執行調控功能。在剪切位點引入靶點突變,以及后續刪除或者替換lncRNA的序列通常會進一步區分這些潛在機制。比如,通過特定序列方式發揮功能的lncRNA對外顯子刪除就很敏感,然而在轉錄和剪切為基礎的序列則對序列替換影響不大,反而會由于polyA位點插入和剪切位點突變而失活。ASO和siRNA介導敲低常備用作評估lncRNA序列生成的RNA是否有功能。雖然這些方法都能明顯降低成熟lncRNA轉錄本的表達,但目前還不清楚這些試劑能在多大程度上促進新生RNA的裂解。這是一個很重要的問題,因為由聚腺苷酸化機制或其他機制產生的新生轉錄酶是轉錄終止的自然觸發因素。
對于lncRNA生成一個功能RNA的情況,對相互作用蛋白和核酸的鑒定是很重要的下一步。嚴格甚至變性條件下的交聯和回收相互作用比那些依賴RIP或體外pull down試驗的方法更受歡迎。在其他領域的綜述中,近期開發的方法極大提高了鑒定內源性RNA與蛋白、染色質和其他RNA相互作用的特異性。由于順式作用lncRNA表達水平通常很低,最初可能很難應用這些方法。如果需要的話,也還可以通過細胞提取物中體外pull-down下來的RNA來識別出lncRNAs與候選蛋白相互作用模式。在這些情況下,關鍵是要用CLIP仔細驗證內源性分子之間的任何假定的相互作用。
蛋白質或核酸結合模式或染色質定位位點的鑒定,通常會允許形成合理的假設,以進一步驗證順式作用lncRNA的機制研究。
反式作用lncRNA的調查研究
試驗方法 關鍵詞:
Rescue experiment、Cell fractionation/FISH、RT-PCR
如果lncRNA功能喪失也沒影響局部基因表達,則其很可能通過反式作用發揮功能。反式功能可以通過敲除細胞內異位修復lncRNA表達的恢復實驗得到明確證實,結果是在lncRNA功能喪失時觀察到表型逆轉。反式作用的lncRNA可能執行多種功能,使用細胞分離和熒光原位雜交對lncRNA亞細胞定位最初分析就會得到很多信息。識別與RNA相互作用的蛋白質或核酸或/和染色質熱定區域的定位,都是對反式作用lncRNA功能研究不可分割的部分,同時結合交聯的方法減少假陽性相互作用。最后,研究這類lncRNA時尤其重要的是仔細量化它們的表達水平,并且確保提出的機制模型都包含它們的表達水平信息。
最后附上該文通訊作者Joshua T. Mendell教授在接受2016年Edith and Peter O'Donnell醫學獎時,題目為的“Regulation & Function of Non-coding RNAs in Physiology & Cancer”學術報告視頻。