今天我們通過介紹一篇Cell文章,說一個有意思的現象:SNP位點可同時作為啟動子和增強子,其轉換由基因型決定,結果是一個基因產生不同的RNA,從而參與疾病發生發展。
風險SNP介導的啟動子/增強子轉化通過lncRNA PCAT19促進前列腺癌發生發展,這里我們關注幾個關鍵詞:SNP位點、啟動子、增強子、lncRNA PCAT19和前列腺癌。
增強子的概念在昨天的文章里面介紹過——科研新思路:基因DNA獨立于RNA發揮作用
增強子是能夠增加啟動子活性從而增加基因轉錄頻率的DNA序列。
下面我們直接看文章。
一、SNP位點rs11672691與患者預后及lncRNA PCAT19表達關系
首先前期GWAS分析報道SNP位點rs11672691與前列腺癌風險和患者死亡率相關,接下來研究團隊對CPC-GENE研究中的127位患者的RFS和SNP的基因型進行分析,結果發現GG基因型患者生存率顯著更低:
接下來通過eQTL分析SNP基因型與1-Mbp內基因表達的關系,發現與lncRNA PCAT19最相關:
由于lncRNA PCAT19有多個異構體,其中前列腺癌中表達最高的是兩條lncRNA PCAT19-short和lncRNA PCAT19-long:
注意箭頭處的不同轉錄起始位點TSS。
接下來eQTL分析發現SNP基因型與short和long的相關性正好相反:
G/G型 short表達低;long表達高
這樣就把已經報道的前列腺癌風險位點與lncRNA的不同異構體的表達建立起來了聯系。
二、位于short啟動子的非風險位點更偏重被轉錄因子NKX3.1和YY1結合
首先看一下SNP位點與lncRNA的關系:
紅色箭頭指的是rs11672691和 LD SNP rs887391位點的位置,我們可以看到其位于short啟動子上游和long的(第三)內含子。
而這個位置正好是轉錄因子NKX3.1和YY1的結合區域,且Chip-seq實驗也發現兩個轉錄因子更偏重與非風險序列結合:
圖中紅色箭頭指的是兩個轉錄因子的偏好性,我們可以看到兩個轉錄因子更偏好于結合非風險的序列。
三、SNP位點通過介導啟動子/增強子轉換調控異構體表達
前面已經證明了兩個轉錄因子更偏重結合非風險位點,而非風險基因型與兩條lncRNA異構體的表達關系是:short表達更高,而long表達低。兩個轉錄因子進行的基因沉默也證實了short的表達顯著降低,而long則出現了表達升高:
結果中轉錄因子沉默導致short表達降低可以說明轉錄因子對short啟動子結合介導的轉錄調控;而對long的影響原因是不清楚的。
接下來,通過CRISPRi和CRISPRa分別干預SNP位點(位于short的啟動子區域),結果是long的表達分別降低和升高,而short的表達也是降低和升高:
這里的結果就有意思了:對short來說啟動子的活化表達導致其表達升高,可導致long升高是怎么回事呢?
進一步的,根據Roadmap Epigenomics(前期研究)和Chip-seq的結果,研究團隊發現SNP位點具有啟動子和增強子的組蛋白修飾(H3K4me3和H3K4me1 )
特性(下圖紅框),因此推測SNP位點通過不同基因型介導啟動子和增強子轉換:
下面就是驗證這個推測了,用到的是熒光素酶報告基因來檢測啟動子和增強子的活性(luciferasebased promoter and enhancer assays),結果發現風險位點有更高的增強子活性,而非風險位點有更高的啟動子活性:
前面我們已經證明了SNP位點所在位置是short的啟動子發揮作用,下面進一步來證明這個位點在的區域作為long的增強子。首先分析了DHS信號 (DNase I hypersensitive, 染色體開放區域的一個指標)與long啟動子的相關性,接下來通過3C實驗(chromosome conformation capture 3C assay)結果發現long 啟動子與SNP位點所在區域有更強作用,且作用富集在SNP位點:
到這里,這篇文章中的一個關鍵問題就解決了:前列腺癌風險位點SNP位點通過不同基因型介導所在區域作為lncRNA PCAT19的啟動子和增強子調控兩者表達,對應關系是:SNP風險位點——long的增強子活性——long高表達;SNP非風險位點——short的啟動子活性——short高表達。
四、lncRNA PCAT19 long通過活化細胞周期基因促進前列腺癌
上面這個問題解決后,下面就是long的的功能和下游機制了。
功能上用了三種敲減技術:siRNA,ASO和shRNA,從體內和體外研究細胞的增殖、侵襲遷移能力:
細胞和動物實驗發現long促進前列腺癌進展
初步機制上,先通過RNA-seq找差異基因,GO分析顯示細胞周期被最顯著富集;接下來TCGA數據分析long表達與細胞周期基因關系、患者預后關系;最后檢測long敲減后周期基因表達:
這一步解決的問題是long發揮作用的下游機制初步探索,明確的是long調控的作用通路(細胞周期)和基因,但沒有解決的是long的直接作用靶點。
具體靶點的確定:首先做long的細胞定位,發現定位與細胞核;接著是long的RNA pulldown+質譜/WB檢測和CHIRP(chromatin isolation by RNA pull-down)驗證,結果發現作用蛋白是HNRNPAB;再通過RIP反向驗證:
HNRNPAB與long直接結合
long通過HNRNPAB發揮作用:HNRNPAB與long直接結合不等于long通過HNRNPAB發揮功能,所以從表型和靶基因調控的類似性說明:
(1)HNRNPAB對前列腺癌的表型影響與long類似;
(2)HNRNPAB與long調控的靶基因類似:
最后是整篇文章作用機制的示意圖:
到這里這篇文章就介紹好了,下面我們來說一個問題:SNP的研究還有沒有創新性?
很多人說SNP的研究已經做了這么多年,沒有創新性了,這個問題要看你怎么考慮。在這篇文章中SNP與lncRNA基因的啟動子和增強子結合起來發的是Cell雜志;如果沒有SNP介導的啟動子/增強子轉換這個部分的工作,就只看這篇文章中lncRNA PCAT19的工作量的話,文章很難超過10分,甚至5分都難。
另外,我們以前推過另外一篇文章:一篇22分的NG教你如何設計課題,這篇文章中SNP也是與lncRNA聯合起來研究的,只不過SNP位點位于lncRNA內部,對lncRNA的影響也是影響到lncRNA的不同作用方式:
所以我個人認為:只有外行才會說一個方向沒有創新性了,不是沒有,是你不知道怎么做。