我叫林平之,最近又是被標書折磨的時候,但苦于魯老板沒錢給我們做芯片,所以只能靠我們自行挖掘數據……自行挖掘數據……行挖掘數據……挖掘數據……掘數據……數據……據……
我年紀輕輕,不能就這么斷送在這種隨便找分子扯關系的道路上啊,好歹要有個芯片啥的喂!但現實就是這么殘酷,沒有芯片,但要找可能相關的基因。這次的題目更刁鉆,不是研究腫瘤……我去,不研究腫瘤,那連Oncomine啥的都用不上,那咋辦?師兄,能救救我不?
神師兄:寫基金,最關鍵的是什么?如何選題!一般土豪的實驗室都一定得選最好的芯片測序,都用進口的!用就用高端的深度測序,數據直接云端,測序不行最少也得4000×,什么lncRNA芯片、ChIP啊、轉錄組啊,能給他測的全給他測上。就是一個字:貴!
但是沒做過這些的,就只能靠挖!挖出來別人芯片上的數據,那就會變成你的選題,不是腫瘤的也不要緊。不是還有GEO么?這就帶領你挖一個分子出來。隨便給你舉個例子哈,比如我要挖一個老年癡呆的可能有作用的分子,應該怎么操作?
首先,登陸到GEO的DataSets,輸入“Alzheimer”找芯片。
我們就隨便舉個例子,用這個老年癡呆癥尸檢的芯片來做分析。點擊進去,就是GEO網頁分析的界面了。
既然我們要比較找差異基因,那就到下面的數據分析工具里去找,有一個叫“Compare 2 sets of sample”的選項,點擊之后,選擇'Value means difference',這里有一個問題了,就是選“Value”還是“Rank”。“Value”是具體數值,“Rank”應該是一個秩,也就是類似給“Value”評了個分。
接著我們選取比較的分組,肯定是對應的有病和沒病的,但是要選取一下表達的取樣組織位置。
海馬體,顳皮層還是額皮質。海馬體應該來說還是蠻關鍵的,那我們就選擇有老年癡呆的和無老年癡呆的尸體的海馬體樣本吧。
然后確認比對。
只找到幾個基因對吧,還有一些根本沒啥名字,那我們就選一個ARRDC4,這個從邊上的表達圖可以看出來,是表達差異比較明顯的。那這個基因有啥研究沒有呢?我們要用另外一個牛逼的數據庫來看看。這個數據庫一般人我也不告訴他,叫做P××××××(此處打碼)。
搜一下這個數據庫里的數據,發現,研究ARRDC4這個基因的就9篇文章。然后可以在這個數據庫里搜索到與之相關的基因,疾病,藥物通路等等內容。
先看看和什么疾病相關,主要是一些雜七雜八的基本,比如什么“空泡性肌病”啥的,但也有可能有和腦相關的疾病,比如“緘默癥”,好吧,不管是啥,相關的通路涉及比較多的就是賴氨酸降解通路。
接著做了一下基因間的相互關聯性分析。
好了,看上去就真的有戲了不是么?接下去做什么?做實驗啊!你光是挖掘到了這樣的數據,不稍微驗證一下,難道就真的當真了么?要有相關的實驗驗證才能往下繼續的哦!否則連一點前期工作都沒有呢……都沒有呢……沒有呢……有呢……呢……
…華麗麗的分割線…
李莫愁博士:GEO上有好多閑置芯片可以挖掘挖掘,大家有時間也可以自己去試試看。反正閑著也是閑著,今天木有事,先去刨刨地兒!挖來了再分析基因可能的功能什么的,就簡單了。至于神師兄說的那個數據庫,其實不用也行,用GoPubmed配合蛋白互作軟件也一樣能做初級的基因功能分析噠。不過關鍵的關鍵,還是要有預實驗驗證來作為支撐啊!不能隨便找個基因,都不做驗證,這樣寫出來,即使中了也完不成呢!!!好啦,今天就策到這里吧。
萬事屋出售的課程及服務(點擊下方飄黃部分即可查看)