• 熱線電話:010-56107385

聯系方式

地 址:北京市昌平區北清路生命科學園博雅CC -9號樓2層
電 話:010-56107385
傳 真:
郵 箱:support@ori-gene.cn

技術資料

您現在的位置:首頁 > 技術支持 > 技術資料
為什么轉錄組要做生物學重復?

  為什么轉錄組測序要做重復?

 

  在回答上面的這個問題前,請允許我先引入一個類比。

 

  現在有個項目對中國人和日本人的身高進行一個調查研究,設計一個實驗來確定中國人的身高和日本人的身高是否有差異?如何設計這個實驗?

 

  身高是一個數量性狀,在一個種群內它的分布應該是以一個平均值為中心向兩側延伸類似于泊松分布,如下圖所示:

如果想比較中國人的身高和日本人的身高這個問題,把中日兩國所有的人都抓過來測定一下身高,然后計算平均值和標準方差后,進行統計比較兩個群體是否有差異,這是最準確和理想的方案,但是因為經費的原因不現實。

 

  只能退而求其次,對群體進行隨機抽樣得到小的樣本集,以這個小的樣本集代替原來的整個群體,假設對中日兩國人各進行隨機抽樣1000個,然后測定身高,得到兩個樣本集合C1和J1(身高的數據),然后可以對此進行生物統計學分析,比較兩個種群的身高是否有差異?

 

  現在如果我對每個種群只取一個樣本,中國人1個樣本,日本人1個樣本,然后以這兩個樣本的身高數據進行比較,從而確定這兩個群體的身高是否有顯著差異?這種方案相信所有的人都會立即否定,這明顯不靠譜,因為只是隨機抽了一個樣本,由此得到的結論根本站不住腳。如果我對每個群體選擇1000個樣本,先計算這1000個樣本的平均值,然后通過比較平均值來確定兩個群體是否有差異,這個方案明顯不行,1000個樣本的平均值比起1個樣本來說接近這個群體的平均值的概率高,但是其實本質都是一次取樣,無法進行統計學分析。

 

  如果我對中日兩國的人先按照地區進行抽樣,每個地區選擇10個人,取其平均值作為該地區的代表樣本,這樣每個地區有一個樣本,中日兩個群體也會有很多樣本,這種做法是否可取?這種做法的問題在于:不同地區的人數目不同,身高不同,以地區的平均值代表該地區的平均身高,然后將不同地區的人匯聚起來計算,這樣忽略了人口數目的權重,從而導致整個群體的平均身高被拔高或者降低,最后得到的結論也是不可靠的。

 

  現在開始進入正題,假設我要通過轉錄組測序的方法比較擬南芥葉片在陽光下和黑暗中基因表達的差異,找到與光反應有關的基因,我希望自己得到的這個結論是可靠的,在所有的擬南芥中這個結論都成立。

  那么陽光下的擬南芥作為一個群體,黑暗中的擬南芥作為一個群體,現在開始設計實驗,可以直接模仿上面的實驗設計方式來進行實驗。

  

(1)采用窮盡的方式將所有的樣本都拿來做,這根本不可能。

 

  (2)對兩個群體進行隨機抽樣,每個群體抽樣數目至少>3個,理論上選擇更多會更好,但是也要考慮經費的限制,抽樣的樣本數目太少,直接不行。通過這種方式對每個群體>3個樣本進行轉錄組測序,然后篩選出差異基因,就算是這樣差異基因的后續驗證仍然是必須的。

 

  (3)每個群體選擇1個樣本測序,篩選差異基因,至少對于有參考基因組的擬南芥來說這樣其實是不行的,因為隨機選擇的1個樣本,不能代表這個群體的特征,由此篩選得到的差異基因并不是這兩個群體的差異基因。

 

  (4)那如果每個擬南芥群體選擇10個樣本提取RNA,然后等量混合得到2個樣本代表2個群體,這樣是對10個樣本的基因表達量取了平均值,但是這10個樣本其實也不能代表這個群體,而且混樣之后的平均值其實就是相當于取了一個樣本,由此得到的差異基因同樣不可信。

 

  (5)如果擬南芥黑暗和光照條件下,各取30個樣本,每10個樣本等量混合成一個樣本,那么黑暗和光照條件下每組仍然有3個混合樣本進行轉錄組測序,據此篩選差異表達基因,應該是很有代表性了,我個人感覺這種方法會比每組3個樣本的效果好一點。

  歡迎各位提出不同的看法和修改意見,讓我們一起努力推動高通量測序的應用。


大香蕉网站_大伊人香蕉在线_伊人久久大香蕉网_伊人成综合人网_大香焦