隨著(zhù)人類(lèi)基因組工程的完成,對于低花費的測序技術(shù)的需求促進(jìn)了高通量二代測序技術(shù)的發(fā)展。這些新的測序平臺允許進(jìn)行高通量測序,具有廣泛的應用:
-
全基因組從頭測序或者重測序
-
目標序列重測序
-
轉錄組分析
-
微生物組研究
-
基因調控研究
NGS 序列
二代測序儀器有很多種組合,在通量、片段長(cháng)度、準確度、每一輪測序成本、每百萬(wàn)堿基對測序成本、初始成本、規格和技術(shù)方面存在存在差異。
從規格和初始成本的角度而言,二代測序儀器可輕松地分類(lèi)為更窄的范圍,也就是所謂的“臺式測序儀”和高通量?jì)x器。
臺式測序儀使得任何實(shí)驗室都可以像使用real-time PCR一樣,自己進(jìn)行測序。這些儀器可以和一些靶標序列富集技術(shù)相結合,用在一些臨床的應用中,其中:選定的靶標基因用于深度分析,以檢測稀有的突變,或者檢測多樣樣本中(比如癌癥樣本)中的突變。目前,這些儀器的通量在10 Mb到7.5 Gb之間,但是隨著(zhù)硬件,軟件和試劑的持續改善,通量也在穩步增加。
高通量測序儀非常適合于大量的,基因組范圍的研究,每次測序能測定600 Gb的序列。一些這樣的高通量和高精度的平臺,能測定的片段長(cháng)度相對較短,這對于高重復性的序列和未知基因組的從頭測序就可能成為問(wèn)題。與此相反,也有一些儀器能測序的片段較長(cháng)(達到2500 bp),但是其精度和測序能力(90 Mb)要低很多。還有一些測序能力位于兩者之間的儀器(~800 bp,700 Mb)。
因此,應用決定了哪一種儀器是最合適的。
有一種新的方法被稱(chēng)作“納米孔測序”。這種技術(shù)中,根據一個(gè)DNA鏈通過(guò)一個(gè)合成的或者蛋白納米孔道所引起的電流的改變,可以確定通過(guò)這個(gè)孔道的堿基。這理論上可以?xún)H用一步就測序一個(gè)完整的染色體,而不需要生成新的DNA鏈。
DNA測序
二代DNA測序的工作流程如下:
-
DNA樣本制備
-
文庫構建和驗證
-
文庫分子大規模平行克隆擴增
-
測序
二代測序DNA樣本的質(zhì)量控制
首先,評價(jià)基因組DNA的質(zhì)量是非常必要的(完整性和純度)。
凝膠電泳法
基因組DNA的完整性和大小,可以用常規或者脈沖場(chǎng)瓊脂糖凝膠電泳(PFGE)來(lái)檢測。常規的凝膠電泳的精確度不高,這是因為大的DNA分子在凝膠中移動(dòng)的時(shí)候,本質(zhì)上是用一種與尺寸無(wú)關(guān)的方式一起移動(dòng)的。但是,它仍然能夠提供完整性(大小范圍)和純度(RNA污染物在凝膠底部形成脫尾條帶)方面的有效信息。因此,它仍然是評價(jià)基因組DNA質(zhì)量的有效方法之一。
注:RNA污染會(huì )導致DNA濃度高估,并且抑制一些下游步驟。如果能肯定有RNA污染,則可使用去DNase的RNase I處理樣本。
分光光度測定法
分光光度儀在260 nm和280 nm處讀數的比例(
A260/
A280)可以用來(lái)估計DNA相對于一些吸收紫外光的雜質(zhì)(比如蛋白)的純度。純凈的DNA的
A260/
A280比例大約為1.7–1.9。
注:想要獲得精確的A260/A280值,需要在弱堿性的緩沖溶液中測定吸光度(比如, 10 mM Tris?Cl, pH 7.5)。
第二個(gè)步驟是測定基因組DNA的濃度。
分光光度法
DNA的濃度可以通過(guò)使用分光光度儀測定其在260 nm波長(cháng)的吸光度來(lái)確定。Nanodrop目前被廣泛使用,因為它需要的樣本量少(1 μl),并且使用方便(不需要比色皿)。為了確保結果的可靠性,讀數應該在0.1到1.0之間。
注:吸光度測定不能區別DNA和RNA。RNA污染物會(huì )導致DNA濃度高估。但是,純凈RNA的
A260/
A280比值在2.0左右,而純凈的DNA大約為1.8。因此,如果這個(gè)值為1.95,那么說(shuō)明樣本里面有RNA雜質(zhì)。
注:苯酚在270–275 nm的波長(cháng)范圍內有最大的吸光度,非常接近于DNA。因此苯酚能提高樣本在260 nm附近的吸光度,從而導致高估DNA的產(chǎn)量和純度。
熒光法
熒光法使用熒光染料測定DNA的濃度,具有特異性和靈敏性。Hoechst 33258結合到DNA上后,能增大458 nm波長(cháng)附近的發(fā)光強度,除此之外,也可以使用一些更加靈敏的熒光染料,比如PicoGreen染料?;赑icoGreen染料的實(shí)驗,比紫外吸光光度法靈敏10,000倍,而比使用Hoechst 33258染料的方法至少靈敏400倍。和紫外吸光光度法不同,PicoGreen實(shí)驗對雙鏈DNA的選擇性要遠高于RNA和單鏈DNA。
DNA標準品和樣本與熒光染料混合,并且使用熒光計檢測。將樣本的測定結果與標準品的測定結果相比較,以確定DNA的濃度。
Real-time PCR
可以使用real-time PCR 技術(shù)來(lái)測定DNA樣本的數量和質(zhì)量。多重PCR技術(shù)使用引物集在多個(gè)位點(diǎn)擴增不同大小的片段,是檢測DNA損傷和片段化的有效質(zhì)控手段。此類(lèi)技術(shù)試驗專(zhuān)門(mén)測定可經(jīng)PCR擴增,適于二代測序的DNA分子。上述提到的這些常規方法,通常不能測定的樣本中擴增得到的DNA的量,或者會(huì )高估了DNA的量。與它們相比,real-time PCR更加適用于預測DNA樣本是否適合于二代測序。
文庫制備
對于大多數商業(yè)化的二代測序平臺,使用諸如橋式擴增或者乳液PCR方法,對文庫中的DNA片段進(jìn)行克隆擴增,以產(chǎn)生足夠拷貝數量的測序模板非常必要。通過(guò)將平臺特異性的適配子與感興趣的DNA源(比如基因組DNA、雙鏈cDNA或者PCR擴增子等所產(chǎn)生的DNA片段)退火,得到片段文庫。適配子序列的存在,使得我們可以對文庫分子進(jìn)行選擇性的克隆擴增。因此,這種方法不需要像傳統的方法那樣,在微生物中間體中,對基因組片段進(jìn)行微生物克隆。另外,適配子序列中,還含有平臺特異性的測序引物的結合位點(diǎn)。
通常情況下,一個(gè)常規的DNA文庫構建方案包含四步:
-
片段化DNA
-
對DNA片段進(jìn)行末端修復
-
連接適配子序列(不適用于單分子測序)
-
對可選的文庫進(jìn)行擴增
目前有四種方法用于產(chǎn)生基因組DNA碎片:酶消化法、超聲波法、噴霧法和水動(dòng)力剪切法。這四種方法都可以用于文庫構建,但是每一種方法都有其優(yōu)點(diǎn)和局限性。核酸內切酶消化的方法快速并且容易,但是難以精確的控制片段長(cháng)度的分布。另外這種方法可能會(huì )對基因組DNA的呈遞引入偏倚。另外三種技術(shù)使用物理的方法將DNA的雙鏈打斷,這種斷裂是隨機的,因此能在文庫中對DNA進(jìn)行無(wú)偏的呈遞??梢允褂铆傊悄z電泳或者自動(dòng)化的DNA分析方法,對DNA片段的尺寸分布進(jìn)行控制。
片段化DNA之后,需要將DNA修復,產(chǎn)生5’磷酸化的平末端DNA,以便能夠和測序平臺特異性的適配子相連接。文庫構建的效率直接依賴(lài)于DNA末端修復的效率和準確性。
末端修復混合溶液將5’或者3’的粘性末端轉變成5’磷酸化的平末端DNA。在大多數情況下,末端修復通過(guò)T4 DNA聚合酶的5’—3’聚合酶活性和3’—5’的核酸外切酶活性完成。而T4多聚核苷酸激酶確保平末端的DNA片段5’端的磷酸化,以便進(jìn)行后續的適配子連接。
根據所使用的測序平臺,平末端DNA片段可以直接與適配子連接,或者需要在其片段的3’端增加一個(gè)單獨的突出的腺苷酸A,以便與平臺特異性適配子上突出的胸苷酸T相互配對。通常情況下,使用Klenow片段(具有最低的3’到5’端的核酸外切酶活性),或者使用其它具有末端轉移酶活性的聚合酶催化這一步驟。
T4 DNA連接酶將雙鏈的適配子與文庫片段修復過(guò)的末端相連,然后使用回收反應或者根據DNA的尺寸,選擇性去除文庫中未連接的適配子和適配子二聚體。大小篩選方法包括使用瓊脂糖凝膠電泳分離,使用磁珠或者使用高等的基于柱的純化方法。在連接過(guò)程中可能出現適配子的二聚體,它們會(huì )和與適配子連接的文庫片段共同擴增,從而降低測序平臺對真正文庫片段測序的能力并且降低測序的質(zhì)量,因此在測序之前,必須將它們從文庫中除去。一些測序平臺要求文庫片段的長(cháng)度分布在比較窄的范圍內,以得到最佳的結果,很多時(shí)候,這只能通過(guò)去除凝膠電泳上的相應的片段條帶實(shí)現。這種方法也可以用來(lái)去除適配子二聚體。
完成這一步驟之后,應該對DNA片段文庫的質(zhì)量進(jìn)行檢測,并進(jìn)行定量檢測。根據濃度和測序文庫的適配子設計,既可以直接稀釋溶液并用于測序,也可以對文庫進(jìn)行選擇性擴增。在文庫擴增階段,使用高保真的DNA聚合酶,合成完整的適配子序列,通過(guò)與PCR引物的重疊,用于后續的克隆擴增和與測序引物結合,或者提高DNA文庫的產(chǎn)量。為了得到最佳的文庫擴增結果,要求DNA聚合酶具有高保真性和最小的序列偏倚。
文庫質(zhì)量評估方法,參見(jiàn)NGS文庫質(zhì)控。
為了充分利用測序能力,不同樣本得到的測序文庫可以放在一起,在同一輪實(shí)驗中一同測序。通過(guò)將DNA片段與具有不同特征的適配子相連接,可以實(shí)現這一過(guò)程,即對于每一個(gè)樣本使用不同的短核苷酸序列作為適配子。
有一些其它的方法可以用于簡(jiǎn)化文庫構建。有一種新方法使用轉位酶/DNA的復合物進(jìn)行體外轉座,以便在同一個(gè)試管中同時(shí)將DNA片段化并標記。通過(guò)對所標記的DNA片段進(jìn)行有限次數的PCR擴增,可以構建完整的測序文庫,這節省了操作步驟和時(shí)間。但是,使用體外轉座構建的文庫,與傳統方法構建的文庫相比,具有更高的序列偏倚。
NGS文庫質(zhì)控
高質(zhì)量的文庫是成功進(jìn)行第二代測序的關(guān)鍵。文庫構建包含復雜的步驟,比如片段化樣本、修復末端、將末端腺苷?;?、連接適配子和擴增文庫。根據使用的平臺和文庫類(lèi)型,這些步驟也會(huì )發(fā)生變化。監控每一個(gè)步驟非常必要,包括在片段化樣本之后檢查片段的尺寸,以及連接適配子之后檢查片段的大小和濃度。文庫驗證過(guò)程中,需要分析文庫中片段的大小和數量,這是質(zhì)控的最后步驟。
評估文庫中片段的大小
瓊脂糖和PAGE凝膠電泳是傳統的檢測片段大小的方法,它們比較耗時(shí)。
最近,基于微流技術(shù)的電泳或者毛細管電泳越來(lái)越廣泛的用于檢測片段的大小和濃度。即買(mǎi)即用的芯片和膠盒省去了配置凝膠的步驟,使用方便。它們具有更高的通量,并且省去了很多的手動(dòng)操作時(shí)間。除此之外,它們的靈敏度更高(對于檢測的限制更少),并且能完全自動(dòng)化的獲取數據和輸出電子化的數據資料。這些儀器能同時(shí)檢測片段的大小和濃度。
-
測定文庫中的片段數量
-
分光光度法和熒光法
-
參見(jiàn)分光光度法和熒光法
電泳設備
如前所述,基于微流技術(shù)的電泳和毛細管電泳除了提供片段大小的信息之外,還提供了定量檢測數據。但是,電泳、分光光度法和熒光法的一個(gè)共同的局限性是,都只檢測總的核苷酸的濃度,而非與適配子連接的分子的濃度。
Real-time PCR
將適配子連接到文庫分子的兩端,使得可以在平行的PCR擴增步驟中擴增上百萬(wàn)個(gè)獨立的DNA分子(乳液PCR或者橋式PCR)。在有些儀器中,乳液PCR可以將一個(gè)DNA分子擴增到數百萬(wàn)個(gè)相同序列的拷貝,并全都結合在同一個(gè)珠子上。在另一種平臺上,橋式PCR能夠將一個(gè)DNA分子轉變成一個(gè)包含相同序列的多個(gè)拷貝的DNA簇。因此,兩端連接了適配子的擴增之后的分子,決定了乳液PCR中模板和珠子的比例以及橋式PCR中產(chǎn)生的最佳DNA簇。
對擴增后的文庫中的分子進(jìn)行精確的定量檢測,對于確保片段的質(zhì)量和高效的獲得數據是非常重要的。低估擴增文庫中的分子數量,會(huì )導致混雜的信號以及難以解析的數據;相反地,高估分子的數量會(huì )降低結合模板的珠子或者DNA簇的產(chǎn)量,并且沒(méi)有充分利用測序能力。
Real-time PCR能夠特異性的定量檢測兩端結合有適配子的DNA分子,因此能夠對擴增文庫中的分子進(jìn)行高度精確的定量檢測。Real-time PCR的靈敏性非常高,可以對濃度非常低的文庫分子進(jìn)行定量檢測,即使其濃度低于傳統方法可以檢測的閾值。因此,這種方法能盡量減少對文庫的擴增,降低可能的偏倚。
用于決對定量檢測的數字PCR
數字PCR能夠對二代測序的文庫進(jìn)行絕對定量檢測,而不需要標準品。這個(gè)技術(shù)對文庫進(jìn)行有限的稀釋?zhuān)⑦M(jìn)行大量獨立的PCR反應;因此,大多數反應沒(méi)有模板,得到陰性的結果。一個(gè)單獨的陽(yáng)性PCR反應統計為一個(gè)單獨的模板分子。通過(guò)統計所有陽(yáng)性PCR的數量,能夠確定文庫分子的絕對數目。數字PCR的主要優(yōu)點(diǎn)在于:
-
單分子的敏感性
-
與PCR擴增的效率無(wú)關(guān),因為成功的擴增被統計為一個(gè)分子,而與最終產(chǎn)物的數量無(wú)關(guān)
但是,這種技術(shù)需要特殊的儀器,并且花費較高,因此尚未廣泛用于文庫定量檢測。
宏基因組學(xué)Metagenomics
DNA測序的應用領(lǐng)域之一是宏基因組領(lǐng)域,即從環(huán)境樣本中直接回收的遺傳物質(zhì)的非培養研究。宏基因組學(xué)是指一個(gè)環(huán)境樣本中所包含的所有微生物基因組的功能和序列分析。這個(gè)詞匯起源于“meta”(在這里指對于基因多樣性的系統性理解)和“genomics”(對一個(gè)物種的遺傳物質(zhì)的綜合分析)。
宏基因組不是一個(gè)新的學(xué)科,但由于二代測序技術(shù)所帶了的諸多可能性,宏基因組的應用經(jīng)歷了巨大的提升。
據估計,微生物中僅有1%左右是可培養的,因此宏基因組學(xué)的研究能極大的拓展我們對于環(huán)境的認識。
很多年以來(lái),“宏基因組”這個(gè)詞匯僅與環(huán)境樣本的分析有關(guān),比如,分析從極端的生存環(huán)境下分離得到的DNA,以便發(fā)現能用于工業(yè)的新的生物催化劑。但是,通量的極大提高,以及所花費的費用和時(shí)間的降低,將這個(gè)領(lǐng)域的應用擴展到了很多其他方面。
宏基因組學(xué)可分成幾個(gè)領(lǐng)域,包括:
-
病理基因組學(xué)/感染基因組學(xué)
-
微生物組分析
-
環(huán)境宏基因組學(xué)
注:這并不是全面的分類(lèi),研究者可以選擇其他的分類(lèi)標準。
病理基因組學(xué)/感染基因組學(xué)和疾病的診斷相關(guān),用于確定有疾病癥狀的患者體內未知的病原體。這通常是極具挑戰性的過(guò)程,因為微生物的數量可能非常少(每毫升血液中大概有1–10個(gè)細胞)。
與之相反,微生物組分析則涉及到數量巨大的微生物,比如口腔或者直腸拭子中的微生物。此時(shí),我們的目標是分析這些菌群的組成??紤]到人體僅包含1%的人類(lèi)細胞而其它99%都是微生物細胞,微生物組分析在未來(lái)的診斷技術(shù)中有潛在的巨大應用。更多細節,請見(jiàn)人類(lèi)微生物組工程(
www.hmpdacc.org)。
環(huán)境宏基因組學(xué)的目標除了包括傳統的尋找新的生物催化劑之外,還包括研究和鑒定棲息環(huán)境。
從理論上來(lái)講,環(huán)境宏基因組學(xué)有兩種不同的研究方法:
-
全基因組分析:對所有存在的DNA進(jìn)行測序
-
16S分析:僅對16S rRNA DNA進(jìn)行測序
第一種方法只是簡(jiǎn)單的對樣本中存在的所有DNA進(jìn)行測序。這可以完整地描繪所有出現過(guò)的微生物,并且可能發(fā)現新的酶或者酶家族,以及抗生素的抗性。另一方面,這種方法需要較高的測序能力,因而,相對于第二種方法,其通量較低并且花費較高。與此相關(guān)的進(jìn)一步的方法正在研發(fā)。
在宏基因組的應用中,通常需要能提供較高的片段長(cháng)度的測序儀,這是因為通常沒(méi)有參考序列可供參照。對于16S rRNA分析而言,測序儀的讀長(cháng)需要覆蓋整個(gè)區域(另請參照二代測序儀)。
RNA 測序
RNA測序(RNA-seq)是使用深度測序技術(shù)來(lái)研究生物體轉錄組的方法。此方法在構建合適的文庫之后,對樣本中的RNA直接測序,得到豐富的數據集以進(jìn)行分析。這項技術(shù)的高靈敏度和高分辨率使得它成為研究整個(gè)轉錄情形的有價(jià)值的工具。數據的定量性以及測序技術(shù)的高動(dòng)態(tài)范圍使得其對基因表達的分析具有高度的靈敏性。數據的單個(gè)堿基的分辨率提供了關(guān)于單核苷酸多態(tài)性(SNP)、選擇性剪接、外顯子/內含子邊界、非翻譯區及其它元件的詳細信息。除此之外,RNA-seq不需要預先知道參考序列,這使得從頭的轉錄組分析和新的變異體和突變體的檢測成為可能。RNA-seq是研究轉錄組的強大、革命性方法,但是使用這種技術(shù)需要非常仔細以獲得最高質(zhì)量的數據。
RNA-seq中需要考慮的因素
第一個(gè)需要考慮的因素是樣本富集??俁NA通常只包含比例很少的編碼RNA或者功能RNA;樣本中大部分RNA是核糖體RNA(rRNA:大約占到了總RNA的80–90%)和較少的轉運RNA (tRNA)。為了避免將80–90%的測序資源用在重復的rRNA序列上,通常在測序之前,需要從樣本中去除rRNA。這通??梢酝ㄟ^(guò)特定的消耗rRNA實(shí)現,也可以通過(guò)使用寡聚胸腺嘧啶富集技術(shù)選擇性富集Poly A實(shí)現。消耗rRNA的方法可以同時(shí)保留編碼RNA和非編碼RNA(一項非常重要的研究?jì)热荩┑男畔?,而Poly A富集則僅保留了編碼mRNA。Poly A富集可能會(huì )丟掉特定的RNA和具有高轉換率的RNA。
有一些其他的方法可以避免rRNA的影響,比如選擇性降解大量轉錄物,或者不擴增rRNA的擴增技術(shù)。但是這些方法不像rRNA消耗或者poly A富集那么常見(jiàn),并且可能扭曲轉錄物表征的正常水平。
另外一個(gè)需要考慮的因素是要研究的RNA的大小。RNA轉錄物跨越比較大的大小范圍;與常規的RNA分析相比,關(guān)注小RNA的實(shí)驗(比如microRNA或者長(cháng)度范圍在15–35bp的RNA),需要特別的純化和文庫構建方案。大多數其他大小的RNA片段可以同時(shí)測序(RNA測序的常用步驟之一是將RNA分割成普通長(cháng)度,比如200–300 nt長(cháng)度的片段)。
RNA-seq測序操作步驟
一旦確定了移除核糖體的方法和要研究的片段大小,就可以將RNA構建成一個(gè)文庫。對于大多數測序儀器而言,這包括首先將RNA打碎成片段,其次通過(guò)逆轉錄方法構建雙鏈cDNA。在后續的文庫構建過(guò)程中,這些雙鏈的cDNA被當作普通的基因組DNA來(lái)對待。如果想要保留RNA的直接信息(鏈型),必須使用修改過(guò)的文庫構建方案,比如將mRNA與連接適配子直接相連,或者標記cDNA的一條鏈以便在測序之前移除。
在進(jìn)行測序計劃過(guò)程中,需要考慮三個(gè)主要的因:測序深度、讀長(cháng)和是否使用雙端測序數據。測序深度可以提供RNA轉錄物的豐度信息,并且較大的測序深度使得對于稀有轉錄物的檢測更加靈敏。讀長(cháng)也很重要,因為較長(cháng)的讀段對于檢測剪接事件更加靈敏(內含子–外顯子邊界,外顯子–外顯子邊界)。雙端測序數據能提供更多關(guān)于轉錄物結構的信息,特別是相互分隔的較遠的外顯子。一般而言,從頭分析以及尋找新的結構變異要求較高的測序深度和讀長(cháng),并且會(huì )得益于雙端測序數據。典型的測序應用包含100–200 M片段,長(cháng)度為2 x 50–100 bp。與之相反,表達分析得益于較高的測序深度,但是讀長(cháng)和雙端測序數據則對結果的改善作用較小。這方面應用的一個(gè)典型實(shí)驗包含10–30 M片段,讀長(cháng)為1 x 35–100 bp。
基因調控研究
二代測序技術(shù)也是研究基因調控網(wǎng)絡(luò )的強有力的工具。比如ChIP-seq技術(shù)(染色質(zhì)免疫共沉淀測序)可以用于分析蛋白-DNA的相互作用。二代測序技術(shù)也能用于確定基因組的全局甲基化模式。
ChIP-Seq
染色質(zhì)免疫共沉淀技術(shù)(ChIP)是用于研究轉錄因子和修飾組蛋白基因調控機制的強大、多功能方法。這種技術(shù)用于確定活細胞中染色質(zhì)上那些與轉錄因子、共調節因子、修飾組氨酸、染色質(zhì)重塑蛋白或者其它的核因子相互結合的區域。
整個(gè)操作過(guò)程非常耗時(shí),包含了很多步驟和變量,每一個(gè)步驟都需要研究者根據自己的模型體系進(jìn)行優(yōu)化。將細胞與甲醛交聯(lián)之后,將染色質(zhì)中共價(jià)相連的基因組DNA和核因子復合物分離出來(lái),然后經(jīng)過(guò)超聲波處理,剪切成可以處理的大小??贵w與目標核蛋白特異性免疫共沉淀時(shí),也將與這些核蛋白特異性結合的基因組DNA也沉淀下來(lái)了。去除化學(xué)交聯(lián)并經(jīng)過(guò)核酸純化處理的這些DNA可用于測序、基于微陣列的基因組雜交或者PCR擴增。ChIP與二代測序技術(shù)聯(lián)用(ChIP-Seq)可研究與感興趣蛋白相結合的位點(diǎn)在基因組的范圍內的分布。與微陣列分析(ChIP-Chip)相比,ChIP-Seq技術(shù)提供了較高的空間分辨率,動(dòng)態(tài)范圍和基因組覆蓋度,因而它對于DNA結合位點(diǎn)的檢測具有超級的靈敏度和準確度。另外,ChIP-Seq技術(shù)通常只要很少的起始樣本輸入量,并且不需要雜交探針,具有較高的靈活性,任何測序過(guò)基因組的物種都可以使用這種方法進(jìn)行研究。
高效的ChIP-Seq過(guò)程需要優(yōu)化幾個(gè)關(guān)鍵的變量。首先,甲醛交聯(lián)的溫度和時(shí)間需要優(yōu)化。如果蛋白和DNA交聯(lián)的過(guò)于緊密,則在測序之前無(wú)法將染色質(zhì)有效地打碎成片段,并且去除交聯(lián)也會(huì )遇到困難。通常情況下,最好以在37°C下與1%的甲醛共培育10分鐘起始,然后在此基礎上進(jìn)一步優(yōu)化。
有幾種不同的方法可以將染色質(zhì)打成碎片,比如超聲波和酶消化(比如使用微球菌核酸酶)。如果使用二代測序技術(shù)來(lái)分析免疫共沉淀的DNA,染色質(zhì)碎片的大小應在大約100–300核苷酸長(cháng)度范圍內,并且每一個(gè)測試系統中(細胞的類(lèi)型、組織的類(lèi)型),將染色質(zhì)打碎成片段的參數也需要嚴格優(yōu)化。
ChIP實(shí)驗的成功與否取決于所使用的抗體的量和特異性。最好選用能從多家抗體廠(chǎng)商處獲得的,經(jīng)過(guò)ChIP實(shí)驗驗證的抗體。為了確定抗體能特異性地沉淀目標蛋白,可以使用蛋白印跡技術(shù)檢測核提取物。如果在結果中,僅能觀(guān)察到一條特定大小的條帶,則可認為該抗體是特異性的。使用選定的抗體進(jìn)行免疫共沉淀,然后通過(guò)蛋白印跡分析技術(shù)確定抗體是否能特異性的沉淀目標蛋白。如果這樣的實(shí)驗失敗了,那么還可以將選定的抗體與培養的細胞進(jìn)行免疫熒光試驗。如果僅有細胞核顯色,則說(shuō)明抗體至少能特異性的識別一種位于細胞核內并可結合到DNA上面的蛋白。
根據目標蛋白的豐度,經(jīng)過(guò)驗證的抗體的量以及用于免疫共沉淀的染色質(zhì)的量必須經(jīng)過(guò)優(yōu)化,以便獲得足夠的DNA進(jìn)行測序。對于識別組蛋白和組蛋白修飾的抗體而言,每一次免疫共沉淀反應大概需要100,000到1百萬(wàn)個(gè)細胞中的染色質(zhì)。如果轉錄因子與DNA結合的動(dòng)態(tài)性較高或者與組蛋白相比,僅在有限的基因組位點(diǎn)上結合,那么實(shí)驗就需要更多的染色質(zhì)。為避免多余的抗體與非目標蛋白和染色質(zhì)的非特異性結合,同時(shí)保證能沉淀足夠多的目標蛋白,每一次免疫共沉淀反應使用的抗體的數量也非常重要。通常而言,1–10 μg的抗體即可得到合理的結果。
可以用對照反應來(lái)比對ChIP反應的特異性。在平行的ChIP反應中,使用同樣數量的染色質(zhì),可以使用同型的對照抗體或者沒(méi)有抗體的珠子用來(lái)比照抗體和珠子與蛋白和染色質(zhì)的非特異性的結合。通過(guò)比較陰性對照樣本和ChIP樣本中在特定位點(diǎn)沉淀的DNA的量,能計算這個(gè)位點(diǎn)的富集因子。但是,在這種免疫共沉淀對照實(shí)驗中得到的沉淀物的量通常很少,不足以提供足夠的片段進(jìn)行二代測序。因此,ChIP-Seq實(shí)驗通常使用輸入對照樣本作比對。在這種情況下,每個(gè)ChIP反應中通常有1%交聯(lián)并且打碎的染色質(zhì)被用來(lái)去除交聯(lián)并且與沉淀的樣本一同純化并進(jìn)行后續的深度測序。這使得我們可以比對由于打碎染色質(zhì)所引起的偏移,這些偏移表現在染色質(zhì)的局部結構,DNA擴增,測序,拷貝數量的變化,以及測定基因組區域的能力。
在沉淀的DNA碎片去除交聯(lián)和純化之后,建議使用real-time PCR技術(shù)確認與目標蛋白結合的基因組位點(diǎn)的回收和富集效果。通過(guò)比較輸入對照組與ChIP樣本的qPCR結果,可以計算出輸入物質(zhì)的回收比例(ΔC
T方法)。如果使用了同型對照抗體樣本(或者空白珠子的對照樣本),則可以與ChIP樣本相互比對,以進(jìn)一步對qPCR技術(shù)檢測到的位點(diǎn)的富集進(jìn)行定量分析(ΔΔC
T方法)。
為了能穩定地構建二代測序文庫,至少需要10 ng的ChIP DNA。因此,必須仔細的定量免疫共沉淀得到的DNA。但由于每一次ChIP反應得到的總的DNA量通常很低,因此需要比吸光光度定量法更加靈敏的方法。熒光測定方法(比如使用PicoGreen)在定量ChIP DNA時(shí)具有較高的靈敏度和動(dòng)態(tài)范圍。如果仍然沒(méi)有得到足夠的DNA,可將從幾次ChIP反應所得到的所有物質(zhì)可以放到一起,用來(lái)構建一個(gè)測序文庫。
由于用于構建文庫的起始材料的數量非常低,因此在片段與測序適配子連接之后對其進(jìn)行擴增很有必要。這通常需要16–18輪PCR。太多輪的擴增會(huì )降低文庫的復雜性,因此需要確定得到足夠材料所需的最少PCR輪數。
在確定文庫的品質(zhì)(使用一些商業(yè)化的儀器,比如QIAxcel或者Bioanalyzer)和濃度(比如使用qPCR技術(shù))之后,需要使用乳液PCR(emulsion PCR, Ion Torrent)或者橋式PCR技術(shù)(bridge PCR, illumina)對文庫進(jìn)行進(jìn)一步的擴增,然后才能用于最后的深度測序。通常而言,較短的25–36核苷酸長(cháng)度的單個(gè)讀段對于定位目標蛋白在基因組上的結合位點(diǎn)就已經(jīng)足夠了。但是,為了能夠定位更困難的區域(比如重復區域),也可以使用雙末端測序方法(2 x 25的核苷酸長(cháng)度或者2 x 36的核苷酸長(cháng)度)。所需要的總的測序讀段取決于與因子結合的基因組位點(diǎn)的數目。對于轉錄因子而言,它們僅僅和基因組上有限的幾個(gè)位點(diǎn)相結合,5百萬(wàn)–1千2百萬(wàn)讀段可能足夠了。而如果要分析修飾后的組蛋白,由于它們結合在基因組更廣泛的區域上,因此需要更多的測序讀段。通過(guò)增加測序讀段的數量,能夠改進(jìn)分析的靈敏性,從而確定親和力更弱的位點(diǎn)。一些免費的軟件(比如MACS)能用來(lái)確定比統計水平具有更多讀段的基因組區域(與局部本底相比或者與單獨測序的輸入對照樣本相比)。對于這樣的數據,上述的軟件能夠產(chǎn)生一個(gè)列表,顯示那些顯著(zhù)增加的目標蛋白的結合位點(diǎn)。
細胞收集,超聲波參數和ChIP富集得到的基因組DNA的real-time PCR分析的優(yōu)化都需要通過(guò)實(shí)驗來(lái)確定。
基于序列的甲基化分析請參考關(guān)于表觀(guān)遺傳學(xué)的試驗方案和應用指南部分。
參考文獻
Mortazavi, A., Williams, B.A., McCue, K., et al. (2008) Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat. Methods.
5, 621.
Marioni, J.C, Mason, C.E., Mane,S.M., et al. (2008) RNA-seq: An assessment of technical reproducibility and comparison with gene expression arrays Genome Res.
18, 1509.
Pickrell, J.K., et al. (2010) Understanding mechanisms underlying human gene expression variation with RNA sequencing. Nature.
464, 768.
The ENCODE Consortium. (2001) Standards, Guidelines and Best Practices for RNA-Seq.V1.0. (June 2011).
Wang, Z., Gerstein, M., Snyder, M. (2009) RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet.
10, 57.