目前研究人員對(duì)于突變數(shù)據(jù)的驗(yàn)證一般采用Sequenom質(zhì)譜、Sanger測(cè)序法。雖然這兩種方法的準(zhǔn)確性很高,但是Sequenom方法對(duì)未知位點(diǎn)突變無(wú)法進(jìn)行檢測(cè),且很多分析仍然需要借助人工方法,而Sanger測(cè)序法通量低、花費(fèi)大且同樣存在人工誤差的問(wèn)題。此外采用多種測(cè)序平臺(tái)進(jìn)行交叉驗(yàn)證也大大降低了效率,且產(chǎn)生新的突變類(lèi)型導(dǎo)致更加復(fù)雜的分析。所以,是利用已有的測(cè)序平臺(tái)直接產(chǎn)生高質(zhì)量的測(cè)序數(shù)據(jù),zui大程度避免其他方法的交叉驗(yàn)證。“基于這些考慮,我們對(duì)PacBio給予了厚望。隨著項(xiàng)目進(jìn)展,現(xiàn)在它已經(jīng)成為我們的標(biāo)準(zhǔn)工具。”
我們從千人基因組計(jì)劃產(chǎn)生的SNP數(shù)據(jù)中挑選了98個(gè)已經(jīng)用其他方法驗(yàn)證過(guò)的難測(cè)SNP位點(diǎn),盡管之前沒(méi)人知道為什么這些位點(diǎn)那么難測(cè),“但事實(shí)就是,這些位點(diǎn)在一般其他的測(cè)序儀上測(cè)的話總是一如既往地出錯(cuò)”,所以這些位點(diǎn)就成了測(cè)試測(cè)序儀性能的標(biāo)準(zhǔn)。我們分別利用PacBio平臺(tái)和Illumina MiSeq平臺(tái)進(jìn)行對(duì)比驗(yàn)證,結(jié)果發(fā)現(xiàn)PacBio數(shù)據(jù)有著更好的準(zhǔn)確性和假陽(yáng)性檢出率,相對(duì)而言是一種更為有效的驗(yàn)證工具。
注: 詳情請(qǐng)見(jiàn)參考文獻(xiàn)6、參考影像7/10、生物通往期文章1/2/3/10。
Matthew Meyerson:
Broad研究院正努力把PacBio做成基因分型、變異驗(yàn)證與重復(fù)實(shí)驗(yàn)的平臺(tái),并專門(mén)為PacBio開(kāi)發(fā)了補(bǔ)充算法,用于糾正其隨機(jī)誤差,并將新算法包含在GATK基因組分析工具包內(nèi)。
“PacBio單分子測(cè)序技術(shù)能對(duì)基因組中的低頻變異進(jìn)行解讀,且能夠有效彌補(bǔ)Sequenom和Sanger方法的缺陷,可以尋找除已知位點(diǎn)以外的其他漏檢稀有突變。”
我們利用PacBio平臺(tái)對(duì)92株成神經(jīng)管細(xì)胞瘤(Medulloblastoma)原代細(xì)胞株的全外顯子組的Illumina測(cè)序結(jié)果進(jìn)行了體細(xì)胞變異位點(diǎn)的驗(yàn)證分析。不僅驗(yàn)證了所有發(fā)現(xiàn)的SNP,連(在CTDNEP1基因中)短到2 bp的微缺失(Indel)變異也得到了很好的區(qū)分和識(shí)別。我們zui終確認(rèn)了12個(gè)與成神經(jīng)管細(xì)胞瘤發(fā)生相關(guān)的變異,并發(fā)現(xiàn)了一個(gè)以前從未發(fā)現(xiàn)的突變,為這種疾病的基礎(chǔ)研究和臨床診斷提供了新的分子標(biāo)記物。