10月11日,華大基因子公司CompleteGenomics(CG)與個人基因組計劃項目(PGP)共同發(fā)布了過百人的實驗單體型定相全基因組測序結果,是目前最大的有全面實驗確認單體型的高覆蓋度全基因組組裝。
“絕大多數(shù)現(xiàn)有的基因組數(shù)據(jù)都沒有實驗獲得的單體型。”CG高級研究主任和項目主導人BrockPeters博士解釋道。“這是一組非常獨特的數(shù)據(jù),會通過開放數(shù)據(jù)發(fā)表方式免費提供給所有人使用?!?BR> PGP共招募了184人參與這個項目。每個人都同意將他們的身份、基因組及其表型數(shù)據(jù)免費公開獲取。血樣由PGP團隊收集并送到CG進行DNA分離、LFR(長片段閱讀技術)文庫生成和全基因組測序。目前已經(jīng)有114個基因組組裝序列可以使用,其余的預計將會在接下來的幾個月內(nèi)公布。
作為基因組數(shù)據(jù)發(fā)布的一部分,CG和PGP還在開放期刊GigaScience上發(fā)表了關于此數(shù)據(jù)的描述和全面的數(shù)據(jù)質(zhì)量分析。
CG首席科學家RadojeDrmanac博士表示,2011年免費提供了69組全基因組測序數(shù)據(jù),這組數(shù)據(jù)被迅速廣泛使用,并成為了遺傳學領域的基準和資源?!拔覀兒軜s幸能夠延續(xù)傳統(tǒng),發(fā)表這組實驗單體型全基因組組裝集。這代表了目前可獲取的最大最準確的人類單體型。”
據(jù)介紹,早在2012年CG就在Nature上發(fā)表過LFR技術,結果顯示基因組質(zhì)量和完整性都非常之高。這次GigaScience上發(fā)表的結果也再一次證明LFR的精準性和完整性。每個樣品都是以100X的覆蓋率進行測序,能夠高準確度地檢測出大多數(shù)變異,且98%以上的雜合變異位于接近1Mb的長組裝區(qū)域。平均來說,85%以上的單體型不含錯誤,剩下15%的大部分只含單個定相誤差。
標簽:單體型定相全基因組
相關資訊