FDA新動(dòng)作,推進(jìn)NGS流程質(zhì)量標(biāo)準(zhǔn)化

作者: 2016年03月21日 來(lái)源:互聯(lián)網(wǎng) 瀏覽量:
字號(hào):T | T
FDA日前通過(guò)在線平臺(tái)precisionFDA舉辦了“ConsistencyChallenge”活動(dòng),目的是測(cè)試遺傳研究中最常用軟件工具的精確度和可重復(fù)性。在白宮舉行的國(guó)家精準(zhǔn)醫(yī)療計(jì)劃峰會(huì)上,奧巴馬總統(tǒng)的科學(xué)技術(shù)高級(jí)顧問(wèn)JohnH

  FDA日前通過(guò)在線平臺(tái)precisionFDA舉辦了“ConsistencyChallenge”活動(dòng),目的是測(cè)試遺傳研究中最常用軟件工具的精確度和可重復(fù)性。在白宮舉行的國(guó)家精準(zhǔn)醫(yī)療計(jì)劃峰會(huì)上,奧巴馬總統(tǒng)的科學(xué)技術(shù)高級(jí)顧問(wèn)JohnHoldren宣布了這項(xiàng)活動(dòng)。
  
  precisionFDA是一個(gè)分析軟件的測(cè)試平臺(tái),測(cè)試那些將原始DNA序列數(shù)據(jù)處理成有用信息的分析軟件。該平臺(tái)在去年12月推出,包含了用戶可用來(lái)重復(fù)的基因組數(shù)據(jù)的黃金標(biāo)準(zhǔn)的集合;用于大量測(cè)序數(shù)據(jù)分析流程運(yùn)行的計(jì)算環(huán)境;以及與廣大的科學(xué)界人士共享分析流程和結(jié)果的版塊。雖然這個(gè)平臺(tái)是由FDA管理,但是平臺(tái)的開(kāi)發(fā)工作是外包給私人公司DNAnexus的。
  
  “ConsistencyChanllenge”是preicisonFDA發(fā)起的第一個(gè)倡議,用于測(cè)試基因組學(xué)中一些主流算法流程。該活動(dòng)主要關(guān)注序列比對(duì)(mapping)和變異檢測(cè)(variantcalling)兩個(gè)方面,過(guò)程主要包括測(cè)序得到短DNAreads,比對(duì)到人類(lèi)基因組參考序列上,檢測(cè)與參考序列不同的數(shù)據(jù)對(duì)應(yīng)的區(qū)域。
  
  這是在幾乎所有人類(lèi)基因研究中最基礎(chǔ)和最首要的分析。最終結(jié)果是一個(gè)VCF(VariantCallFormat)格式的文件,該文件中包含了個(gè)人基因組中檢測(cè)到的所有基因變異。實(shí)際上,由于技術(shù)局限性,這些文件中包含的往往只有小型的DNA變異,稱作SNP或者indel,不含有基因組的大型重組。
  
  用于序列比對(duì)和變異檢測(cè)的標(biāo)準(zhǔn)工具是該領(lǐng)域使用最廣泛的軟件,包括BWA、Bowtie、GenomeAnalysisToolkit。
  
  然而很難測(cè)試出哪一種分析軟件是最有效的。大多數(shù)的軟件是開(kāi)源的,而且具有很多不同版本。生物信息學(xué)家也會(huì)將這些工具混合匹配起來(lái)創(chuàng)建新的流程,所以檢測(cè)結(jié)果的不一致可能是比對(duì)工具或變異檢測(cè)軟件的問(wèn)題,又或者兩者都有。另外還存在著更多不太知名的工具能夠完成同樣的分析任務(wù)。
  
  為了評(píng)估不同分析流程的性能,“ConsistencyChanllenge”將為所有參與者提供相同的原始數(shù)據(jù)進(jìn)行分析。這些數(shù)據(jù)來(lái)自已經(jīng)研究的非常清楚地人類(lèi)細(xì)胞系NA12878的測(cè)序結(jié)果。分析的結(jié)果將與“瓶中基因組(GenomeinaBottle)”項(xiàng)目提供的金標(biāo)準(zhǔn)VCF文件進(jìn)行比較,該項(xiàng)目已經(jīng)詳盡的研究了NA12878,以用于各種類(lèi)型的質(zhì)控。
  
  多管齊下,對(duì)分析流程進(jìn)行評(píng)估
  
  不同于那些試圖梳理基因變異在健康和生物方面影響的高級(jí)軟件,生成VCF文件的流程產(chǎn)生出的結(jié)果清晰,能夠?qū)ζ溥M(jìn)行非??陀^的評(píng)估。DNAnexus公司戰(zhàn)略發(fā)展部總監(jiān)GeorgeAsimenos說(shuō),“這不是一個(gè)非常復(fù)雜的挑戰(zhàn),通過(guò)處理大家熟悉的數(shù)據(jù),目的是為了促進(jìn)人們參與到precisionFDA中,讓更多人知道這個(gè)平臺(tái)?!?BR>  
  雖然這項(xiàng)倡議很基礎(chǔ),但是挑戰(zhàn)在于如何對(duì)結(jié)果進(jìn)行分析。
  
  對(duì)VCF文件進(jìn)行比較和評(píng)分不是一項(xiàng)簡(jiǎn)單的任務(wù),因?yàn)榭茖W(xué)家們描述與“正?!比祟?lèi)基因組序列的偏差的方式往往是模糊的。例如,一些變異是小型的缺失,即與參考序列比對(duì)時(shí)缺少了一個(gè)堿基。但是如果缺失發(fā)生在一串相同的堿基中(例如GAAAAT這樣的序列),那么就無(wú)法回答“缺失的是哪個(gè)A?”
  
  這也就是說(shuō)即使兩個(gè)VCF文件都描述了同樣的變異,但是也可能檢測(cè)出的是參考基因組上兩個(gè)不同位置的缺失。簡(jiǎn)單的軟件程序常常會(huì)犯錯(cuò)誤,認(rèn)為這樣的VCF文件其中之一或者兩個(gè)都是錯(cuò)誤的。
  
  Asimenos認(rèn)為,“在早期,我們認(rèn)為最佳方法應(yīng)該是,讓相關(guān)組織告訴我們比較VCF文件的最佳方法,而不是FDA強(qiáng)制實(shí)行某種特定的方法?!备鶕?jù)GenomeinaBottle和全球基因組與健康聯(lián)盟(GA4GH)等組織的指導(dǎo)意見(jiàn),F(xiàn)DA選擇了一款由RealTimeGenomics公司設(shè)計(jì)的軟件vcfeval,該工具已經(jīng)發(fā)表并且開(kāi)源,可作為對(duì)流程打分的一個(gè)備選。
  
  Vcfeval用一種上下文感知的方式讀取VCF文件,當(dāng)檢測(cè)到兩個(gè)變異為同義突變時(shí)會(huì)將其輸出。Asimenos說(shuō),“vcfeval分析需要完整的參考基因組序列來(lái)進(jìn)行比較,事實(shí)上,這款軟件能夠檢測(cè)到很多不易察覺(jué)的信息?!币坏┐_定了提交的VCF文件與GenomeinaBottle提供的金標(biāo)準(zhǔn)文件存在的不同變異數(shù)量,vcfeval程序?qū)?duì)流程的準(zhǔn)確性進(jìn)行打分。它將考慮陽(yáng)性變異檢測(cè)、假陽(yáng)性、假陰性以及更加細(xì)微的統(tǒng)計(jì)學(xué)概念,例如陽(yáng)性預(yù)測(cè)率。
  
  “ConsistencyChanllenge”并不是一項(xiàng)單一的、絕對(duì)的精確度量挑戰(zhàn)。Asimenos說(shuō),“FDA非常聰明地在挑戰(zhàn)中引入了一個(gè)重復(fù)性版塊?!眳⑴c者將分別對(duì)兩組不同的NA12878測(cè)序數(shù)據(jù)進(jìn)行分析,一共進(jìn)行三次。這兩組測(cè)序數(shù)據(jù)都是來(lái)自IlluminaHiseqXTen測(cè)序系統(tǒng),產(chǎn)自兩臺(tái)不同的測(cè)序儀。
  
  通過(guò)兩組不同的數(shù)據(jù)對(duì)分析流程的性能進(jìn)行比較,F(xiàn)DA希望能夠更好地展示,實(shí)驗(yàn)條件的不同,例如測(cè)序儀操作人員和測(cè)序環(huán)境,會(huì)影響到最終的結(jié)果。該挑戰(zhàn)同樣也會(huì)評(píng)估當(dāng)同一組數(shù)據(jù)進(jìn)行兩次運(yùn)算產(chǎn)生兩個(gè)VCF文件時(shí)會(huì)發(fā)生什么。因?yàn)闇y(cè)序儀是同時(shí)進(jìn)行大量的平行測(cè)序,沒(méi)有哪兩個(gè)測(cè)序過(guò)程是完全相同的,對(duì)遺傳學(xué)研究組織來(lái)說(shuō),最大的問(wèn)題就是這樣會(huì)對(duì)整個(gè)分析造成多大的影響。
  
  基因研究的真實(shí)性取決于準(zhǔn)確檢測(cè)變異的能力。通過(guò)重復(fù)實(shí)驗(yàn),對(duì)不同測(cè)序儀產(chǎn)出的數(shù)據(jù)進(jìn)行分析,同時(shí)與絕對(duì)標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行比較,對(duì)分析流程的性能進(jìn)行測(cè)試,precisionFDA將多管齊下地進(jìn)行分析流程的評(píng)估。
  
  齊心協(xié)力,來(lái)自不同組織的支持
  
  越來(lái)越多的人要求FDA研究和批準(zhǔn)用于病人診斷和治療的基因檢測(cè),而為了能夠有效地進(jìn)行研究,F(xiàn)DA需要弄清楚分析這些基因檢測(cè)的工具是否精準(zhǔn)并且可重復(fù)。
  
  “ConsistencyChallenge”并不是僅限于FDA內(nèi)部使用。如同F(xiàn)DA早期建立的網(wǎng)站平臺(tái)openFDA一樣,precisionFDA旨在廣泛分享知識(shí),讓全球的科研人員受益。
  
  雖然“ConsistencyChallenge”是公開(kāi)的,但precisionFDA云平臺(tái)可以私下使用。即使是FDA也只能查看和評(píng)估用戶選擇了公開(kāi)可見(jiàn)的流程。參與者可以在本地計(jì)算環(huán)境中生成VCF文件然后上傳,同時(shí)對(duì)流程中使用的工具進(jìn)行說(shuō)明;或者也可以在precisionFDA云平臺(tái)上運(yùn)行整個(gè)分析流程,公開(kāi)使用的所有軟件。
  
  無(wú)論哪種方法,研究團(tuán)體都將看到不同分析流程間的相互較量。這不僅僅能讓遺傳學(xué)家了解哪個(gè)開(kāi)源工具更有效,更是讓那些各具優(yōu)勢(shì)但是不為人知的分析工具浮出水面。Asimenos說(shuō),“我希望這次活動(dòng)將為那些正在開(kāi)發(fā)新方法但是缺乏平臺(tái)展示的研究人員提供一個(gè)好機(jī)會(huì)?!?BR>  
  這種對(duì)遺傳學(xué)基礎(chǔ)工具的全面評(píng)估是我們急需的,而且大量的利益相關(guān)方已經(jīng)加強(qiáng)了對(duì)這方面的支持。其中有的是公立組織,有的是非盈利組織,例如GenomeinaBottle和GA4GH。其他還包括一些盈利性公司,例如DNAnexus、RealTimeGenomics、HumanLongevity(提供了一組NA12878測(cè)序數(shù)據(jù)),或者像Garvan研究所這樣的大型學(xué)術(shù)中心,Garvan研究所也提供了NA12878測(cè)序數(shù)據(jù)。
  
  Asimenos列舉了其他六個(gè)對(duì)precisionFDA項(xiàng)目做出貢獻(xiàn)的組織機(jī)構(gòu),其中包括Illumina、23andMe以及Broad研究院等該領(lǐng)域的巨頭。他說(shuō),“這是大家共同努力的結(jié)果,我非常感激這些人能夠貢獻(xiàn)出他們的數(shù)據(jù)并且加入了這個(gè)網(wǎng)站?!?BR>  
  “ConsistencyChallenge”需要人們廣泛的參與來(lái)充分發(fā)揮這個(gè)項(xiàng)目的意義。競(jìng)賽將會(huì)于4月25日向公眾開(kāi)放,任何想來(lái)參加挑戰(zhàn)的人都可以報(bào)名,這項(xiàng)競(jìng)賽將成為precisonFDA的第一個(gè)挑戰(zhàn)比賽,旨在評(píng)估用于人類(lèi)基因組研究的軟件工具。

全球化工設(shè)備網(wǎng)(http://www.bhmbl.cn )友情提醒,轉(zhuǎn)載請(qǐng)務(wù)必注明來(lái)源:全球化工設(shè)備網(wǎng)!違者必究.

標(biāo)簽:FDA

分享到:
免責(zé)聲明:1、本文系本網(wǎng)編輯轉(zhuǎn)載或者作者自行發(fā)布,本網(wǎng)發(fā)布文章的目的在于傳遞更多信息給訪問(wèn)者,并不代表本網(wǎng)贊同其觀點(diǎn),同時(shí)本網(wǎng)亦不對(duì)文章內(nèi)容的真實(shí)性負(fù)責(zé)。
2、如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間作出適當(dāng)處理!有關(guān)作品版權(quán)事宜請(qǐng)聯(lián)系:+86-571-88970062