二十年前,人類的全基因組序列被釋放。它由國際政府和慈善機(jī)構(gòu)資助,耗資數(shù)十億美元。
快進(jìn)到2008年,在對(duì)更好的基因組理解和測(cè)序成本急劇下降的需求的推動(dòng)下,建立了Genome 10K科學(xué)家社區(qū)(G10K),以促進(jìn)和確保對(duì)10,000種脊椎動(dòng)物進(jìn)行基因組分析。由G10K贊助的脊椎動(dòng)物基因組計(jì)劃在過去幾年中對(duì)測(cè)序生物技術(shù)進(jìn)行了重大改進(jìn),以在未來幾年內(nèi)為所有約70,000個(gè)活體脊椎動(dòng)物擴(kuò)大高質(zhì)量參考基因組組件的生產(chǎn)。
今天,G10K贊助的脊椎動(dòng)物基因組計(jì)劃(VGP)宣布了他們的旗艦研究和相關(guān)出版物,重點(diǎn)關(guān)注基因組組裝質(zhì)量和基因組學(xué)領(lǐng)域的標(biāo)準(zhǔn)化。這項(xiàng)研究包括從第一階段試點(diǎn)的五年開始,針對(duì)具有主干的所有類群(即哺乳動(dòng)物,兩棲動(dòng)物,鳥類,爬行動(dòng)物和魚類)的物種,包括16種高質(zhì)量,近乎無錯(cuò)誤和近乎完整的脊椎動(dòng)物參考基因組組裝體VGP項(xiàng)目。
在《自然》雜志的特刊中,以及在其他科學(xué)期刊上同時(shí)發(fā)表的伴隨論文中,VGP詳述了基于這16個(gè)基因組裝配的眾多技術(shù)改進(jìn)。在這項(xiàng)新研究中,VGP演示了使用最新的自動(dòng)方法(將長(zhǎng)距離和長(zhǎng)距離染色體支架方法與新穎的算法相結(jié)合)來設(shè)置和實(shí)現(xiàn)高質(zhì)量參考基因組質(zhì)量指標(biāo)的可行性基因組裝難題。迄今為止,當(dāng)前的VGP流程已導(dǎo)致提交了129個(gè)二倍體組裝體,這些組裝體代表了迄今為止該物種的最完整,最準(zhǔn)確的版本,并且正在生成數(shù)千個(gè)基因組組裝體,這不僅證明了質(zhì)量標(biāo)準(zhǔn)化的可行性,而且還證明了其可行性。規(guī)模。
這項(xiàng)研究的一部分動(dòng)物包括但不限于:
哺乳動(dòng)物:淡矛鼻蝠,埃及果蝠;加拿大山貓;vaquita;鴨嘴獸;
鳥類:斑馬雀科;卡卡波安娜的蜂鳥;
爬蟲類:古德的荊棘龜;
魚:曲折鰻魚;爬高的鱸魚鈍嘴的螯魚。
“當(dāng)我們最初提出G10K構(gòu)想時(shí),我們召集了一小撮不同領(lǐng)域的動(dòng)物學(xué)家以及以基因組為中心的計(jì)算機(jī)科學(xué)家,他們承諾將共同開發(fā)世界上成千上萬的脊椎動(dòng)物的基因組序列數(shù)據(jù)。” .D。,新星東南大學(xué)(NSU)Halmos藝術(shù)與科學(xué)學(xué)院的教授兼研究科學(xué)家。“我們想為下一代基因組科學(xué)家提供一份禮物。今天,如此眾多生物物種的基因組賦能夢(mèng)想實(shí)現(xiàn)了巨大的飛躍。”
O'Brien是基因組10K聯(lián)盟的共同創(chuàng)始人,俄羅斯圣彼得堡國立大學(xué)Theodosius Dobzhansky基因組生物信息學(xué)中心的首席科學(xué)官,并且是美國國家科學(xué)院的成員。
G10K-VGP的方法將裝配流水線與手動(dòng)管理相結(jié)合,以修復(fù)裝配錯(cuò)誤,重大缺陷和其他錯(cuò)誤,從而為迭代開發(fā)更好的算法提供了信息。例如,VGP幫助揭示了高水平的假基因重復(fù),丟失或增加,這主要是由于算法無法正確分離母本和父本染色體。一種解決方案包括三重裝倉方法,該方法使用來自親本的DNA來分離后代中的父本和母本序列。對(duì)于無法獲得父母數(shù)據(jù)的情況,VGP和合作者開發(fā)的另一種解決方案是一種稱為FALCON-Phase的算法,該算法可降低在染色體規(guī)模上分階段確定母本和父本DNA序列的計(jì)算復(fù)雜性。
標(biāo)簽: 基因組測(cè)
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!