利用基因組學(xué)的力量來尋找重大疾病的風(fēng)險因素或?qū)ふ矣H屬依賴于分析大量基因組的昂貴且耗時的能力。由約翰霍普金斯大學(xué)計算機(jī)科學(xué)家共同領(lǐng)導(dǎo)的一個團(tuán)隊通過創(chuàng)建一個基于云的平臺來公平競爭,該平臺使基因組學(xué)研究人員能夠輕松訪問世界上最大的基因組學(xué)數(shù)據(jù)庫之一。
被稱為 AnVIL(基因組數(shù)據(jù)科學(xué)分析、可視化和信息學(xué)實驗室空間)的新平臺使任何研究人員都能通過互聯(lián)網(wǎng)連接訪問數(shù)千種分析工具、患者記錄和超過 300,000 個基因組。這項工作是國家人類基因組研究所 (NHGRI) 的一個項目,今天發(fā)表在Cell Genomics上。
“AnVIL 正在顛覆基因組學(xué)數(shù)據(jù)共享的模式,通過以新方式連接研究人員和數(shù)據(jù)集,為科學(xué)提供前所未有的新機(jī)會,并有望實現(xiàn)令人興奮的新發(fā)現(xiàn),”項目聯(lián)合負(fù)責(zé)人、彭博計算機(jī)科學(xué)與生物學(xué)杰出教授 Michael Schatz 說。在約翰霍普金斯大學(xué)。
通常,基因組分析始于研究人員將大量數(shù)據(jù)從中央倉庫下載到他們自己的數(shù)據(jù)中心,這一過程不僅耗時、低效且昂貴,而且還使與其他機(jī)構(gòu)的研究人員合作變得困難。
“AnVIL 將為各種規(guī)模的機(jī)構(gòu)帶來變革,尤其是那些沒有資源建立自己的數(shù)據(jù)中心的小型機(jī)構(gòu)。我們希望 AnVIL 能夠公平競爭,讓每個人都有平等的機(jī)會進(jìn)行發(fā)現(xiàn),”沙茨說。
癌癥或心血管疾病等疾病的遺傳風(fēng)險因素通常非常微妙,需要研究人員分析數(shù)千名患者的基因組以發(fā)現(xiàn)新的關(guān)聯(lián)。單個人類基因組的原始數(shù)據(jù)包含約 40GB,因此下載數(shù)千個基因組可能需要幾天到幾周的時間:單個基因組需要大約 10 張 DVD 的數(shù)據(jù),因此傳輸數(shù)千意味著移動“數(shù)萬張 DVD”數(shù)據(jù),”沙茨說。
此外,許多研究需要整合在多個機(jī)構(gòu)收集的數(shù)據(jù),這意味著每個機(jī)構(gòu)都必須下載自己的副本,同時確保維護(hù)患者數(shù)據(jù)的安全。隨著研究人員開始進(jìn)行規(guī)模越來越大的研究,需要同時分析數(shù)十萬到數(shù)百萬個基因組,預(yù)計這一挑戰(zhàn)在未來會變得更大。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!