一個國際研究小組生成了第一個真正完整的人類 Y 染色體序列,這是最終被完全測序的人類染色體。新序列填補(bǔ)了 Y 染色體長度 50% 以上的空白,揭示了對生育力有影響的重要基因組特征,例如精子產(chǎn)生的因素。這項研究由端粒到端粒 (T2T) 聯(lián)盟領(lǐng)導(dǎo),該聯(lián)盟是由國立衛(wèi)生研究院下屬的國家人類基因組研究所 (NHGRI) 資助的一個研究小組,今天發(fā)表在《自然》雜志上。
Y 染色體和 X 染色體經(jīng)常因其在性發(fā)育中的作用而被討論。雖然這些染色體發(fā)揮著核心作用,但與人類性發(fā)育有關(guān)的因素遍布整個基因組,而且非常復(fù)雜,從而產(chǎn)生了男性、女性和雙性個體中發(fā)現(xiàn)的一系列人類性別特征。這些類別并不等同于性別,性別是一個社會類別。此外,最近的研究表明,Y 染色體上的基因有助于人類生物學(xué)的其他方面,例如癌癥風(fēng)險和嚴(yán)重程度。
20 年前,當(dāng)研究人員完成第一個人類基因組測序時,所有 24 條染色體的序列都留下了缺口。然而,與基因組序列其余部分散布的小缺口(T2T 聯(lián)盟去年填補(bǔ)的缺口)不同,Y 染色體序列的一半以上仍然是個謎。
所有染色體都有一些重復(fù)區(qū)域,但 Y 染色體異常重復(fù),使其序列特別難以完成。組裝測序數(shù)據(jù)就像嘗試閱讀一本被切成條的長書。如果書中的所有行都是唯一的,則更容易確定行的順序。但是,如果同一個句子重復(fù)數(shù)千或數(shù)百萬次,則條帶的原始順序就不太清楚了。雖然所有人類染色體都含有重復(fù)序列,但 Y 染色體上約有 3000 萬個字母是重復(fù)序列。就好像這本書的一半長度都重復(fù)了同樣的幾句話。
為了解決人類基因組中最重復(fù)的片段,T2T 聯(lián)盟應(yīng)用了新的 DNA 測序技術(shù)和序列組裝方法,以及從為其他 23 條人類染色體生成第一個無間隙序列中獲得的知識。
“最令人驚訝的是重復(fù)的組織方式,”NHGRI 的高級研究員兼該聯(lián)盟的領(lǐng)導(dǎo)者 Adam Phillippy 博士說。“我們不知道缺失的序列到底是什么組成的。它可能非?;靵y,但相反,近一半的染色體是由兩個稱為衛(wèi)星 DNA 的特定重復(fù)序列的交替塊組成的。它形成了美麗的、像被子一樣的圖案。”
完整的 Y 染色體序列還揭示了醫(yī)學(xué)相關(guān)區(qū)域的重要特征。Y 染色體的一個這樣的部分被稱為無精子癥因子區(qū)域,這是一段 DNA,包含幾個已知與精子產(chǎn)生有關(guān)的基因。利用新完成的序列,研究人員研究了無精子因子區(qū)域中一組反向重復(fù)或“回文”的結(jié)構(gòu)。
NHGRI 科學(xué)家、 《自然》雜志的第一作者 Arang Rhie 博士說:“這種結(jié)構(gòu)非常重要,因為這些回文有時會產(chǎn)生 DNA 環(huán)。” “有時,這些環(huán)會意外被切斷并在基因組中產(chǎn)生缺失。”
眾所周知,無精子癥因子區(qū)域的缺失會破壞精子的產(chǎn)生,因此這些回文可能會影響生育能力。有了完整的 Y 染色體序列,研究人員現(xiàn)在可以更精確地分析這些缺失及其對精子產(chǎn)生的影響。
其他具有潛在醫(yī)學(xué)相關(guān)性的區(qū)域包含重復(fù)的基因。人類基因組中的大多數(shù)基因都有兩個拷貝,每個拷貝都遺傳自父母。然而,一些基因有許多沿著 DNA 片段重復(fù)的拷貝,有時被稱為“基因陣列”。
研究人員重點(diǎn)關(guān)注了TSPY,這是另一種被認(rèn)為與精子生成有關(guān)的基因。TSPY的拷貝被組織在人類基因組中第的基因陣列中。與其他重復(fù)區(qū)域一樣,重復(fù)基因的分析具有挑戰(zhàn)性,因此雖然已知TSPY存在許多重復(fù)拷貝,但該陣列的具體 DNA 序列和組織結(jié)構(gòu)以前是未知的。當(dāng)研究人員分析這個區(qū)域時,他們發(fā)現(xiàn)不同的個體含有 10 到 40 個TSPY拷貝。
“當(dāng)你發(fā)現(xiàn)以前從未見過的變異時,我們總是希望這些基因組變異對于了解人類健康非常重要,”菲利普博士說。“醫(yī)學(xué)相關(guān)的基因組變異可以幫助我們在未來設(shè)計更好的診斷方法。”
除了完整的 Y 染色體序列外,NHGRI 資助的人類基因組結(jié)構(gòu)變異聯(lián)盟還報告了 43 條不同人類 Y 染色體的序列,該序列也在今天發(fā)表在同一期《自然》雜志上。這些進(jìn)展補(bǔ)充了 T2T 聯(lián)盟于 2022 年發(fā)布的無間隙人類基因組序列,以及NHGRI 資助的人類泛基因組參考聯(lián)盟于 2023 年 5 月發(fā)布的“泛基因組” 。 通過這些成就,科學(xué)家們可以獲得豐富的新基因組學(xué)資源來解開人類生物學(xué)的謎團(tuán),并為基因組醫(yī)學(xué)的未來鋪平道路。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!