著名物理學(xué)家理查德·費(fèi)曼(Richard Feynman)有一句名言:“我無法創(chuàng)造,我不明白。” 除了為費(fèi)曼的理論物理學(xué)方法提供信息外,它還是描述合成生物學(xué)家的動(dòng)機(jī)的好方法,他們對(duì)從頭開始構(gòu)建基因組感興趣。通過設(shè)計(jì)和構(gòu)建合成基因組,他們希望更好地理解生命密碼。
合成生物學(xué)是圍繞使用 DNA 序列作為具有可重復(fù)功能的“部分”的概念組織起來的。現(xiàn)在,通過成功的合作和尖端工具的使用,EMBL 的 Steinmetz 小組對(duì)基因組中這些 DNA 部分的位置或背景導(dǎo)致的基因表達(dá)變異有了重要的了解。
Steinmetz Group的共同主要作者和博士后Amanda Hughes 在解釋激發(fā)這項(xiàng)工作的潛在問題時(shí)說:“在合成生物學(xué)中,你傾向于將事物分解成模塊化的‘即插即用’部分。這些是啟動(dòng)子部分、編碼區(qū)和終止子部分。我們想測(cè)試這些部件是否真的是“即插即用”,在任何情況下都以相同的方式發(fā)揮作用,或者它們的位置是否會(huì)影響它們的功能。我們希望更好地了解基因的線性組織如何影響它們的功能,并確定可用于構(gòu)建基因組的一般設(shè)計(jì)原則。”
合成生物學(xué)工具箱提供上下文洞察
這項(xiàng)工作由 BMBF 和大眾汽車基金會(huì)的“Life?”資助 這項(xiàng)倡議之所以成為可能,是因?yàn)橛袃身?xiàng)關(guān)鍵技術(shù):來自Sc2.0 聯(lián)盟的合成酵母菌株和長(zhǎng)讀長(zhǎng)直接 RNA 測(cè)序。從 Sc2.0 聯(lián)盟獲得的菌株包括一個(gè)稱為“SCRaMbLE”的設(shè)計(jì)特征,它提供了以以前無法實(shí)現(xiàn)的規(guī)模將基因重新排列到不同位置的能力。EMBL 基因組學(xué)核心設(shè)施提供的專業(yè)知識(shí)和工具包括 Oxford Nanopore 的 GridION 在內(nèi),該團(tuán)隊(duì)能夠進(jìn)行長(zhǎng)讀長(zhǎng)直接 RNA 測(cè)序,從而可以識(shí)別 RNA 分子的開始和結(jié)束,并將它們分配給特定的重排。這些尖端技術(shù)的結(jié)合對(duì)于在許多環(huán)境中測(cè)量來自基因的全長(zhǎng) RNA 分子至關(guān)重要。
這篇發(fā)表在《科學(xué)》雜志上的論文表明,環(huán)境——尤其是轉(zhuǎn)錄環(huán)境——會(huì)改變基因的 RNA 輸出。使用長(zhǎng)讀長(zhǎng)直接 RNA 測(cè)序,他們能夠觀察到從合成酵母基因組中隨機(jī)重排的 DNA 序列表達(dá)的全長(zhǎng) RNA 分子的開始、結(jié)束和數(shù)量的變化。重新定位基因會(huì)影響其 RNA 輸出的長(zhǎng)度和豐度;然而,這些變化并不總是由新的相鄰 DNA 序列來解釋。似乎是在它周圍發(fā)生的轉(zhuǎn)錄,而不是序列本身,改變了基因的 RNA 輸出。
正如主要作者 Aaron Brooks 解釋的那樣,從如此龐大的隨機(jī)數(shù)據(jù)集中收集一般原則并非易事:“為了得出我們的結(jié)論,我們必須觀察 SCRaMbLE 菌株中存在的許多替代遺傳背景中的基因。然而,將這些碎片重新組合在一起是一項(xiàng)巨大的努力。我們必須生成一個(gè)龐大的測(cè)序數(shù)據(jù)集,而這反過來又要求我們開發(fā)新的軟件工具。我們必須依靠復(fù)雜的機(jī)器學(xué)習(xí)算法來幫助我們理解我們觀察到的復(fù)雜模式。” 根據(jù)新的上游和下游背景對(duì)基因的 RNA 輸出進(jìn)行建模,揭示了與周圍轉(zhuǎn)錄模式相關(guān)的特征可以預(yù)測(cè) RNA 邊界和豐度。例如,如果一個(gè)基因被重新定位到一個(gè)高表達(dá)的鄰居旁邊,
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!