電話:
021-67610176傳真:
導(dǎo)讀 | 基因暗物質(zhì)是指對生物界中的基因起決定性的物質(zhì)。近日,科學(xué)家們開發(fā)出一種被稱為ExPecto的新人工智能,可預(yù)測人類基因組中所謂“暗物質(zhì)”區(qū)域的基因突變的影響。ExPecto還可指出特定的突變是如何破壞整個(gè)基因的開啟和關(guān)閉的。 |
這項(xiàng)研究已于7月16日以“Deep learning sequence-based ab initio prediction of variant effects on expression and disease risk”為題發(fā)表在Nature Genetics雜志,報(bào)告稱,ExPecto有朝一日可幫助選擇藥物療法,并幫助闡明進(jìn)化是如何塑造我們的遺傳密碼的。
“暗物質(zhì)”區(qū)域
我們的DNA中含有的基因可以作為蛋白質(zhì)的藍(lán)圖,而蛋白質(zhì)是我們身體中負(fù)責(zé)運(yùn)送氧氣、與其他細(xì)胞溝通和對抗感染等重要任務(wù)的主要分子。蛋白質(zhì)編碼序列占我們整個(gè)基因組的比例不到百分之二。
基因組中除編碼區(qū)域之外的98 %組成,即非編碼蛋白質(zhì)的“暗物質(zhì)”部分,會(huì)啟動(dòng)或關(guān)閉基因表達(dá)。大多數(shù)基因突變都是在這個(gè)非編碼區(qū)發(fā)現(xiàn)的。突變本質(zhì)上是一種遺傳“排序”(typo),添加、刪除或改變基因組的序列。非編碼區(qū)的突變有時(shí)會(huì)導(dǎo)致基因于錯(cuò)誤的時(shí)間在身體的錯(cuò)誤部位表達(dá)或不表達(dá),從而增加癌癥等疾病風(fēng)險(xiǎn)。
由于DNA的非編碼部分太大,很難確定具體的突變原因。先前的研究將許多個(gè)體的基因組與特定疾病進(jìn)行了比較,以尋找這些個(gè)體共有的突變。然而,對于更罕見的突變,這種方法變得越來越棘手。此外,DNA鏈有時(shí)是一長段遺傳的,所以科學(xué)家很難確定哪一段特定的遺傳密碼是麻煩制造者。
圖片來源:CC0 Creative Commons
ExPecto程序
利用新方法,美國Flatiron Institute計(jì)算生物學(xué)中心(Center for Computational Biology ,CCB)和普林斯頓大學(xué)的計(jì)算了在不同組織中超過1.4億個(gè)突變的遺傳結(jié)果。研究人員還地確定了可能增加一些免疫相關(guān)疾病風(fēng)險(xiǎn)的突變,包括慢性乙型肝炎病毒(HBV)感染和克羅恩病。
具體來說,研究人員利用單一參考基因組,訓(xùn)練ExPecto程序來了解DNA如何控制200多個(gè)不同組織和細(xì)胞類型的基因表達(dá)。根據(jù)這些信息,ExPecto可以預(yù)測任何突變的影響,甚至是科學(xué)家以前從未見過的突變。
研究人員先用ExPecto來預(yù)測導(dǎo)致克羅恩病、慢性HBV感染和白塞病的突變,隨后通過實(shí)驗(yàn)驗(yàn)證該結(jié)果。對于這三種疾病,作者之一Chandra L. Theesfeld發(fā)現(xiàn),與之前的研究相比,ExPecto預(yù)測的突變對導(dǎo)致相關(guān)疾病具有更大的潛力。
未來運(yùn)用
文章通訊作者Olga Troyanskaya評價(jià)該程序時(shí)說:“ExPecto可以檢查任何基因變異,并預(yù)測其對基因表達(dá)的影響,這太令人興奮了。”
未來,研究人員希望ExPecto能幫助醫(yī)學(xué)專家確定患者疾病的遺傳因素,并開發(fā)適合患者基因組的治療方案。論文合著者Jian Zhou說:“一旦知道哪種蛋白質(zhì)受到影響,以及蛋白質(zhì)會(huì)起什么作用,我們就可以設(shè)計(jì)出能夠解決問題的藥物。例如,如果肌體不能產(chǎn)生某種蛋白質(zhì),那么就可以設(shè)計(jì)一種療法來彌補(bǔ)缺失的蛋白質(zhì)。”
據(jù)悉,任何人都可以訪問ExPecto,對蛋白質(zhì)編碼基因附近超過一億四千萬個(gè)可能突變的影響進(jìn)行預(yù)測。這些結(jié)果可以在網(wǎng)上作為人類基礎(chǔ)(HumanBase)的一部分獲得(人類基礎(chǔ)是由研究小組開發(fā)的一個(gè)關(guān)于人類生物學(xué)和疾病的數(shù)據(jù)驅(qū)動(dòng)的預(yù)測系統(tǒng))。訪問者可以輸入一個(gè)基因,然后就能看到所有在218種組織和細(xì)胞類型中可能影響該基因表達(dá)的突變。
責(zé)編:浮蘇
參考資料:
AI accuray predicts effects of genetic mutations in biological dark matter