| 1 | 1/1 | 返回列表 |
| 查看: 784 | 回復(fù): 0 | |||
yexuqing木蟲(chóng)之王 (文學(xué)泰斗)
太陽(yáng)系系主任
|
[交流]
中澳科學(xué)家用AI發(fā)現(xiàn)超過(guò)16萬(wàn)種新病毒
|
|
近日,中國(guó)和澳大利亞科學(xué)家的一項(xiàng)國(guó)際聯(lián)合研究利用人工智能(AI)工具發(fā)現(xiàn)了161979種新RNA病毒,是已知病毒種類(lèi)的近30倍,大幅提升業(yè)界對(duì)RNA病毒多樣性和病毒演化歷史的認(rèn)知。這項(xiàng)研究也是迄今為止發(fā)表的數(shù)量最大的病毒物種發(fā)現(xiàn)論文。 圖片來(lái)源:阿里云 這項(xiàng)經(jīng)過(guò)同行評(píng)審的研究10日發(fā)表在國(guó)際知名學(xué)術(shù)期刊《細(xì)胞》(Cell)上。研究的共同通訊作者[1] 中山大學(xué)醫(yī)學(xué)院施莽教授告訴澎湃新聞(www.thepaper.cn):“人工智能算法模型使我們能夠挖掘出以前未知或被忽視的病毒。這種能力在疾病控制和快速識(shí)別新病原體方面尤為重要! 今年剛剛揭曉的諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)都和AI在科學(xué)領(lǐng)域的應(yīng)用有關(guān),將科學(xué)智能(AI for Science)推上了歷史風(fēng)口。施莽表示,對(duì)于病原學(xué)領(lǐng)域來(lái)說(shuō),AI完全不同于傳統(tǒng)工具,它是一種數(shù)據(jù)驅(qū)動(dòng)的研究模式,代表了一種新的科研范式。 “我們常說(shuō),新的方法帶來(lái)新的發(fā)現(xiàn),AI幫助我們突破了對(duì)病毒圈的認(rèn)知。這類(lèi)方法還能應(yīng)用于更多病毒學(xué)領(lǐng)域的科學(xué)問(wèn)題,比如新發(fā)現(xiàn)的病毒是否具有致病性?是否可能引發(fā)下一次大流行?它的蛋白質(zhì)功能是什么?”施莽說(shuō),“在科研領(lǐng)域,AI的應(yīng)用已經(jīng)勢(shì)不可擋,通過(guò)AI方法探索科學(xué)問(wèn)題已取得了重要突破。這種研究范式將成為未來(lái)科學(xué)界的常態(tài),也可能成為我們認(rèn)知世界的重要手段! 首次揭示了病毒圈“暗物質(zhì)”的含義 病毒是無(wú)處不在的微生物,但目前被人類(lèi)識(shí)別的僅有5000余種,是病毒世界的冰山一角。其中一些病毒可能會(huì)導(dǎo)致人類(lèi)患病,對(duì)于病毒的認(rèn)識(shí)擴(kuò)展,意味著能有助于人類(lèi)應(yīng)對(duì)各種疾病。 根據(jù)病毒的遺傳物質(zhì),可將病毒分為DNA病毒和RNA病毒,一般來(lái)講,后者建構(gòu)更簡(jiǎn)單,在自然界中的數(shù)量也更多。RNA病毒無(wú)處不在,在最極端的環(huán)境中也有存在,是最神秘的微生物,甚至有可能參與了早期生命的起源。它們?cè)谌蛏鷳B(tài)系統(tǒng)中發(fā)揮著關(guān)鍵作用,其中一些是人類(lèi)傳染病的病原體。 傳統(tǒng)的病毒發(fā)現(xiàn)方法包括病毒分離和通過(guò)比較未知病毒與已知病毒的序列相似性的生物信息學(xué)方法來(lái)進(jìn)行識(shí)別。然而,RNA病毒種類(lèi)繁多且高度分化,傳統(tǒng)方法難以捕捉缺乏同源性或同源性極低的“暗物質(zhì)病毒”,新病毒發(fā)現(xiàn)的效率較低。但這些序列對(duì)應(yīng)的有類(lèi)似功能的蛋白質(zhì)結(jié)構(gòu)卻有相對(duì)較高同源性,而基于A(yíng)I的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)與病毒學(xué)研究的結(jié)合正在突破這一難題。 此前,已有科學(xué)家利用機(jī)器學(xué)習(xí)搜索了公開(kāi)數(shù)據(jù)庫(kù)中存檔的基因組樣本,并發(fā)現(xiàn)了許多新的RNA病毒。此次發(fā)表在《細(xì)胞》雜志上的最新研究將這項(xiàng)工作更推進(jìn)了一步,即通過(guò)AI輔助的蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)。 RNA病毒都有一個(gè)稱(chēng)為“RdRp”的核心蛋白,即病毒RNA復(fù)制酶。上述研究根據(jù)一個(gè)全新的深度學(xué)習(xí)模型“LucaProt”,基于Transformer框架(構(gòu)建GPT等主流AI大模型的基礎(chǔ)框架),通過(guò)向其輸入蛋白質(zhì)序列預(yù)測(cè)。訓(xùn)練好的模型可以用來(lái)識(shí)別病毒 RdRp,并用它在大量基因組數(shù)據(jù)中查找這些未知病毒的類(lèi)似蛋白序列。 值得一提的是,該AI模型包含一種名為ESMFold的蛋白質(zhì)預(yù)測(cè)工具,該工具由美國(guó)科技巨頭Meta的研究人員開(kāi)發(fā)。類(lèi)似的AI系統(tǒng)還包括由Google DeepMind的研究人員開(kāi)發(fā)的AlphaFold,其CEO德米斯·哈薩比斯(Demis Hassabis)于本周獲得了諾貝爾化學(xué)獎(jiǎng)。 利用這套算法,研究團(tuán)隊(duì)對(duì)來(lái)自全球生物環(huán)境樣本的10487份數(shù)據(jù)進(jìn)行病毒挖掘,發(fā)現(xiàn)了513134條病毒基因組,代表161979個(gè)潛在病毒種及180個(gè)RNA病毒超群。使RNA病毒超群數(shù)量擴(kuò)容約9倍,病毒種類(lèi)增加約30倍,其中23個(gè)超群無(wú)法通過(guò)序列同源方法識(shí)別,被稱(chēng)為病毒圈的“暗物質(zhì)”。 該論文還揭示多個(gè)病毒學(xué)領(lǐng)域新發(fā)現(xiàn):發(fā)現(xiàn)迄今為止最長(zhǎng)的RNA病毒基因組,長(zhǎng)度達(dá)到47250個(gè)核苷酸;識(shí)別出超出以往認(rèn)知的基因組長(zhǎng)度,展示了RNA病毒基因組進(jìn)化的靈活性超出之前病毒學(xué)家的認(rèn)知;此外,在高溫的深海熱泉等極端環(huán)境中,RNA病毒依舊存在多樣性。 “這些病毒中的絕大多數(shù)都已經(jīng)測(cè)序并存儲(chǔ)在公共數(shù)據(jù)庫(kù)中,但它們的差異太大,以至于沒(méi)人知道它們是什么,參與這項(xiàng)研究的悉尼大學(xué)醫(yī)學(xué)與健康學(xué)院醫(yī)學(xué)科學(xué)院的愛(ài)德華茲·霍姆斯(Edwards Holmes)教授說(shuō),“它們包含通常被稱(chēng)為序列 ‘暗物質(zhì)’的東西。我們的人工智能方法能夠組織和分類(lèi)所有這些不同的信息,首次揭示了這種’暗物質(zhì)’的含義! 大幅提升對(duì)病毒多樣性認(rèn)知 施莽團(tuán)隊(duì)的研究顯示病毒的多樣性遠(yuǎn)超人類(lèi)想象,目前我們所看到的只是冰山一角,未來(lái)病毒分類(lèi)體系可能會(huì)有大規(guī)模的調(diào)整。 論文共同作者、阿里云智能云棲實(shí)驗(yàn)室研究員李兆榮博士表示:“LucaProt是前沿人工智能技術(shù)與病毒學(xué)的重要結(jié)合,表明人工智能可以有效地完成生物探索任務(wù)。這種結(jié)合為進(jìn)一步解碼生物序列、從新視角解構(gòu)生物系統(tǒng)提供了寶貴的見(jiàn)解和激勵(lì)。我們也將繼續(xù)在病毒學(xué)人工智能領(lǐng)域的研究! 施莽也進(jìn)一步介紹:“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這種能力在疾病防控和新病原的快速識(shí)別中尤為重要。特別是在疫情暴發(fā)時(shí),人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體! 施莽表示,過(guò)去依靠繁瑣的生物信息學(xué)流程來(lái)發(fā)現(xiàn)病毒,限制了我們可以探索的多樣性!艾F(xiàn)在,我們有了一個(gè)更有效的基于人工智能的模型,它提供了卓越的靈敏度和特異性,同時(shí)讓我們能夠更深入地研究病毒多樣性。我們計(jì)劃將此模型應(yīng)用于各種應(yīng)用! 施莽透露,下一步的研究包括對(duì)于病毒與宿主的關(guān)系,以及識(shí)別可以感染特定宿主的病毒群。 “例如,在人體中可以發(fā)現(xiàn)許多病毒,但并不是所有病毒都會(huì)感染人類(lèi)。有些病毒專(zhuān)門(mén)感染細(xì)菌,有些則感染人類(lèi)攝入的食物,還有些感染寄生蟲(chóng)。因此,關(guān)鍵在于找到真正感染宿主細(xì)胞的病毒。另一種情況是,當(dāng)我們?cè)趧?dòng)物或媒介昆蟲(chóng)中監(jiān)測(cè)潛在的人類(lèi)病原體時(shí),需要一個(gè)工具來(lái)判斷在這些動(dòng)物和媒介中新發(fā)現(xiàn)的病毒是否具備跨物種傳播到人類(lèi)并引發(fā)大流行的潛力!彼f(shuō)。 研究團(tuán)隊(duì)表示,將繼續(xù)訓(xùn)練該模型以發(fā)現(xiàn)更多的病毒多樣性,并且同樣的方法可以用于識(shí)別細(xì)菌和寄生蟲(chóng)。 沒(méi)有參加這項(xiàng)研究的生物進(jìn)化學(xué)家姜小煒博士認(rèn)為: “對(duì)于擴(kuò)大對(duì)病毒圈的認(rèn)知來(lái)說(shuō),這是一種非常有前途的方法,基于A(yíng)I的結(jié)構(gòu)生物學(xué)和演化生物學(xué)結(jié)合的方法會(huì)幫助科學(xué)家發(fā)現(xiàn)病毒在自然界很多未知的多樣性和演化規(guī)律。 以后更好的這類(lèi)方法和數(shù)據(jù)會(huì)帶來(lái)更多的病毒多樣性和演化的重大發(fā)現(xiàn),幫助人類(lèi)應(yīng)對(duì)未來(lái)挑戰(zhàn)! 霍姆斯教授表示:“這是在一項(xiàng)研究中發(fā)現(xiàn)的新病毒種類(lèi)數(shù)量最多的一次,極大地?cái)U(kuò)展了我們對(duì)生活在我們身邊的病毒的了解。然而這只是冰山一角,打開(kāi)了一個(gè)探索的世界。還有數(shù)百萬(wàn)種病毒有待發(fā)現(xiàn),我們可以用同樣的方法來(lái)識(shí)別細(xì)菌和寄生蟲(chóng)。誰(shuí)知道還會(huì)有什么額外的驚喜呢。” |

| 1 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 材料328求調(diào)劑 +5 | 一個(gè)蘿卜02 2026-03-03 | 5/250 |
|
|---|---|---|---|---|
|
[考研] 一志愿314求調(diào)劑 +4 | 202111120625 2026-03-03 | 4/200 |
|
|
[考研]
|
旅行中的紫葡萄 2026-03-03 | 4/200 |
|
|
[考研] 085600材料與化工調(diào)劑 280分 +10 | yyqqhh 2026-03-03 | 10/500 |
|
|
[考研] 292求調(diào)劑 +3 | sgbl 2026-03-03 | 3/150 |
|
|
[考研] 289求調(diào)劑 +7 | BrightLL 2026-03-02 | 9/450 |
|
|
[考研] 化工專(zhuān)碩348,一志愿985求調(diào)劑 +8 | 弗格個(gè) 2026-02-28 | 11/550 |
|
|
[考研]
|
glwshine 2026-03-02 | 5/250 |
|
|
[考研] 268求調(diào)劑 +6 | 好運(yùn)連綿不絕 2026-03-02 | 6/300 |
|
|
[考研] 299求調(diào)劑 +5 | kkcoco25 2026-03-02 | 9/450 |
|
|
[考研] 0856材料求調(diào)劑 +12 | hyf hyf hyf 2026-02-28 | 13/650 |
|
|
[考研] 0856求調(diào)劑285 +11 | 呂仔龍 2026-02-28 | 11/550 |
|
|
[考研] 化學(xué),材料,環(huán)境類(lèi)求調(diào)劑 +7 | 考研版棒棒 2026-03-02 | 7/350 |
|
|
[考研] 303求調(diào)劑 +5 | 今夏不夏 2026-03-01 | 5/250 |
|
|
[考博] 誠(chéng)招農(nóng)業(yè)博士 +3 | 心欣向榮 2026-02-28 | 3/150 |
|
|
[考研] 265分求調(diào)劑不調(diào)專(zhuān)業(yè)和學(xué)校有行學(xué)上就 +6 | 禮堂丁真258 2026-02-28 | 9/450 |
|
|
[考研] 求調(diào)劑 +3 | 熬夜的貓頭鷹 2026-03-02 | 3/150 |
|
|
[考研] 材料類(lèi)求調(diào)劑 +11 | wana_kiko 2026-02-28 | 14/700 |
|
|
[論文投稿]
Optics letters投稿被拒求助
30+3
|
luckyry 2026-02-26 | 4/200 |
|
|
[考研] 307求調(diào)劑 +4 | 73372112 2026-02-28 | 6/300 |
|