繁體簡(jiǎn)體

中國(guó)科學(xué)家運(yùn)用人工智能算法發(fā)現(xiàn)大量全新RNA病毒

中新社廣州10月10日電 (許青青 朱嘉豪)據(jù)中山大學(xué)9日晚發(fā)布的消息,中山大學(xué)醫(yī)學(xué)院施莽教授團(tuán)隊(duì)與阿里云李兆融團(tuán)隊(duì)在《細(xì)胞》(Cell)雜志發(fā)表論文,報(bào)告了全球范圍的180個(gè)超群、16萬(wàn)余種RNA病毒的發(fā)現(xiàn),大幅擴(kuò)展全球RNA病毒的多樣性。

據(jù)介紹,傳統(tǒng)的病毒發(fā)現(xiàn)方法包括病毒分離和生命組學(xué)的生物信息學(xué)分析,高度依賴既有知識(shí),面對(duì)RNA病毒這種高度分化、種類繁多且容易變異的病毒識(shí)別效率低。該研究團(tuán)隊(duì)開發(fā)的LucaProt人工智能算法能夠?qū)Σ《竞头遣《净蚪M序列深度學(xué)習(xí),并在數(shù)據(jù)集中自主判斷病毒序列。

利用這套算法,研究團(tuán)隊(duì)在來(lái)自全球生物環(huán)境樣本的10487份RNA測(cè)序數(shù)據(jù)中發(fā)現(xiàn)了超過(guò)51萬(wàn)條病毒基因組,代表超過(guò)16萬(wàn)個(gè)潛在病毒種及180個(gè)RNA病毒超群。其中23個(gè)超群無(wú)法通過(guò)序列同源方法識(shí)別,被稱為病毒圈的“暗物質(zhì)”。

通過(guò)進(jìn)一步分析,團(tuán)隊(duì)報(bào)告了迄今最長(zhǎng)的RNA病毒基因組,長(zhǎng)度達(dá)到47250個(gè)核苷酸;發(fā)現(xiàn)了超出以往認(rèn)知的基因組結(jié)構(gòu),展現(xiàn)出RNA病毒基因組進(jìn)化的靈活性;識(shí)別到多種病毒功能蛋白,特別是與細(xì)菌相關(guān)的功能蛋白,進(jìn)一步表明還有更多類型的RNA噬菌體亟待探索;發(fā)現(xiàn)在南極底泥、深海熱泉、活性污泥和鹽堿灘等極端環(huán)境中,RNA病毒的數(shù)量和多樣性仍然較高。

“人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這種能力在疾病防控和新病原的快速識(shí)別中尤為重要。特別是在疫情暴發(fā)時(shí),人工智能的速度和精度可以幫助科學(xué)家更快地鎖定潛在病原體?!笔┟Ы榻B說(shuō),研究顯示病毒的多樣性遠(yuǎn)超人類想象,人類目前所看到的仍是冰山一角,未來(lái)病毒分類體系可能會(huì)有大規(guī)模的調(diào)整。

文章來(lái)源:中新社
責(zé)任編輯:姚思寒
熱門評(píng)論
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170072
京公網(wǎng)安備 11010502045281號(hào)
違法和不良信息舉報(bào)電話:010-65669841
舉報(bào)郵箱:xxjb@huaxia.com

網(wǎng)站簡(jiǎn)介 / 廣告服務(wù) / 聯(lián)系我們

主辦:華夏經(jīng)緯信息科技有限公司   版權(quán)所有 華夏經(jīng)緯網(wǎng)

Copyright 2001-2024 By skhuanbao.cn