新華社舊金山2月19日電(記者吳曉凌)美國弧形研究所19日在官網(wǎng)發(fā)布公報說(shuō),來(lái)自該研究所、美國芯片制造商英偉達公司和美國斯坦福大學(xué)等機構的研究人員共同開(kāi)發(fā)的人工智能(AI)生物學(xué)模型Evo 2當天正式發(fā)布。
公報說(shuō),在前一代模型Evo 1的基礎上,Evo 2發(fā)展成為目前生物學(xué)領(lǐng)域規模最大的AI模型。該模型基于超過(guò)12.8萬(wàn)個(gè)基因組數據的9.3萬(wàn)億個(gè)核苷酸進(jìn)行訓練。
開(kāi)發(fā)者表示,Evo 1和Evo 2模型的開(kāi)發(fā)代表了新興的生成式生物學(xué)領(lǐng)域的關(guān)鍵時(shí)刻,因為這些模型使機器能夠“用核苷酸語(yǔ)言來(lái)讀、寫(xiě)和思考”。
據介紹,Evo 2可用于多種任務(wù),它能夠識別影響蛋白質(zhì)功能和生物體適應性的基因變化。例如,在針對與乳腺癌相關(guān)的BRCA1基因變體進(jìn)行的測試中,Evo 2在預測哪些突變是良性突變、哪些是潛在致病突變方面達到了90%以上的準確率。這將有助于節省大量用于細胞或動(dòng)物實(shí)驗的時(shí)間和研究資金,通過(guò)找到人類(lèi)疾病的遺傳原因來(lái)加速新藥研發(fā)。此外,Evo 2還可用于設計新的生物工具或治療方法。
公報還強調說(shuō),考慮到潛在的倫理和安全風(fēng)險,研究人員在Evo 2的基礎數據集中排除了感染人類(lèi)和其他復雜生物的病原體,并確保該模型不會(huì )對這些病原體的相關(guān)查詢(xún)返回有效答案。
目前,Evo 2已開(kāi)放給全球科研人員,他們可通過(guò)網(wǎng)頁(yè)使用該模型,或可免費下載該模型的源代碼、訓練數據及參數。相關(guān)研究的預印本論文于19日發(fā)表在“生物學(xué)預印本文獻庫”上。