中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

利用AI工具, 幾分鐘即可追溯基因?qū)餐嫦?/h1>
張夢然/科技日報
2026-05-11 17:17
生命科學(xué) >
聽全文
字號

美國俄勒岡大學(xué)研究團(tuán)隊(duì)發(fā)布了一項(xiàng)突破性成果。他們利用ChatGPT同源技術(shù),攻克了生物進(jìn)化研究難題,開發(fā)出全球首個面向群體遺傳學(xué)的語言模型。該人工智能(AI)工具可解析DNA序列中的突變規(guī)律,幾分鐘就可追溯基因?qū)Φ墓餐嫦?,為重建生物進(jìn)化史提供了全新模式。相關(guān)論文刊登于新一期《美國國家科學(xué)院院刊》。

圖片來源:AI生成

這項(xiàng)技術(shù)受大語言模型啟發(fā),采用改進(jìn)版GPT-2架構(gòu),但訓(xùn)練數(shù)據(jù)并非自然語言,而是基于細(xì)菌、嚙齒類、蚊媒及靈長類等多物種的進(jìn)化模擬數(shù)據(jù)。模型通過學(xué)習(xí)DNA序列中“A、T、C、G”四種堿基構(gòu)成的“遺傳語言”,識別出類似文本錯別字的突變模式,這些隨世代累積的變異正是追溯血緣關(guān)系的分子路標(biāo)。

在傳統(tǒng)群體遺傳學(xué)中,依賴概率統(tǒng)計的推斷方法雖精度可靠,但面臨計算效率瓶頸。尤其在應(yīng)對大規(guī)模基因組數(shù)據(jù)時,解析單個染色體可能耗時數(shù)日,且難以處理片段缺失的不完整序列。新模型將繁重的統(tǒng)計運(yùn)算前置到訓(xùn)練階段,實(shí)際應(yīng)用時僅需數(shù)分鐘即可完成傳統(tǒng)方法需數(shù)小時的任務(wù),速度提升達(dá)數(shù)十倍。測試表明,其在推算基因“認(rèn)祖”這一核心指標(biāo)上,已媲美現(xiàn)有最優(yōu)統(tǒng)計方法。

該技術(shù)對公共衛(wèi)生研究具有直接價值。研究團(tuán)隊(duì)正將其應(yīng)用于瘧疾防控領(lǐng)域,通過分析蚊蟲種群中抗藥性基因的演化軌跡,揭示殺蟲劑選擇壓力下的進(jìn)化動態(tài)。而理解抗性基因何時出現(xiàn)、如何擴(kuò)散,正是制定可持續(xù)防控策略的關(guān)鍵。模型對非完整數(shù)據(jù)的兼容性,恰好解決了野外采樣常見的基因序列碎片化難題。

團(tuán)隊(duì)計劃進(jìn)一步拓展模型功能,從當(dāng)前雙譜系分析向多譜系全基因樹重建邁進(jìn)。盡管傳統(tǒng)方法已能實(shí)現(xiàn)部分功能,但機(jī)器學(xué)習(xí)路線有望在處理海量數(shù)據(jù)方面展現(xiàn)獨(dú)特優(yōu)勢。目前團(tuán)隊(duì)正致力于優(yōu)化算法,以捕捉更復(fù)雜的進(jìn)化信號。這項(xiàng)跨學(xué)科探索不僅為遺傳學(xué)注入新方法,也為AI在生命科學(xué)領(lǐng)域的深度應(yīng)用提供了新路徑。

總編輯圈點(diǎn)

這項(xiàng)研究最厲害之處,是科學(xué)家把“讀文章”的技術(shù)拿去“讀基因”。之前科學(xué)家看基因變化,就像拿著放大鏡一個堿基一個堿基地數(shù),慢而且累,遇到殘缺不全的基因數(shù)據(jù)就無能為力。但現(xiàn)在這個AI幾乎一眼就能看出DNA序列里哪些地方寫錯了,還能通過這些錯誤反推出生物的祖先是誰,甚至推出什么時候“分家”的。這對現(xiàn)實(shí)世界有個很直接的用處:比如對付蚊子。它能快速算出蚊子身上的抗藥基因是哪年出現(xiàn)的、是怎么在蚊群里傳開的。知道了抗藥基因的擴(kuò)張路線,才能及時調(diào)整殺蟲劑,不讓蚊子產(chǎn)生耐藥性??梢哉f,該技術(shù)把原本要算好幾天的進(jìn)化題縮短到了幾分鐘,讓人們可以從更亂、更碎的生物樣本里挖出有用的進(jìn)化線索,真正做到了“把AI從聊天室?guī)нM(jìn)了實(shí)驗(yàn)室”。

(原標(biāo)題為《利用AI工具, 幾分鐘即可追溯基因?qū)餐嫦取罚?/p>

    責(zé)任編輯:宦艷紅
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司