孫凝暉院士：“AI賦能科學(xué)發(fā)現(xiàn)”最大作用是突破人類認(rèn)知極限

趙廣立/中國科學(xué)報

2025-08-22 07:43

聽全文

近日，由中國計算機(jī)學(xué)會主辦的第21屆全國高性能計算學(xué)術(shù)大會在內(nèi)蒙古鄂爾多斯召開。大會上，中國工程院院士、中國計算機(jī)學(xué)會理事長孫凝暉在題為《AI（人工智能）賦能科學(xué)發(fā)現(xiàn)》報告中，分享了對這一備受關(guān)注話題的思考。

“第五范式”登上歷史舞臺

孫凝暉首先談到，“科學(xué)智能”是AI for Science，即“AI賦能科學(xué)發(fā)現(xiàn)”。這一研究范式的出現(xiàn)，始于AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測上的突破。2020年，AlphaFold在CASP14大賽中成功預(yù)測了2/3的目標(biāo)蛋白結(jié)構(gòu)，開啟了基于AI預(yù)測蛋白、核酸等分子結(jié)構(gòu)的歷史進(jìn)程。

2024年諾貝爾物理學(xué)獎和化學(xué)獎授予AI基礎(chǔ)理論和科學(xué)發(fā)現(xiàn)領(lǐng)域的科學(xué)家，展現(xiàn)了對AI的“偏愛”。孫凝暉認(rèn)為，這標(biāo)志著國際學(xué)術(shù)界公認(rèn)AI技術(shù)已進(jìn)入科學(xué)領(lǐng)域，“代表著科研范式的重大改變”。

“融合大模型、大算力、大數(shù)據(jù)和大團(tuán)隊服務(wù)等特點的科學(xué)研究，對科學(xué)發(fā)現(xiàn)的作用就像大科學(xué)裝置一樣，是一個新范式?！睂O凝暉說，新范式的形成，除了“大模型、大算力、大數(shù)據(jù)”外，還離不開物理、化學(xué)、生物、AI等各領(lǐng)域科學(xué)家和工程師團(tuán)隊的長期工作，以及企業(yè)資金的支持。

孫凝暉表示，在“AI賦能科學(xué)發(fā)現(xiàn)”之前，現(xiàn)代科學(xué)活動存在4種范式，即基于實驗觀察的科學(xué)實驗范式、依賴科學(xué)家的理論推演范式、借助計算設(shè)備的科學(xué)計算或數(shù)值模擬范式、基于實驗和理論數(shù)據(jù)計算的科學(xué)數(shù)據(jù)范式。如今，“AI賦能科學(xué)發(fā)現(xiàn)”當(dāng)屬“第五范式”，正登上歷史舞臺。

幫助科學(xué)家從“增肌強(qiáng)體”到“賦予大腦”

AI如何賦能科學(xué)發(fā)現(xiàn)？孫凝暉提出，從信息化視角看，“AI賦能科學(xué)發(fā)現(xiàn)”的核心在于構(gòu)建觀測（Observe）、模擬（Orient）、猜想（Hypothesis）與實驗（Verify）4個環(huán)節(jié)，并將數(shù)據(jù)驅(qū)動和智能算法驅(qū)動引入這4個環(huán)節(jié)，形成“OOHV全環(huán)的AI賦能”。

“在這4個環(huán)節(jié)中，信息技術(shù)總能發(fā)揮作用，讓知識獲取、分享、檢索、交換更方便，讓信息抽取更簡單?！睂O凝暉談到，推演模擬環(huán)節(jié)本質(zhì)上是“高性能計算+AI”，而機(jī)器學(xué)習(xí)、大模型能通過處理科學(xué)數(shù)據(jù)發(fā)現(xiàn)規(guī)律、驗證猜想，此外，觀察和實驗未來也可依靠具身智能。

從具體案例看，孫凝暉認(rèn)為，信息學(xué)科的主要任務(wù)是提供工具。他有一個形象的比喻：信息技術(shù)賦能科學(xué)的手段如同從“增強(qiáng)肌肉（算力）”到“提供營養(yǎng)”（數(shù)據(jù)），如今正朝著“賦予大腦”（AI）的方向進(jìn)化。

“‘AI賦能科學(xué)發(fā)現(xiàn)’更大的作用是突破人類認(rèn)知極限，這也是科學(xué)研究的最高追求?！睂O凝暉說，人類在第三范式和第四范式下都有許多突破認(rèn)知極限的工作，比如通過科學(xué)計算，我們既能做公里級精度的中短期天氣預(yù)報，也能做全球尺度的氣候變化預(yù)測；通過數(shù)據(jù)解析，人類得以從基因組層面認(rèn)識自己，利用天文望遠(yuǎn)鏡摸到黑洞的“脈搏”。如今，在“第五范式”下也有突破人類認(rèn)知極限的工作。

不過，孫凝暉提醒，AI工具并不是萬能的，科學(xué)發(fā)現(xiàn)依然離不開高性能計算這一基礎(chǔ)手段。同時，在解決實際科學(xué)問題時，如何對齊“AI賦能科學(xué)發(fā)現(xiàn)”共性工具的科學(xué)語義，將成為一個關(guān)鍵問題。

嶄新的方法論和學(xué)術(shù)生態(tài)正在形成

孫凝暉剖析了“AI賦能科學(xué)發(fā)現(xiàn)”面臨的數(shù)據(jù)、模型和計算問題。“科學(xué)數(shù)據(jù)大概來自4個方面，即理論數(shù)據(jù)、觀測數(shù)據(jù)、實驗數(shù)據(jù)和知識數(shù)據(jù)，‘AI賦能科學(xué)發(fā)現(xiàn)’數(shù)據(jù)集不僅需要長期積累，還需要關(guān)注數(shù)據(jù)的AI-Ready化與成熟度?！睂O凝暉表示。

在模型方面，孫凝暉提到，OpenAI將實現(xiàn)通用人工智能的路徑分為5個階段：對話者、推理者、代理者、創(chuàng)新者、組織者。這5個階段對應(yīng)的AI依次加入了數(shù)據(jù)驅(qū)動、知識嵌入、物理約束、人機(jī)協(xié)同、群體智能的能力。目前，“AI賦能科學(xué)發(fā)現(xiàn)”的能級正處于“數(shù)據(jù)驅(qū)動+知識嵌入+物理約束”的三輪驅(qū)動階段。

在孫凝暉展示的能級圖中，AI進(jìn)階像“單車”到“高鐵”那樣循序漸進(jìn)。僅靠數(shù)據(jù)驅(qū)動的AI仿佛“單輪車”，隨著知識嵌入，AI成了“自行車”；加入物理約束后，AI堪比“三輪摩托車”；而隨著人機(jī)協(xié)同、群體智能等更多“車輪”的加入，AI有望變成“跑車”“高鐵”，將大大加速人類科學(xué)發(fā)現(xiàn)的進(jìn)程。

在計算問題上，孫凝暉提到，衡量計算有兩個關(guān)鍵維度，即精度和架構(gòu)?！癆I賦能科學(xué)發(fā)現(xiàn)”不僅需要高精度計算，還需要能夠降低負(fù)載的融合架構(gòu)。他表示，未來智算的融合架構(gòu)是什么樣，成為計算機(jī)科學(xué)家需要思考的問題。

孫凝暉展望說，隨著算力集群的堆疊、數(shù)據(jù)來源的多樣化、模型參數(shù)規(guī)模等的進(jìn)一步提升，未來算力將進(jìn)化成為Z級（每秒可進(jìn)行1021次浮點運算）智能超算，數(shù)據(jù)方面將發(fā)展為由海量常識數(shù)據(jù)、高質(zhì)量理論數(shù)據(jù)、實驗數(shù)據(jù)及增強(qiáng)數(shù)據(jù)來解決更復(fù)雜的問題，模型方面將出現(xiàn)一個參數(shù)量超過千億的通用科學(xué)智能大模型。

孫凝暉認(rèn)為，隨著AI技術(shù)對科學(xué)研究范式的重構(gòu)，新研究工具鏈涌現(xiàn)，頂級期刊開設(shè)專欄，全球頂尖機(jī)構(gòu)成立相關(guān)或?qū)ｉT研究單元，嶄新的“AI賦能科學(xué)發(fā)現(xiàn)”方法論和學(xué)術(shù)生態(tài)正在形成。

（原標(biāo)題為《孫凝暉：“AI賦能科學(xué)發(fā)現(xiàn)”最大作用是突破人類認(rèn)知極限》）

責(zé)任編輯：宦艷紅

圖片編輯：沈軻

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#AI for Science #AI #for #Science