- +1
孫凝暉院士:“AI賦能科學(xué)發(fā)現(xiàn)”最大作用是突破人類認(rèn)知極限
近日,由中國計算機(jī)學(xué)會主辦的第21屆全國高性能計算學(xué)術(shù)大會在內(nèi)蒙古鄂爾多斯召開。大會上,中國工程院院士、中國計算機(jī)學(xué)會理事長孫凝暉在題為《AI(人工智能)賦能科學(xué)發(fā)現(xiàn)》報告中,分享了對這一備受關(guān)注話題的思考。
“第五范式”登上歷史舞臺
孫凝暉首先談到,“科學(xué)智能”是AI for Science,即“AI賦能科學(xué)發(fā)現(xiàn)”。這一研究范式的出現(xiàn),始于AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測上的突破。2020年,AlphaFold在CASP14大賽中成功預(yù)測了2/3的目標(biāo)蛋白結(jié)構(gòu),開啟了基于AI預(yù)測蛋白、核酸等分子結(jié)構(gòu)的歷史進(jìn)程。
2024年諾貝爾物理學(xué)獎和化學(xué)獎授予AI基礎(chǔ)理論和科學(xué)發(fā)現(xiàn)領(lǐng)域的科學(xué)家,展現(xiàn)了對AI的“偏愛”。孫凝暉認(rèn)為,這標(biāo)志著國際學(xué)術(shù)界公認(rèn)AI技術(shù)已進(jìn)入科學(xué)領(lǐng)域,“代表著科研范式的重大改變”。
“融合大模型、大算力、大數(shù)據(jù)和大團(tuán)隊服務(wù)等特點的科學(xué)研究,對科學(xué)發(fā)現(xiàn)的作用就像大科學(xué)裝置一樣,是一個新范式?!睂O凝暉說,新范式的形成,除了“大模型、大算力、大數(shù)據(jù)”外,還離不開物理、化學(xué)、生物、AI等各領(lǐng)域科學(xué)家和工程師團(tuán)隊的長期工作,以及企業(yè)資金的支持。
孫凝暉表示,在“AI賦能科學(xué)發(fā)現(xiàn)”之前,現(xiàn)代科學(xué)活動存在4種范式,即基于實驗觀察的科學(xué)實驗范式、依賴科學(xué)家的理論推演范式、借助計算設(shè)備的科學(xué)計算或數(shù)值模擬范式、基于實驗和理論數(shù)據(jù)計算的科學(xué)數(shù)據(jù)范式。如今,“AI賦能科學(xué)發(fā)現(xiàn)”當(dāng)屬“第五范式”,正登上歷史舞臺。
幫助科學(xué)家從“增肌強(qiáng)體”到“賦予大腦”
AI如何賦能科學(xué)發(fā)現(xiàn)?孫凝暉提出,從信息化視角看,“AI賦能科學(xué)發(fā)現(xiàn)”的核心在于構(gòu)建觀測(Observe)、模擬(Orient)、猜想(Hypothesis)與實驗(Verify)4個環(huán)節(jié),并將數(shù)據(jù)驅(qū)動和智能算法驅(qū)動引入這4個環(huán)節(jié),形成“OOHV全環(huán)的AI賦能”。
“在這4個環(huán)節(jié)中,信息技術(shù)總能發(fā)揮作用,讓知識獲取、分享、檢索、交換更方便,讓信息抽取更簡單?!睂O凝暉談到,推演模擬環(huán)節(jié)本質(zhì)上是“高性能計算+AI”,而機(jī)器學(xué)習(xí)、大模型能通過處理科學(xué)數(shù)據(jù)發(fā)現(xiàn)規(guī)律、驗證猜想,此外,觀察和實驗未來也可依靠具身智能。
從具體案例看,孫凝暉認(rèn)為,信息學(xué)科的主要任務(wù)是提供工具。他有一個形象的比喻:信息技術(shù)賦能科學(xué)的手段如同從“增強(qiáng)肌肉(算力)”到“提供營養(yǎng)”(數(shù)據(jù)),如今正朝著“賦予大腦”(AI)的方向進(jìn)化。
“‘AI賦能科學(xué)發(fā)現(xiàn)’更大的作用是突破人類認(rèn)知極限,這也是科學(xué)研究的最高追求?!睂O凝暉說,人類在第三范式和第四范式下都有許多突破認(rèn)知極限的工作,比如通過科學(xué)計算,我們既能做公里級精度的中短期天氣預(yù)報,也能做全球尺度的氣候變化預(yù)測;通過數(shù)據(jù)解析,人類得以從基因組層面認(rèn)識自己,利用天文望遠(yuǎn)鏡摸到黑洞的“脈搏”。如今,在“第五范式”下也有突破人類認(rèn)知極限的工作。
不過,孫凝暉提醒,AI工具并不是萬能的,科學(xué)發(fā)現(xiàn)依然離不開高性能計算這一基礎(chǔ)手段。同時,在解決實際科學(xué)問題時,如何對齊“AI賦能科學(xué)發(fā)現(xiàn)”共性工具的科學(xué)語義,將成為一個關(guān)鍵問題。
嶄新的方法論和學(xué)術(shù)生態(tài)正在形成
孫凝暉剖析了“AI賦能科學(xué)發(fā)現(xiàn)”面臨的數(shù)據(jù)、模型和計算問題。“科學(xué)數(shù)據(jù)大概來自4個方面,即理論數(shù)據(jù)、觀測數(shù)據(jù)、實驗數(shù)據(jù)和知識數(shù)據(jù),‘AI賦能科學(xué)發(fā)現(xiàn)’數(shù)據(jù)集不僅需要長期積累,還需要關(guān)注數(shù)據(jù)的AI-Ready化與成熟度?!睂O凝暉表示。
在模型方面,孫凝暉提到,OpenAI將實現(xiàn)通用人工智能的路徑分為5個階段:對話者、推理者、代理者、創(chuàng)新者、組織者。這5個階段對應(yīng)的AI依次加入了數(shù)據(jù)驅(qū)動、知識嵌入、物理約束、人機(jī)協(xié)同、群體智能的能力。目前,“AI賦能科學(xué)發(fā)現(xiàn)”的能級正處于“數(shù)據(jù)驅(qū)動+知識嵌入+物理約束”的三輪驅(qū)動階段。
在孫凝暉展示的能級圖中,AI進(jìn)階像“單車”到“高鐵”那樣循序漸進(jìn)。僅靠數(shù)據(jù)驅(qū)動的AI仿佛“單輪車”,隨著知識嵌入,AI成了“自行車”;加入物理約束后,AI堪比“三輪摩托車”;而隨著人機(jī)協(xié)同、群體智能等更多“車輪”的加入,AI有望變成“跑車”“高鐵”,將大大加速人類科學(xué)發(fā)現(xiàn)的進(jìn)程。
在計算問題上,孫凝暉提到,衡量計算有兩個關(guān)鍵維度,即精度和架構(gòu)?!癆I賦能科學(xué)發(fā)現(xiàn)”不僅需要高精度計算,還需要能夠降低負(fù)載的融合架構(gòu)。他表示,未來智算的融合架構(gòu)是什么樣,成為計算機(jī)科學(xué)家需要思考的問題。
孫凝暉展望說,隨著算力集群的堆疊、數(shù)據(jù)來源的多樣化、模型參數(shù)規(guī)模等的進(jìn)一步提升,未來算力將進(jìn)化成為Z級(每秒可進(jìn)行1021次浮點運算)智能超算,數(shù)據(jù)方面將發(fā)展為由海量常識數(shù)據(jù)、高質(zhì)量理論數(shù)據(jù)、實驗數(shù)據(jù)及增強(qiáng)數(shù)據(jù)來解決更復(fù)雜的問題,模型方面將出現(xiàn)一個參數(shù)量超過千億的通用科學(xué)智能大模型。
孫凝暉認(rèn)為,隨著AI技術(shù)對科學(xué)研究范式的重構(gòu),新研究工具鏈涌現(xiàn),頂級期刊開設(shè)專欄,全球頂尖機(jī)構(gòu)成立相關(guān)或?qū)iT研究單元,嶄新的“AI賦能科學(xué)發(fā)現(xiàn)”方法論和學(xué)術(shù)生態(tài)正在形成。
(原標(biāo)題為《孫凝暉:“AI賦能科學(xué)發(fā)現(xiàn)”最大作用是突破人類認(rèn)知極限》)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




