- +1
李飛飛發(fā)表長(zhǎng)文:空間智能是AI下一個(gè)前沿
11 月 10 日,斯坦福大學(xué)教授、World Labs 聯(lián)合創(chuàng)始人李飛飛發(fā)表長(zhǎng)文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》(從語(yǔ)言到世界:空間智能是AI的下一個(gè)前沿)。李飛飛認(rèn)為,當(dāng)前以大型語(yǔ)言模型為代表的AI雖然擅長(zhǎng)處理抽象知識(shí),卻如同在“黑暗中行走”,缺乏對(duì)物理世界的真實(shí)理解。而空間智能,即人類用以理解、導(dǎo)航并與三維世界交互的底層能力,將是實(shí)現(xiàn)機(jī)器真正智能的關(guān)鍵突破。

李飛飛在其個(gè)人社交平臺(tái)發(fā)布長(zhǎng)文解釋空間智能
空間智能是指AI系統(tǒng)通過(guò)對(duì)三維空間和時(shí)間的理解,實(shí)現(xiàn)感知、推理和行動(dòng)的能力。
李飛飛解釋道,空間智能是人類認(rèn)知的“腳手架”,它不僅是我們?cè)谌粘I钪型\?、接物等無(wú)縫操作的基礎(chǔ),更是科學(xué)發(fā)現(xiàn)、建筑設(shè)計(jì)和個(gè)人敘事的核心。
她指出,人類對(duì)世界的理解是整體性的——不僅關(guān)乎我們“看見(jiàn)了什么”,還包括事物在空間上的關(guān)系、它們的意義以及彼此的關(guān)聯(lián)。通過(guò)想象、推理、創(chuàng)造與互動(dòng)來(lái)理解世界,而非僅僅依賴語(yǔ)言描述,這正是空間智能的力量。
為了賦予機(jī)器這種能力,我們需要構(gòu)建一種全新的“世界模型”。這種模型必須具備三種核心能力:首先是生成性,能夠創(chuàng)造出在幾何、物理和語(yǔ)義上都保持一致性的虛擬世界;其次是多模態(tài)性,能理解和整合文本、圖像、動(dòng)作等多種指令;最后是交互性,能根據(jù)動(dòng)作輸入預(yù)測(cè)世界的下一步變化。
實(shí)現(xiàn)這一愿景面臨諸多挑戰(zhàn),包括尋找新的訓(xùn)練方法、處理海量復(fù)雜的空間數(shù)據(jù)以及開(kāi)發(fā)新型模型架構(gòu)。
空間智能的應(yīng)用前景極為廣闊。在短期內(nèi),空間智能將賦能創(chuàng)造力,為電影、游戲和建筑領(lǐng)域的創(chuàng)作者提供強(qiáng)大工具,例如李飛飛團(tuán)隊(duì)正在開(kāi)發(fā)的Marble平臺(tái),能快速生成可探索的3D環(huán)境;中期來(lái)看,它將推動(dòng)具身智能機(jī)器人的發(fā)展,通過(guò)高仿真訓(xùn)練使其成為人類在家庭、實(shí)驗(yàn)室中的協(xié)作伙伴;長(zhǎng)遠(yuǎn)看,空間智能有望在科學(xué)、醫(yī)療和教育領(lǐng)域引發(fā)革命,通過(guò)模擬實(shí)驗(yàn)、輔助診斷和沉浸式學(xué)習(xí),極大增強(qiáng)人類在各自專業(yè)領(lǐng)域的能力。
李飛飛強(qiáng)調(diào),她致力于開(kāi)發(fā)人工智能的初心始終是增強(qiáng)人類能力,而非取代人類。構(gòu)建具備空間智能的機(jī)器,最終目標(biāo)是讓AI成為人類應(yīng)對(duì)重大挑戰(zhàn)的得力伙伴,共同創(chuàng)造一個(gè)更美好、人類潛能得以更大發(fā)揮的未來(lái)。
近期,李飛飛多次在公開(kāi)場(chǎng)合強(qiáng)調(diào)空間智能的重要性。此前,她與黃仁勛、約書(shū)亞·本吉奧、杰弗里·辛頓、揚(yáng)·勒昆以及比爾·達(dá)利,齊聚倫敦,在參加《金融時(shí)報(bào)》(FT)主辦的 “未來(lái)人工智能峰會(huì)”(FT Future of AI Summit)時(shí)提出,當(dāng)前大語(yǔ)言模型與智能體,這些仍主要基于語(yǔ)言維度。但若深入反思人類智能的本質(zhì),就會(huì)發(fā)現(xiàn)智能的范疇遠(yuǎn)超越語(yǔ)言層面。而空間智能,正是感知與行動(dòng)之間的關(guān)鍵紐帶——人類與動(dòng)物擁有遠(yuǎn)超語(yǔ)言范疇的非凡能力,能夠感知、推理、交互并創(chuàng)造立體世界。
“即便當(dāng)今最強(qiáng)大的語(yǔ)言模型或大語(yǔ)言模型,在基礎(chǔ)空間智能測(cè)試中仍然表現(xiàn)不佳。從這個(gè)維度來(lái)看,作為一門(mén)科學(xué)與學(xué)科,人工智能仍有太多有待攻克和開(kāi)拓的疆域,而這必將催生更廣闊的應(yīng)用場(chǎng)景。”李飛飛說(shuō)。
在她和楊立昆(Yann LeCun)、謝賽寧等AI領(lǐng)域的領(lǐng)軍學(xué)者聯(lián)合發(fā)表的論文《Cambrian-S: 邁向視頻中的空間超感知》中,提出實(shí)現(xiàn)AGI需先突破“超感知”能力。研究指出,當(dāng)前以大語(yǔ)言模型為核心的AI系統(tǒng)缺乏對(duì)現(xiàn)實(shí)世界的真實(shí)感知能力,無(wú)法像人類一樣理解視頻中的空間關(guān)系與動(dòng)態(tài)變化。
李飛飛在2024年4月創(chuàng)立科技公司W(wǎng)orld Labs,去年9月,World Labs正式宣布完成2.3億美元的巨額融資,投資方包括硅谷知名投資機(jī)構(gòu)a16z、NEA、加拿大風(fēng)投公司Radical Ventures,以及英偉達(dá)公司的風(fēng)險(xiǎn)投資部門(mén)等。今年9月,World Labs 推出了空間智能模型 Marble 預(yù)覽版,目前處于限量開(kāi)放階段。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




