- +1
楊植麟、張鵬、夏立雪、羅福莉,聊龍蝦、聊漲價(jià)、聊Agent未來(lái)
OpenClaw小龍蝦的熱潮吹到了北京中關(guān)村論壇會(huì)議上。就在剛剛,3月27日,月之暗面創(chuàng)始人楊植麟主持了一場(chǎng)圍繞OpenClaw與AI開(kāi)源的討論。來(lái)自模型、算力與應(yīng)用層的多位核心從業(yè)者——包括智譜華章CEO張鵬、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪、小米MiMo大模型負(fù)責(zé)人羅福莉及香港大學(xué)助理教授黃超作為嘉賓,圍繞Agent技術(shù)演進(jìn)、Token需求爆發(fā)以及開(kāi)源生態(tài)重構(gòu)展開(kāi)對(duì)話(huà)。在這場(chǎng)對(duì)話(huà)里,智譜華章CEO張鵬回應(yīng)了近期的漲價(jià)熱潮,也坦言,當(dāng)前最大的問(wèn)題是對(duì)算力的需求。楊植麟也問(wèn)羅福莉,小米的模型是怎么做的?羅福莉雖未正面回答,但透露了技術(shù)路線(xiàn),面向 Agent 時(shí)代的新探索。
以下為對(duì)話(huà)實(shí)錄:

楊植麟: 很榮幸今天能邀請(qǐng)到各位重磅嘉賓。大家覆蓋了不同層面:從模型層,到底層算力層,再到更上層的 Agent 層。今天也非常高興能和大家一起探討這個(gè)話(huà)題。我們今天最核心的兩個(gè)關(guān)鍵詞,一個(gè)是“開(kāi)源”,一個(gè)是“Agent”。
我們先從第一個(gè)問(wèn)題開(kāi)始,這個(gè)問(wèn)題想請(qǐng)每位嘉賓都談一談。最近最火的無(wú)疑是 OpenClaw。大家在日常使用 OpenClaw 或類(lèi)似產(chǎn)品時(shí),覺(jué)得最有想象力、最讓你印象深刻的地方是什么?另外,從技術(shù)角度來(lái)看,你們?nèi)绾慰创裉?OpenClaw 以及相關(guān) Agent 的演進(jìn)?我們先從張鵬開(kāi)始。
張鵬: 好。先感謝植麟的邀請(qǐng),也感謝主辦方給我這個(gè)機(jī)會(huì),和大家一起交流。其實(shí)我很早就開(kāi)始玩 OpenClaw 了。那時(shí)候它還不叫 OpenClaw,最早叫 Clawdbot。我自己一直在折騰這些東西,畢竟也是程序員出身,所以對(duì)這類(lèi)產(chǎn)品一直有比較直接的體驗(yàn)。
我覺(jué)得,這件事給大家?guī)?lái)的最大突破,或者說(shuō)最大的“新鮮感”,在于它不再只是程序員或者極客的專(zhuān)屬工具了。普通人也可以比較方便地使用頂尖模型的能力,尤其是在編程和智能體相關(guān)的能力上。
所以到現(xiàn)在為止,我在和大家交流時(shí),更愿意把 OpenClaw 稱(chēng)作一種“腳手架”。它提供的是一種可能性:在模型能力之上,搭起了一個(gè)足夠穩(wěn)固、足夠方便、同時(shí)又足夠靈活的腳手架。大家可以按照自己的意愿,去調(diào)用底層模型提供的各種新能力。很多過(guò)去受限于“不會(huì)寫(xiě)代碼”或“缺乏其他專(zhuān)業(yè)技能”而無(wú)法實(shí)現(xiàn)的想法,今天只需要通過(guò)很簡(jiǎn)單的交流,就有機(jī)會(huì)把它真正做出來(lái)。對(duì)我來(lái)說(shuō),這件事的沖擊非常大,也讓我重新認(rèn)識(shí)了這類(lèi)產(chǎn)品的意義。
夏立雪: 其實(shí)我最開(kāi)始使用 OpenClaw 的時(shí)候,并不太適應(yīng)。因?yàn)槲乙呀?jīng)習(xí)慣了和大模型對(duì)話(huà)式交互的方式,所以一開(kāi)始會(huì)覺(jué)得它的響應(yīng)有點(diǎn)慢。
但后來(lái)我意識(shí)到,它和過(guò)去聊天機(jī)器人最大的不同在于:它不是一個(gè)只負(fù)責(zé)“聊天”的東西,而更像是一個(gè)能夠幫我完成大型任務(wù)的人。所以,當(dāng)我后來(lái)開(kāi)始給它布置一些更復(fù)雜的任務(wù)時(shí),我才真正發(fā)現(xiàn),它其實(shí)可以完成得很好。
這件事讓我感觸很深。模型從最開(kāi)始按Token進(jìn)行對(duì)話(huà),到今天變成一個(gè)Agent,變成一個(gè)“龍蝦”,真正開(kāi)始幫你完成任務(wù),這極大拓展了我們對(duì) AI 的想象空間。但與此同時(shí),它對(duì)整個(gè)系統(tǒng)能力的要求也顯著提高了。這也是為什么我一開(kāi)始會(huì)覺(jué)得它“有點(diǎn)卡”。
作為基礎(chǔ)設(shè)施底層的廠(chǎng)商,我看到的是,OpenClaw給整個(gè) AI 背后的大型系統(tǒng)和生態(tài)都帶來(lái)了更多機(jī)遇和挑戰(zhàn)。因?yàn)槲覀兘裉焖锌烧{(diào)用的資源,想要支撐這樣一個(gè)快速增長(zhǎng)的時(shí)代,其實(shí)還是不夠的。就拿我們公司來(lái)說(shuō),從一月底開(kāi)始,我們的Token量基本上每?jī)芍芫头槐叮浆F(xiàn)在已經(jīng)增長(zhǎng)了十倍。上一次看到這種增長(zhǎng)速度,還是 3G 時(shí)代手機(jī)流量快速普及的時(shí)候。
所以我現(xiàn)在有一種很強(qiáng)烈的感覺(jué):今天的Token用量,就像當(dāng)年大家每個(gè)月只有100MB手機(jī)流量時(shí)的那個(gè)階段。這就是時(shí)代變化的一個(gè)信號(hào)。在這樣的背景下,我們的資源一定要被更好地優(yōu)化、更好地整合,才能讓每一個(gè)人——不只是 AI 行業(yè)里的人,而是整個(gè)社會(huì)中每一個(gè)鮮活的個(gè)體——都真正把 AI 能力用起來(lái)。
所以,作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者,我對(duì)這個(gè)時(shí)代非常激動(dòng),也非常有感觸。我認(rèn)為這里面還有大量?jī)?yōu)化空間,但我們依然應(yīng)該持續(xù)探索、持續(xù)嘗試。謝謝。
羅福莉: 我自己會(huì)把OpenClaw看作Agent框架層面一個(gè)非常革命性、也非常顛覆性的事件。雖然我知道,我身邊很多做深度Coding (編程)的人,第一選擇可能仍然是 Claude Code,但我相信,只要真正用過(guò)OpenClaw,你就會(huì)很明確地感受到,這個(gè)框架在很多設(shè)計(jì)上其實(shí)是領(lǐng)先的。包括最近Claude Code的不少更新,在我看來(lái),某種程度上也是在向OpenClaw靠近。
就我自己的使用體驗(yàn)來(lái)說(shuō),這個(gè)框架給我?guī)?lái)的,更多是一種“隨時(shí)隨地?cái)U(kuò)展想象力”的可能。最開(kāi)始,我只能在桌面端延展自己的創(chuàng)意;但后來(lái)我發(fā)現(xiàn),OpenClaw真正的價(jià)值在于,它讓你可以在更多場(chǎng)景里持續(xù)推進(jìn)自己的想法。
我覺(jué)得OpenClaw最核心的價(jià)值主要有兩點(diǎn)。第一,它是開(kāi)源的。開(kāi)源非常有利于整個(gè)社區(qū)深入?yún)⑴c、持續(xù)改進(jìn),并且不斷投入到這個(gè)框架之中。第二,像OpenClaw、Claude Code這樣的框架,本身就是一個(gè)非常重要的前置條件。我認(rèn)為,它們很大的價(jià)值在于,把國(guó)內(nèi)那些還沒(méi)有完全逼近閉源模型、但已經(jīng)位于開(kāi)源模型賽道前列的模型,上限顯著拉高了。
在絕大多數(shù)場(chǎng)景里,我們會(huì)發(fā)現(xiàn),它的任務(wù)完成度已經(jīng)非常接近Claude最新的模型;同時(shí),它又把下限保障得很好。因?yàn)樗梢砸揽恳徽議arness(集成架構(gòu)) 系統(tǒng)、skills 體系,以及很多初步但有效的設(shè)計(jì),來(lái)保證任務(wù)完成度和準(zhǔn)確率。
所以,從基座模型的角度來(lái)看,我認(rèn)為這類(lèi)框架一方面保證了基座大模型的下限,另一方面又拉伸了它的上限。除此之外,我覺(jué)得它給整個(gè)社區(qū)帶來(lái)的另一個(gè)重要價(jià)值,是點(diǎn)燃了大家對(duì)于Agent層的想象力。大家開(kāi)始意識(shí)到,在大模型之外、也就是更重要的Agent這一層,其實(shí)還有非常大的空間可以做。
這也是為什么最近社區(qū)里,除了研究員之外,越來(lái)越多的人開(kāi)始參與到這場(chǎng)AGI變革中。也有越來(lái)越多的人,開(kāi)始借助更強(qiáng)的框架,比如harness、scaffold(腳手架)等,在一定程度上替代自己的工作、釋放自己的時(shí)間,去做更有想象力的事情。
黃超: 我感覺(jué),從交互模式上來(lái)看,OpenClaw這次之所以會(huì)爆火,首先是因?yàn)樗o了大家一種更強(qiáng)的“活人感”。我們其實(shí)做這類(lèi)事情也有一兩年了,但之前像Cursor、Claude Code 這類(lèi) Agent,給人的感覺(jué)更多還是“工具感”。
而這一次,我們看到它通過(guò)IM (即時(shí)通訊)軟件嵌入的交互方式,讓大家更容易產(chǎn)生一種“這是一個(gè)個(gè)人 AI”的感覺(jué),也更接近大家想象中的Jarvis (漫威漫畫(huà)中鋼鐵俠(Tony Stark)的人工智能助手)那樣的概念。我覺(jué)得,這是它在交互模式上帶來(lái)的一個(gè)非常重要的變化。
另外,它帶給大家的另一個(gè)啟發(fā),是它的架構(gòu)本身。像Agent Loop(智能體循環(huán))這樣一種非常簡(jiǎn)單、但又非常高效的框架,再一次被證明是成立的。
同時(shí),它也讓我們重新思考:我們到底需要的是一個(gè)非常強(qiáng)大的智能體,替我們做很多事;還是需要一個(gè)更輕量級(jí)、像操作系統(tǒng)或腳手架一樣的小管家?
我覺(jué)得它帶來(lái)的是另一種可能:通過(guò)一個(gè)像OpenClaw這樣的輕量級(jí)“龍蝦操作系統(tǒng)”生態(tài),把整個(gè)社區(qū)真正調(diào)動(dòng)起來(lái),撬動(dòng)生態(tài)里的各種工具。隨著skills、harness(集成架構(gòu)) 這些組件越來(lái)越豐富,也會(huì)有越來(lái)越多的人開(kāi)始設(shè)計(jì)更適用于OpenClaw這類(lèi)系統(tǒng)的應(yīng)用,并進(jìn)一步賦能各行各業(yè)。
所以我覺(jué)得,它天然就和開(kāi)源生態(tài)結(jié)合得非常緊密。這兩點(diǎn),是它給我?guī)?lái)的最大啟發(fā)。
楊植麟: 順著剛才大家一直在討論OpenClaw,我也想接著問(wèn)張鵬一個(gè)問(wèn)題。我們看到最近智譜發(fā)布了新的GLM-5-Turbo 模型。我理解,這個(gè)模型在相關(guān)能力上也做了很大的增強(qiáng)。能不能請(qǐng)你給大家介紹一下,這個(gè)新模型和其他模型相比,有哪些不同之處?另外,我們也觀察到,你們最近有一個(gè)提價(jià)策略。這個(gè)策略反映了怎樣的市場(chǎng)信號(hào)?
張鵬: 前兩天我們確實(shí)緊急更新了一版。當(dāng)然,這其實(shí)是我們整個(gè)發(fā)展目標(biāo)中的一個(gè)階段,只是把它提前拿出來(lái)了。
這次更新最主要的目標(biāo),還是從原來(lái)“簡(jiǎn)單對(duì)話(huà)”的能力,進(jìn)一步走向“真正干活”的能力。剛才各位提到的一點(diǎn)我非常贊同:OpenClaw讓大家第一次明確感受到,大模型不再只是會(huì)聊天,而是真的能幫我做事。
但“干活”這件事背后,對(duì)模型能力的要求其實(shí)非常高。它需要自己進(jìn)行長(zhǎng)程任務(wù)規(guī)劃,不斷嘗試、不斷壓縮上下文、不斷 debug(調(diào)試),甚至還可能涉及多模態(tài)信息處理。
所以,這對(duì)模型本身的能力要求,和傳統(tǒng)面向?qū)υ?huà)機(jī)器人的通用模型其實(shí)是不一樣的。GLM-5-Turbo就是在這些方面做了針對(duì)性的強(qiáng)化。尤其像剛才提到的這種長(zhǎng)程任務(wù)——比如讓它連續(xù)工作72個(gè)小時(shí),能夠持續(xù)不斷地自行 loop 執(zhí)行——我們?cè)谶@方面做了很多工作。
大家剛才也提到了Token消耗量的問(wèn)題。讓一個(gè)更聰明的模型去執(zhí)行更復(fù)雜的任務(wù),資源消耗其實(shí)是非常巨大的。普通用戶(hù)未必能直觀感受到這一點(diǎn),但最終一定會(huì)體現(xiàn)在賬單上。所以,我們也針對(duì)這方面做了一些優(yōu)化,讓模型在面對(duì)復(fù)雜任務(wù)時(shí),能夠以更高的效率完成執(zhí)行。這是這次優(yōu)化的幾個(gè)重點(diǎn)方向。
但從本質(zhì)上來(lái)說(shuō),它的模型架構(gòu)仍然是一種多任務(wù)協(xié)同的通用模型架構(gòu),只是在能力側(cè)做了更有針對(duì)性的增強(qiáng)。至于提價(jià),這件事也比較容易解釋。因?yàn)楝F(xiàn)在已經(jīng)不是簡(jiǎn)單地問(wèn)一個(gè)問(wèn)題、模型給出一個(gè)回答了。它背后的思考和推理鏈路會(huì)變得很長(zhǎng),還會(huì)通過(guò)寫(xiě)代碼的方式與底層基礎(chǔ)設(shè)施交互,不斷調(diào)試,并隨時(shí)修正自己的錯(cuò)誤。這意味著整體消耗量會(huì)非常大。完成一個(gè)任務(wù)所需要的Token量,可能是回答一個(gè)簡(jiǎn)單問(wèn)題時(shí)的十倍,甚至百倍。因此,價(jià)格上相應(yīng)做一些調(diào)整,本質(zhì)上是成本變化的自然結(jié)果。模型更大了,能力更強(qiáng)了,對(duì)應(yīng)的服務(wù)成本也提高了,所以我們希望把它逐步拉回到一個(gè)正常的商業(yè)價(jià)值區(qū)間。
因?yàn)殚L(zhǎng)期依賴(lài)低價(jià)競(jìng)爭(zhēng),其實(shí)并不利于整個(gè)行業(yè)的發(fā)展。這也是我們的一個(gè)重要考量。我們希望通過(guò)這樣的方式,在商業(yè)化路徑上形成一個(gè)更健康的閉環(huán),持續(xù)優(yōu)化模型能力,并更長(zhǎng)期、穩(wěn)定地為大家提供更好的模型和相應(yīng)的Token服務(wù)。
楊植麟: 非常好的分享。其實(shí)現(xiàn)在開(kāi)源模型和推理算力正在逐漸形成一個(gè)新的生態(tài)。各種各樣的開(kāi)源模型,可以部署在不同的推理算力平臺(tái)上,為用戶(hù)提供更多價(jià)值。隨著 Token量的爆發(fā),整個(gè)行業(yè)也可能正在從訓(xùn)練時(shí)代逐步走向推理時(shí)代。所以我想請(qǐng)教一下立雪,從基礎(chǔ)設(shè)施層面來(lái)看,這個(gè)推理時(shí)代對(duì)無(wú)問(wèn)芯穹意味著什么?
夏立雪: 感謝植麟。確實(shí),因?yàn)槲覀兪且患艺Q生于 AI 時(shí)代的基礎(chǔ)設(shè)施廠(chǎng)商,現(xiàn)在也在為Kimi、智譜等公司提供服務(wù),也在和MiniMax等團(tuán)隊(duì)合作,幫助大家把我們這樣的“Token 工廠(chǎng)”更高效地用起來(lái)。同時(shí),我們也在和很多高校、科研院所合作。
所以,我們其實(shí)一直都在思考一件事:AGI 時(shí)代所需要的基礎(chǔ)設(shè)施,到底應(yīng)該是什么樣子,以及我們應(yīng)該怎樣一步一步在這個(gè)過(guò)程中去實(shí)現(xiàn)它、推演它。對(duì)這件事,我們已經(jīng)做了比較充分的準(zhǔn)備,也看到了短期、中期和長(zhǎng)期幾個(gè)不同階段需要解決的問(wèn)題。
當(dāng)前最現(xiàn)實(shí)、最緊迫的問(wèn)題,其實(shí)就是剛才大家聊到的:像OpenClaw這類(lèi)Agent產(chǎn)品帶動(dòng)了整個(gè)Token需求的暴增,而這種暴增對(duì)系統(tǒng)效率提出了更高要求。從某種意義上說(shuō),價(jià)格上漲也是在這種需求壓力之下形成的一種應(yīng)對(duì)方式。
我們一直以來(lái)都是從軟硬件協(xié)同的角度去做布局和解決方案設(shè)計(jì)。包括我們接入了幾乎所有能看到的主流計(jì)算芯片,把國(guó)內(nèi)十幾種芯片、幾十個(gè)不同的算力集群統(tǒng)一連接起來(lái)。這樣,我們就能夠更好地解決AI系統(tǒng)中算力資源緊缺的問(wèn)題。因?yàn)樵谫Y源不足的時(shí)候,最好的辦法,第一是把所有可用資源都盡可能用起來(lái);第二是讓每一份算力都真正用在刀刃上,讓每一份資源都發(fā)揮出最大的轉(zhuǎn)化效率和價(jià)值。
所以,在當(dāng)下這個(gè)階段,我們要解決的核心問(wèn)題,就是如何進(jìn)一步打造一個(gè)更高效的Token工廠(chǎng)。圍繞這一點(diǎn),我們做了很多優(yōu)化。比如,讓模型與硬件、顯存等各類(lèi)資源實(shí)現(xiàn)最優(yōu)適配;也在持續(xù)觀察,最新的模型結(jié)構(gòu)與硬件結(jié)構(gòu)之間,是否還能形成更深層次的“化學(xué)反應(yīng)”。
但如果只解決眼前的效率問(wèn)題,其實(shí)還不夠。我們現(xiàn)在做的,本質(zhì)上還是一個(gè)標(biāo)準(zhǔn)化的Token工廠(chǎng);可面向 Agent 時(shí)代,我們認(rèn)為這遠(yuǎn)遠(yuǎn)不夠。因?yàn)檎鐒偛糯蠹宜f(shuō),Agent更像是一個(gè)“人”,我們可以直接把任務(wù)交給它去完成。
而我一直非常堅(jiān)定地認(rèn)為,當(dāng)前很多云計(jì)算時(shí)代的基礎(chǔ)設(shè)施,本質(zhì)上還是為程序和人類(lèi)工程師設(shè)計(jì)的,而不是為AI設(shè)計(jì)的。它更像是:我們先做出一套基礎(chǔ)設(shè)施,再提供一個(gè)給人類(lèi)工程師使用的接口,然后再在外面包一層,接入Agent。這種方式,其實(shí)是在用人類(lèi)操作系統(tǒng)的邏輯,限制Agent的發(fā)揮空間。
我舉個(gè)例子。Agent可以在秒級(jí)甚至毫秒級(jí)完成思考并發(fā)起任務(wù),但我們過(guò)去很多底層API和系統(tǒng)能力,其實(shí)并沒(méi)有為這種調(diào)用頻率做好準(zhǔn)備。因?yàn)閷?duì)人類(lèi)來(lái)說(shuō),發(fā)起一個(gè)任務(wù)通常是分鐘級(jí)別的,而不是毫秒級(jí)的。所以,我們需要新的能力來(lái)適配這種變化。我們把它理解為一種面向Agent的基礎(chǔ)設(shè)施,也就是要打造一個(gè)更智能化的調(diào)度引擎。這正是我們現(xiàn)在在做的事情。
再往更長(zhǎng)遠(yuǎn)的未來(lái)看,當(dāng)真正的AGI時(shí)代到來(lái)時(shí),我們甚至認(rèn)為,連基礎(chǔ)設(shè)施本身都應(yīng)該是一個(gè)智能體。也就是說(shuō),我們正在打造的這套工廠(chǎng),本身也應(yīng)該具備自我進(jìn)化、自我迭代的能力,能夠形成一個(gè)自主運(yùn)轉(zhuǎn)的組織??梢园阉斫鉃椋哼@個(gè)系統(tǒng)內(nèi)部甚至?xí)幸粋€(gè)“CEO”,而這個(gè)CEO本身也是一個(gè)Agent。它會(huì)負(fù)責(zé)管理整個(gè)基礎(chǔ)設(shè)施,并根據(jù)AI客戶(hù)的需求,自主提出需求、迭代能力、優(yōu)化系統(tǒng)。
只有這樣,AI與基礎(chǔ)設(shè)施之間才能形成更好的耦合。我們也在做一些相關(guān)探索,比如讓Agent與Agent之間可以更高效地通信,實(shí)現(xiàn)cache-to-cache(緩存到緩存)這類(lèi)能力。我們一直在思考,基礎(chǔ)設(shè)施的發(fā)展不應(yīng)該是一個(gè)割裂的過(guò)程,不應(yīng)該只是“我接收一個(gè)需求,再去機(jī)械執(zhí)行”,而應(yīng)該不斷產(chǎn)生更豐富的化學(xué)反應(yīng)。
我認(rèn)為,只有做到這一點(diǎn),才真正實(shí)現(xiàn)了所謂的軟硬協(xié)同,也真正實(shí)現(xiàn)了算法與基礎(chǔ)設(shè)施的協(xié)同。
楊植麟: 接下來(lái)想問(wèn)問(wèn)福莉。小米最近發(fā)布了新的模型,也在持續(xù)推進(jìn)開(kāi)源和背后的相關(guān)技術(shù),我覺(jué)得這對(duì)整個(gè)社區(qū)做出了很大的貢獻(xiàn)。所以也想請(qǐng)你談?wù)?,你覺(jué)得小米在做大模型這件事上,有什么獨(dú)特的優(yōu)勢(shì)?
羅福莉: 我想先把“小米做大模型有什么獨(dú)特優(yōu)勢(shì)”這個(gè)問(wèn)題放一放。我更想談的,其實(shí)是中國(guó)大模型團(tuán)隊(duì)在做基座模型這件事上的整體優(yōu)勢(shì),因?yàn)槲矣X(jué)得這個(gè)話(huà)題更有普遍價(jià)值。
大概從兩年前開(kāi)始,我就已經(jīng)看到,中國(guó)的基座模型團(tuán)隊(duì)在這個(gè)方向上出現(xiàn)了非常重要的突破。這個(gè)突破在于:在有限算力,尤其是在NVLink互聯(lián)帶寬受限的情況下,我們?nèi)绾瓮黄七@些硬件條件帶來(lái)的限制,去做一些看起來(lái)像是在為效率妥協(xié)、但本質(zhì)上卻是模型結(jié)構(gòu)創(chuàng)新的工作。比如DeepSeek V2、V3系列中的細(xì)粒度MoE(混合專(zhuān)家模型)和MLA(多頭潛在注意力)等。后來(lái)我們看到,這類(lèi)創(chuàng)新其實(shí)帶來(lái)了一場(chǎng)真正的變化。
這個(gè)變化在于:當(dāng)算力預(yù)算相對(duì)固定的時(shí)候,我們?nèi)绾伟淹瑯右环菟懔λ苓_(dá)到的智能水平推到最高。我覺(jué)得DeepSeek的出現(xiàn),給了國(guó)內(nèi)所有基座模型團(tuán)隊(duì)很大的勇氣和信心。雖然到了今天,我們自己的國(guó)產(chǎn)芯片,無(wú)論是推理芯片還是訓(xùn)練芯片,都已經(jīng)在不斷進(jìn)步,但正是在此前那種受限環(huán)境下,反而逼出了我們對(duì)“更高訓(xùn)練效率、更低推理成本”的全新探索。
比如最近出現(xiàn)的hybrid sparse、linear attention等結(jié)構(gòu)方向。包括DeepSeek的相關(guān)探索,Kimi的相關(guān)方案,以及小米面向下一代模型結(jié)構(gòu)所做的一些研究。它們都指向同一個(gè)問(wèn)題:當(dāng)我們進(jìn)入Agent時(shí)代之后,模型結(jié)構(gòu)到底應(yīng)該如何進(jìn)一步演化。
我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要?因?yàn)閯偛盼覀円恢痹谟懻揙penClaw。只要你真正用過(guò)OpenClaw,就會(huì)發(fā)現(xiàn)它往往是“越用越好用,越用越聰明”。而它成立的一個(gè)前提,就是推理階段必須擁有足夠長(zhǎng)的context。Long context(長(zhǎng)文本)其實(shí)已經(jīng)是一個(gè)被討論了很久的話(huà)題,但直到今天,大家才真正開(kāi)始意識(shí)到:不是模型做不到百萬(wàn)級(jí)甚至千萬(wàn)級(jí)上下文,而是如果推理成本太高、速度太慢,這件事就沒(méi)有現(xiàn)實(shí)價(jià)值。
所以,真正關(guān)鍵的問(wèn)題是:你能不能在100萬(wàn)甚至1000萬(wàn)級(jí)context的情況下,把推理成本打下來(lái),把速度提上去。只有在這種前提下,用戶(hù)才會(huì)愿意把真正具有高生產(chǎn)力價(jià)值的任務(wù)交給模型,模型也才有機(jī)會(huì)在長(zhǎng)上下文環(huán)境中完成更高復(fù)雜度的任務(wù)。甚至可以說(shuō),只有到了1000萬(wàn)級(jí)、上億級(jí)上下文的階段,我們才可能真正看到模型的自我迭代能力被釋放出來(lái)。
所謂模型的自我迭代,就是它能夠在一個(gè)復(fù)雜環(huán)境里,依靠超強(qiáng)的上下文能力,完成對(duì)自身的持續(xù)進(jìn)化。這個(gè)進(jìn)化既可能發(fā)生在框架層,也可能發(fā)生在模型參數(shù)層。因?yàn)樵谖铱磥?lái),長(zhǎng)上下文本身其實(shí)就是對(duì)參數(shù)能力的一種外延和增強(qiáng)。
所以,未來(lái)真正的競(jìng)爭(zhēng)會(huì)是一個(gè)全方位的競(jìng)爭(zhēng):一方面,你能不能做出原生適配長(zhǎng)上下文的模型架構(gòu);另一方面,你能不能在推理側(cè)真正把 long-context efficiency 做出來(lái)。除此之外,還包括你能否在預(yù)訓(xùn)練階段就把這類(lèi)架構(gòu)打牢,以及在后訓(xùn)練階段,能不能把模型在真實(shí)長(zhǎng)程任務(wù)上的穩(wěn)定性和能力上限繼續(xù)往上推。
我們現(xiàn)在也在思考,怎樣構(gòu)造更有效的學(xué)習(xí)算法;怎樣采集在100萬(wàn)、1000萬(wàn)、甚至更長(zhǎng)上下文里,真正具有長(zhǎng)期依賴(lài)關(guān)系的文本;以及怎樣結(jié)合復(fù)雜環(huán)境,生成高質(zhì)量的軌跡數(shù)據(jù)。這些,都是我們正在持續(xù)推進(jìn)的事情。
但我能看到的更長(zhǎng)期趨勢(shì)是:隨著大模型本身在飛速進(jìn)步,再疊加Agent框架的加持,推理需求一定會(huì)繼續(xù)迅速增長(zhǎng)。就像剛才立雪提到的,過(guò)去一段時(shí)間里,Token需求已經(jīng)增長(zhǎng)了接近十倍。那么今年,整個(gè)Token需求會(huì)不會(huì)增長(zhǎng)到一百倍?這其實(shí)已經(jīng)把競(jìng)爭(zhēng)帶到了另一個(gè)維度:不僅是模型之間的競(jìng)爭(zhēng),也是算力、推理芯片,甚至能源層面的競(jìng)爭(zhēng)。
楊植麟: 對(duì),非常有洞見(jiàn)的分享。下面想問(wèn)一下黃超。你也開(kāi)發(fā)了一些非常有影響力的Agent項(xiàng)目,包括像nanobrowser這樣的項(xiàng)目,在社區(qū)里也積累了很多用戶(hù)和粉絲。想請(qǐng)你談?wù)劊瑥募夹g(shù)或者應(yīng)用層面來(lái)看,接下來(lái)有哪些值得重點(diǎn)關(guān)注的方向?
黃超: 感謝植麟。我覺(jué)得,如果把Agent技術(shù)抽象出來(lái),核心大致有幾個(gè)模塊:planning、memory 和 tool use。
先說(shuō)planning(計(jì)劃)。我覺(jué)得現(xiàn)在最大的問(wèn)題,仍然出現(xiàn)在長(zhǎng)程任務(wù)和復(fù)雜上下文上。比如一個(gè)任務(wù)可能需要500步,甚至更多步驟,很多模型未必能夠做好規(guī)劃。我認(rèn)為,本質(zhì)上還是因?yàn)槟P筒痪邆渥銐虻碾[性知識(shí)。尤其是在很多復(fù)雜的垂直領(lǐng)域,這個(gè)問(wèn)題會(huì)更加突出。未來(lái)一個(gè)很重要的方向,是把已有的復(fù)雜任務(wù)知識(shí)更系統(tǒng)地固化到模型中。
當(dāng)然,從skills(能力)的角度來(lái)看,包括harness在內(nèi)的很多機(jī)制,本質(zhì)上也是在緩解planning過(guò)程中帶來(lái)的錯(cuò)誤。因?yàn)楦哔|(zhì)量的skill,其實(shí)就是在幫助模型完成一些本來(lái)較難的任務(wù)。這是planning這一部分。
再說(shuō)memory(記憶)。我的感受是,memory始終會(huì)面臨一些根本性問(wèn)題,比如信息壓縮不準(zhǔn)確、表達(dá)失真等。隨著長(zhǎng)程任務(wù)和復(fù)雜場(chǎng)景越來(lái)越多,memory的需求也會(huì)迅速膨脹,這本身就會(huì)給整個(gè)系統(tǒng)帶來(lái)很大壓力。
但現(xiàn)在,包括各種“龍蝦”在內(nèi),很多系統(tǒng)采用的memory方案其實(shí)都還比較簡(jiǎn)單,例如基于文件系統(tǒng)、Markdown文件,或者通過(guò)共享文件的方式來(lái)管理memory。我覺(jué)得未來(lái)的memory很可能會(huì)走向分層設(shè)計(jì),同時(shí)也要想辦法讓它更加通用。因?yàn)檎f(shuō)實(shí)話(huà),當(dāng)前的memory機(jī)制其實(shí)很難做到真正的通用。比如coding 場(chǎng)景、deep research 場(chǎng)景、多模態(tài)場(chǎng)景,它們的數(shù)據(jù)模態(tài)差異都非常大。如何針對(duì)這些不同類(lèi)型的memory做更好的檢索和索引,并進(jìn)一步提高效率,我覺(jué)得這會(huì)一直是一個(gè)關(guān)鍵方向。
另外一點(diǎn)是,OpenClaw這類(lèi)系統(tǒng)把創(chuàng)建Agent的門(mén)檻大幅降低之后,未來(lái)可能不會(huì)只有一個(gè)Agent。比如我們已經(jīng)看到,Kimi也在嘗試Agent Swarm這樣的機(jī)制。也就是說(shuō),未來(lái)每個(gè)人可能擁有的不是一個(gè)“龍蝦”,而是一群“龍蝦”。
而一群Agent所帶來(lái)的上下文規(guī)模,相比單個(gè)Agent會(huì)大得多。這也會(huì)進(jìn)一步加大memory的壓力?,F(xiàn)在其實(shí)還沒(méi)有一套特別成熟的機(jī)制,去管理這種多Agent帶來(lái)的海量上下文。尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類(lèi)任務(wù)中,不管是對(duì)模型本身,還是對(duì)整個(gè)Agent架構(gòu),壓力都會(huì)很大。
最后是tool use。我覺(jué)得在這一塊,現(xiàn)在整個(gè)skill生態(tài)仍然存在不少問(wèn)題。MCP當(dāng)年暴露出來(lái)的一些問(wèn)題,其實(shí)在今天依然存在,比如質(zhì)量缺乏保障,以及潛在的安全風(fēng)險(xiǎn)。現(xiàn)在雖然skill很多,但高質(zhì)量的skill其實(shí)仍然偏少。低質(zhì)量的skill會(huì)顯著影響Agent完成任務(wù)的效果;與此同時(shí),skill本身也可能存在惡意注入等問(wèn)題。
所以在這一塊,我覺(jué)得很大程度上還是需要依靠整個(gè)社區(qū),一起把skill生態(tài)建設(shè)得更好。甚至進(jìn)一步思考,怎樣讓系統(tǒng)在執(zhí)行過(guò)程中演化出新的skill??偟膩?lái)說(shuō),我覺(jué)得無(wú)論是planning、memory,還是skill,都是當(dāng)前一線(xiàn)最現(xiàn)實(shí)的痛點(diǎn),也都是未來(lái)非常重要的演進(jìn)方向。
楊植麟: 可以看到,剛才兩位嘉賓其實(shí)是從不同視角討論了同一個(gè)問(wèn)題。隨著任務(wù)復(fù)雜度不斷提升,上下文規(guī)模也會(huì)迅速膨脹。一方面,模型層面可以繼續(xù)提升原生上下文長(zhǎng)度;另一方面,在Agent和harness層面,像剛才提到的planning、memory以及各類(lèi)輔助機(jī)制,也能夠幫助模型在既有能力邊界內(nèi)支撐更復(fù)雜的任務(wù)。我覺(jué)得這兩個(gè)方向接下來(lái)會(huì)進(jìn)一步產(chǎn)生化學(xué)反應(yīng),從而提升系統(tǒng)完成復(fù)雜任務(wù)的能力。
最后,我們做一個(gè)開(kāi)放式展望。想請(qǐng)各位用一個(gè)詞,來(lái)描述接下來(lái)12個(gè)月大模型發(fā)展的趨勢(shì),以及你們的期待。
黃超:說(shuō)實(shí)話(huà),在AI領(lǐng)域,12個(gè)月聽(tīng)起來(lái)都已經(jīng)很遙遠(yuǎn)了,甚至很難判斷12個(gè)月之后會(huì)發(fā)展成什么樣。但如果一定要用一個(gè)詞來(lái)概括,我會(huì)選“生態(tài)”。
我覺(jué)得現(xiàn)在OpenClaw讓整個(gè)社區(qū)非?;钴S,這是一個(gè)很好的開(kāi)始。但未來(lái)Agent真正重要的,不只是成為個(gè)人助手,而是要進(jìn)一步轉(zhuǎn)化為真正能一起工作的“打工人”,或者說(shuō)coworker?,F(xiàn)在很多人使用它,可能更多還是出于新鮮感,或者覺(jué)得好玩。但未來(lái),只有當(dāng)這些“龍蝦”真正沉淀下來(lái),成為大家穩(wěn)定的生產(chǎn)工具、協(xié)作伙伴,這件事才算真正跑通。
而這件事離不開(kāi)生態(tài)的共同建設(shè)。開(kāi)源在這里面非常重要。因?yàn)橹挥邪严嚓P(guān)的技術(shù)探索、模型能力、工具能力持續(xù)開(kāi)放出來(lái),整個(gè)生態(tài)才可能共同推進(jìn)。無(wú)論是模型本身的迭代,還是 skills 平臺(tái)的演進(jìn),或者各種工具鏈的完善,我覺(jué)得都需要圍繞 Agent 去建立一個(gè)更好的生態(tài)。
從我自己的觀察來(lái)看,未來(lái)一個(gè)很明顯的問(wèn)題是:軟件到底還是不是主要給人用的?我覺(jué)得未必。未來(lái)很多軟件可能不再以人類(lèi)為中心,因?yàn)槿祟?lèi)需要GUI(圖形用戶(hù)界面),但很多系統(tǒng)可能會(huì)越來(lái)越偏向Agent-native,也就是原生面向Agent使用。
這樣一來(lái),人類(lèi)可能只會(huì)保留那些真正讓自己感到愉悅的交互,而大量真正執(zhí)行性的工作,會(huì)逐漸轉(zhuǎn)移給Agent。所以我覺(jué)得,現(xiàn)在整個(gè)生態(tài)其實(shí)已經(jīng)在發(fā)生變化:從GUI、MCP(模型上下文協(xié)議),逐漸轉(zhuǎn)向 CLI(命令行界面)這種模式。接下來(lái),不管是軟件系統(tǒng)、數(shù)據(jù)結(jié)構(gòu),還是各種技術(shù)棧,本質(zhì)上都需要朝著 Agent-native 的方向重構(gòu)。只有這樣,整個(gè) Agent 生態(tài)的發(fā)展才會(huì)更加豐富。
羅福莉: 我覺(jué)得,把這個(gè)問(wèn)題收縮到一年的尺度非常有意義。因?yàn)槿绻褧r(shí)間拉到五年,在我對(duì)AGI的理解里,很多事情幾乎已經(jīng)是必然會(huì)發(fā)生的了。所以,如果要用一個(gè)詞來(lái)概括接下來(lái)一年里AGI進(jìn)程中最關(guān)鍵的一件事,我會(huì)選“進(jìn)化”。
雖然這個(gè)詞聽(tīng)起來(lái)有一點(diǎn)抽象,但我最近對(duì)它有了更具體、也更務(wù)實(shí)的理解。過(guò)去一年,大家已經(jīng)多次提到這件事,但直到最近,我才真正開(kāi)始感受到,“自進(jìn)化”這件事其實(shí)已經(jīng)開(kāi)始具備比較可行的實(shí)現(xiàn)路徑。
其中一個(gè)很重要的原因在于,隨著模型能力增強(qiáng),我們逐漸意識(shí)到,在過(guò)去那種單純對(duì)話(huà)式的范式下,預(yù)訓(xùn)練模型的上限其實(shí)并沒(méi)有被真正發(fā)揮出來(lái)。而今天,這個(gè)上限正在被Agent框架逐步激活。
我們現(xiàn)在已經(jīng)摸到這個(gè)邊界了。尤其是當(dāng)模型開(kāi)始執(zhí)行更長(zhǎng)時(shí)間的任務(wù)時(shí),我們會(huì)發(fā)現(xiàn),它其實(shí)能夠自己學(xué)習(xí)、自己進(jìn)化。一個(gè)很簡(jiǎn)單的實(shí)驗(yàn)是:在現(xiàn)有框架上,疊加一個(gè)可驗(yàn)證的目標(biāo)約束,再給它設(shè)置一個(gè)loop,讓它持續(xù)圍繞這個(gè)目標(biāo)進(jìn)行迭代優(yōu)化。你就會(huì)發(fā)現(xiàn),模型會(huì)不斷拿出更優(yōu)的方案。
如果這種自進(jìn)化機(jī)制可以持續(xù)運(yùn)轉(zhuǎn),那么它的潛力會(huì)非常大。現(xiàn)在其實(shí)很多國(guó)內(nèi)模型已經(jīng)能夠穩(wěn)定跑上一到兩天了。當(dāng)然,這和任務(wù)難度有關(guān)。比如在一些科研任務(wù)中,模型去探索更優(yōu)的結(jié)構(gòu)設(shè)計(jì),因?yàn)檫@類(lèi)任務(wù)存在明確的評(píng)估標(biāo)準(zhǔn),例如更低的 PPL(Perplexity,困惑度),這就意味著它具備可驗(yàn)證性。在這種確定性較強(qiáng)的任務(wù)上,我們已經(jīng)看到,模型能夠自主優(yōu)化并持續(xù)執(zhí)行兩三天。
所以從我的角度來(lái)看,自進(jìn)化是一個(gè)真正可能創(chuàng)造新東西的方向。它不是簡(jiǎn)單地替代人類(lèi)已有的生產(chǎn)力,而是像頂尖科學(xué)家一樣,去探索世界上原本還不存在的東西。一年前,我還會(huì)覺(jué)得這個(gè)過(guò)程大概要三到五年;但到了最近,我反而覺(jué)得這個(gè)時(shí)間窗口應(yīng)該縮短到一到兩年。
也就是說(shuō),我們可能很快就能看到:在一個(gè)很強(qiáng)的自進(jìn)化Agent框架加持下,大模型對(duì)科學(xué)研究帶來(lái)至少指數(shù)級(jí)的加速。因?yàn)槲易罱呀?jīng)很明顯地觀察到,我們組內(nèi)做大模型研究的同學(xué),他們的workflow本身就是高度不確定、又高度依賴(lài)創(chuàng)造力的。而在這種情況下,借助Claude Code,再結(jié)合非常頂尖的模型,研究效率基本上已經(jīng)可以提升接近十倍。
所以我非常期待這種范式未來(lái)能夠輻射到更廣泛的學(xué)科和領(lǐng)域。我覺(jué)得,這會(huì)是一件非常重要的事情。
夏立雪: 我的關(guān)鍵詞是“可持續(xù)”。因?yàn)槲铱吹剑麄€(gè)行業(yè)的發(fā)展仍處在一個(gè)長(zhǎng)期演進(jìn)的過(guò)程中,我們也希望它具備長(zhǎng)久的生命力。從基礎(chǔ)設(shè)施角度看,一個(gè)非?,F(xiàn)實(shí)的問(wèn)題是,資源終究是有限的,就像我們過(guò)去談“可持續(xù)發(fā)展”時(shí)反復(fù)強(qiáng)調(diào)的那樣。
我們現(xiàn)在作為一家Token工廠(chǎng),能否持續(xù)、穩(wěn)定、大規(guī)模地向外提供可用的Token,讓頂尖模型真正持續(xù)服務(wù)更多下游場(chǎng)景,這是我最關(guān)注的問(wèn)題。因此,我們也需要把視角進(jìn)一步放寬到整個(gè)生態(tài):從最早的能源轉(zhuǎn)化,到算力,再到Token,最終轉(zhuǎn)化為GDP,形成一條可以持續(xù)進(jìn)行經(jīng)濟(jì)化迭代的完整鏈路。
而且,我們不只是要把國(guó)內(nèi)各種算力資源真正用起來(lái),也在嘗試把這些能力輸出到海外,讓全球資源能夠更好地打通和整合。所以我所說(shuō)的“可持續(xù)”,其實(shí)也包括把具有中國(guó)特色的Token經(jīng)濟(jì)學(xué)真正做起來(lái)。過(guò)去我們講的是Made in China。大家會(huì)發(fā)現(xiàn),我們能夠把中國(guó)具備成本優(yōu)勢(shì)的制造能力,轉(zhuǎn)化為優(yōu)質(zhì)商品并輸出到全球。
今天我們想做的,有點(diǎn)像AI Made in China。也就是說(shuō),把中國(guó)在能源等方面的優(yōu)勢(shì),通過(guò)Token工廠(chǎng)持續(xù)轉(zhuǎn)化為高質(zhì)量的Token,并輸出到全球,最終成為全球的Token 工廠(chǎng)。這是我希望在今年看到的,中國(guó)為世界人工智能發(fā)展帶來(lái)的價(jià)值。
張鵬: 我盡量簡(jiǎn)短一點(diǎn)。前面大家可能都在仰望星空,那我就稍微落地一些。我認(rèn)為,未來(lái) 12 個(gè)月最關(guān)鍵的問(wèn)題,可能還是算力。
因?yàn)閯偛糯蠹乙呀?jīng)提到,不管是模型能力,還是智能體框架,確實(shí)都在顯著提升創(chuàng)造力和生產(chǎn)效率,很多場(chǎng)景下甚至可以帶來(lái)十倍級(jí)的效率提升。但前提是,大家得用得起,也用得上。不能因?yàn)樗懔Σ粔?,用?hù)提了一個(gè)問(wèn)題,結(jié)果模型想了半天還給不出答案,這顯然是不行的。
也正因?yàn)槿绱?,我們很多研究進(jìn)展,包括很多原本想做的事情,事實(shí)上都會(huì)受到制約。前兩年業(yè)界有一句話(huà),叫“講卡傷感情,沒(méi)卡沒(méi)感情”。我覺(jué)得,今天某種程度上又回到了這個(gè)階段,只不過(guò)這一次的背景已經(jīng)不一樣了。
因?yàn)槲覀儸F(xiàn)在正在真正轉(zhuǎn)向推理階段,而之所以會(huì)轉(zhuǎn)向推理階段,是因?yàn)樾枨笳诒l(fā),而且是十倍、百倍地爆發(fā)。剛才也提到,過(guò)去一段時(shí)間需求可能已經(jīng)增長(zhǎng)了十倍,但真實(shí)需求也許是一百倍,那還有大量需求沒(méi)有被滿(mǎn)足。這個(gè)問(wèn)題怎么辦?我想,這可能需要我們一起想辦法。謝謝。





- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




