下載客戶(hù)端

登錄

楊植麟、張鵬、夏立雪、羅福莉，聊龍蝦、聊漲價(jià)、聊Agent未來(lái)

澎湃新聞喻琰

2026-03-27 14:19

來(lái)源：澎湃新聞

聽(tīng)全文

OpenClaw小龍蝦的熱潮吹到了北京中關(guān)村論壇會(huì)議上。就在剛剛，3月27日，月之暗面創(chuàng)始人楊植麟主持了一場(chǎng)圍繞OpenClaw與AI開(kāi)源的討論。來(lái)自模型、算力與應(yīng)用層的多位核心從業(yè)者——包括智譜華章CEO張鵬、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪、小米MiMo大模型負(fù)責(zé)人羅福莉及香港大學(xué)助理教授黃超作為嘉賓，圍繞Agent技術(shù)演進(jìn)、Token需求爆發(fā)以及開(kāi)源生態(tài)重構(gòu)展開(kāi)對(duì)話(huà)。在這場(chǎng)對(duì)話(huà)里，智譜華章CEO張鵬回應(yīng)了近期的漲價(jià)熱潮，也坦言，當(dāng)前最大的問(wèn)題是對(duì)算力的需求。楊植麟也問(wèn)羅福莉，小米的模型是怎么做的？羅福莉雖未正面回答，但透露了技術(shù)路線(xiàn)，面向 Agent 時(shí)代的新探索。

以下為對(duì)話(huà)實(shí)錄：

楊植麟：很榮幸今天能邀請(qǐng)到各位重磅嘉賓。大家覆蓋了不同層面：從模型層，到底層算力層，再到更上層的 Agent 層。今天也非常高興能和大家一起探討這個(gè)話(huà)題。我們今天最核心的兩個(gè)關(guān)鍵詞，一個(gè)是“開(kāi)源”，一個(gè)是“Agent”。

我們先從第一個(gè)問(wèn)題開(kāi)始，這個(gè)問(wèn)題想請(qǐng)每位嘉賓都談一談。最近最火的無(wú)疑是 OpenClaw。大家在日常使用 OpenClaw 或類(lèi)似產(chǎn)品時(shí)，覺(jué)得最有想象力、最讓你印象深刻的地方是什么？另外，從技術(shù)角度來(lái)看，你們?nèi)绾慰创裉?OpenClaw 以及相關(guān) Agent 的演進(jìn)？我們先從張鵬開(kāi)始。

張鵬： 好。先感謝植麟的邀請(qǐng)，也感謝主辦方給我這個(gè)機(jī)會(huì)，和大家一起交流。其實(shí)我很早就開(kāi)始玩 OpenClaw 了。那時(shí)候它還不叫 OpenClaw，最早叫 Clawdbot。我自己一直在折騰這些東西，畢竟也是程序員出身，所以對(duì)這類(lèi)產(chǎn)品一直有比較直接的體驗(yàn)。

我覺(jué)得，這件事給大家?guī)?lái)的最大突破，或者說(shuō)最大的“新鮮感”，在于它不再只是程序員或者極客的專(zhuān)屬工具了。普通人也可以比較方便地使用頂尖模型的能力，尤其是在編程和智能體相關(guān)的能力上。

所以到現(xiàn)在為止，我在和大家交流時(shí)，更愿意把 OpenClaw 稱(chēng)作一種“腳手架”。它提供的是一種可能性：在模型能力之上，搭起了一個(gè)足夠穩(wěn)固、足夠方便、同時(shí)又足夠靈活的腳手架。大家可以按照自己的意愿，去調(diào)用底層模型提供的各種新能力。很多過(guò)去受限于“不會(huì)寫(xiě)代碼”或“缺乏其他專(zhuān)業(yè)技能”而無(wú)法實(shí)現(xiàn)的想法，今天只需要通過(guò)很簡(jiǎn)單的交流，就有機(jī)會(huì)把它真正做出來(lái)。對(duì)我來(lái)說(shuō)，這件事的沖擊非常大，也讓我重新認(rèn)識(shí)了這類(lèi)產(chǎn)品的意義。

夏立雪： 其實(shí)我最開(kāi)始使用 OpenClaw 的時(shí)候，并不太適應(yīng)。因?yàn)槲乙呀?jīng)習(xí)慣了和大模型對(duì)話(huà)式交互的方式，所以一開(kāi)始會(huì)覺(jué)得它的響應(yīng)有點(diǎn)慢。

但后來(lái)我意識(shí)到，它和過(guò)去聊天機(jī)器人最大的不同在于：它不是一個(gè)只負(fù)責(zé)“聊天”的東西，而更像是一個(gè)能夠幫我完成大型任務(wù)的人。所以，當(dāng)我后來(lái)開(kāi)始給它布置一些更復(fù)雜的任務(wù)時(shí)，我才真正發(fā)現(xiàn)，它其實(shí)可以完成得很好。

這件事讓我感觸很深。模型從最開(kāi)始按Token進(jìn)行對(duì)話(huà)，到今天變成一個(gè)Agent，變成一個(gè)“龍蝦”，真正開(kāi)始幫你完成任務(wù)，這極大拓展了我們對(duì) AI 的想象空間。但與此同時(shí)，它對(duì)整個(gè)系統(tǒng)能力的要求也顯著提高了。這也是為什么我一開(kāi)始會(huì)覺(jué)得它“有點(diǎn)卡”。

作為基礎(chǔ)設(shè)施底層的廠(chǎng)商，我看到的是，OpenClaw給整個(gè) AI 背后的大型系統(tǒng)和生態(tài)都帶來(lái)了更多機(jī)遇和挑戰(zhàn)。因?yàn)槲覀兘裉焖锌烧{(diào)用的資源，想要支撐這樣一個(gè)快速增長(zhǎng)的時(shí)代，其實(shí)還是不夠的。就拿我們公司來(lái)說(shuō)，從一月底開(kāi)始，我們的Token量基本上每?jī)芍芫头槐叮浆F(xiàn)在已經(jīng)增長(zhǎng)了十倍。上一次看到這種增長(zhǎng)速度，還是 3G 時(shí)代手機(jī)流量快速普及的時(shí)候。

所以我現(xiàn)在有一種很強(qiáng)烈的感覺(jué)：今天的Token用量，就像當(dāng)年大家每個(gè)月只有100MB手機(jī)流量時(shí)的那個(gè)階段。這就是時(shí)代變化的一個(gè)信號(hào)。在這樣的背景下，我們的資源一定要被更好地優(yōu)化、更好地整合，才能讓每一個(gè)人——不只是 AI 行業(yè)里的人，而是整個(gè)社會(huì)中每一個(gè)鮮活的個(gè)體——都真正把 AI 能力用起來(lái)。

所以，作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者，我對(duì)這個(gè)時(shí)代非常激動(dòng)，也非常有感觸。我認(rèn)為這里面還有大量?jī)?yōu)化空間，但我們依然應(yīng)該持續(xù)探索、持續(xù)嘗試。謝謝。

羅福莉： 我自己會(huì)把OpenClaw看作Agent框架層面一個(gè)非常革命性、也非常顛覆性的事件。雖然我知道，我身邊很多做深度Coding （編程）的人，第一選擇可能仍然是 Claude Code，但我相信，只要真正用過(guò)OpenClaw，你就會(huì)很明確地感受到，這個(gè)框架在很多設(shè)計(jì)上其實(shí)是領(lǐng)先的。包括最近Claude Code的不少更新，在我看來(lái)，某種程度上也是在向OpenClaw靠近。

就我自己的使用體驗(yàn)來(lái)說(shuō)，這個(gè)框架給我?guī)?lái)的，更多是一種“隨時(shí)隨地?cái)U(kuò)展想象力”的可能。最開(kāi)始，我只能在桌面端延展自己的創(chuàng)意；但后來(lái)我發(fā)現(xiàn)，OpenClaw真正的價(jià)值在于，它讓你可以在更多場(chǎng)景里持續(xù)推進(jìn)自己的想法。

我覺(jué)得OpenClaw最核心的價(jià)值主要有兩點(diǎn)。第一，它是開(kāi)源的。開(kāi)源非常有利于整個(gè)社區(qū)深入?yún)⑴c、持續(xù)改進(jìn)，并且不斷投入到這個(gè)框架之中。第二，像OpenClaw、Claude Code這樣的框架，本身就是一個(gè)非常重要的前置條件。我認(rèn)為，它們很大的價(jià)值在于，把國(guó)內(nèi)那些還沒(méi)有完全逼近閉源模型、但已經(jīng)位于開(kāi)源模型賽道前列的模型，上限顯著拉高了。

在絕大多數(shù)場(chǎng)景里，我們會(huì)發(fā)現(xiàn)，它的任務(wù)完成度已經(jīng)非常接近Claude最新的模型；同時(shí)，它又把下限保障得很好。因?yàn)樗梢砸揽恳徽議arness（集成架構(gòu)）系統(tǒng)、skills 體系，以及很多初步但有效的設(shè)計(jì)，來(lái)保證任務(wù)完成度和準(zhǔn)確率。

所以，從基座模型的角度來(lái)看，我認(rèn)為這類(lèi)框架一方面保證了基座大模型的下限，另一方面又拉伸了它的上限。除此之外，我覺(jué)得它給整個(gè)社區(qū)帶來(lái)的另一個(gè)重要價(jià)值，是點(diǎn)燃了大家對(duì)于Agent層的想象力。大家開(kāi)始意識(shí)到，在大模型之外、也就是更重要的Agent這一層，其實(shí)還有非常大的空間可以做。

這也是為什么最近社區(qū)里，除了研究員之外，越來(lái)越多的人開(kāi)始參與到這場(chǎng)AGI變革中。也有越來(lái)越多的人，開(kāi)始借助更強(qiáng)的框架，比如harness、scaffold（腳手架）等，在一定程度上替代自己的工作、釋放自己的時(shí)間，去做更有想象力的事情。

黃超： 我感覺(jué)，從交互模式上來(lái)看，OpenClaw這次之所以會(huì)爆火，首先是因?yàn)樗o了大家一種更強(qiáng)的“活人感”。我們其實(shí)做這類(lèi)事情也有一兩年了，但之前像Cursor、Claude Code 這類(lèi) Agent，給人的感覺(jué)更多還是“工具感”。

而這一次，我們看到它通過(guò)IM （即時(shí)通訊）軟件嵌入的交互方式，讓大家更容易產(chǎn)生一種“這是一個(gè)個(gè)人 AI”的感覺(jué)，也更接近大家想象中的Jarvis （漫威漫畫(huà)中鋼鐵俠（Tony Stark）的人工智能助手）那樣的概念。我覺(jué)得，這是它在交互模式上帶來(lái)的一個(gè)非常重要的變化。

另外，它帶給大家的另一個(gè)啟發(fā)，是它的架構(gòu)本身。像Agent Loop（智能體循環(huán)）這樣一種非常簡(jiǎn)單、但又非常高效的框架，再一次被證明是成立的。

同時(shí)，它也讓我們重新思考：我們到底需要的是一個(gè)非常強(qiáng)大的智能體，替我們做很多事；還是需要一個(gè)更輕量級(jí)、像操作系統(tǒng)或腳手架一樣的小管家？

我覺(jué)得它帶來(lái)的是另一種可能：通過(guò)一個(gè)像OpenClaw這樣的輕量級(jí)“龍蝦操作系統(tǒng)”生態(tài)，把整個(gè)社區(qū)真正調(diào)動(dòng)起來(lái)，撬動(dòng)生態(tài)里的各種工具。隨著skills、harness（集成架構(gòu)）這些組件越來(lái)越豐富，也會(huì)有越來(lái)越多的人開(kāi)始設(shè)計(jì)更適用于OpenClaw這類(lèi)系統(tǒng)的應(yīng)用，并進(jìn)一步賦能各行各業(yè)。

所以我覺(jué)得，它天然就和開(kāi)源生態(tài)結(jié)合得非常緊密。這兩點(diǎn)，是它給我?guī)?lái)的最大啟發(fā)。

楊植麟：順著剛才大家一直在討論OpenClaw，我也想接著問(wèn)張鵬一個(gè)問(wèn)題。我們看到最近智譜發(fā)布了新的GLM-5-Turbo 模型。我理解，這個(gè)模型在相關(guān)能力上也做了很大的增強(qiáng)。能不能請(qǐng)你給大家介紹一下，這個(gè)新模型和其他模型相比，有哪些不同之處？另外，我們也觀察到，你們最近有一個(gè)提價(jià)策略。這個(gè)策略反映了怎樣的市場(chǎng)信號(hào)？

張鵬： 前兩天我們確實(shí)緊急更新了一版。當(dāng)然，這其實(shí)是我們整個(gè)發(fā)展目標(biāo)中的一個(gè)階段，只是把它提前拿出來(lái)了。

這次更新最主要的目標(biāo)，還是從原來(lái)“簡(jiǎn)單對(duì)話(huà)”的能力，進(jìn)一步走向“真正干活”的能力。剛才各位提到的一點(diǎn)我非常贊同：OpenClaw讓大家第一次明確感受到，大模型不再只是會(huì)聊天，而是真的能幫我做事。

但“干活”這件事背后，對(duì)模型能力的要求其實(shí)非常高。它需要自己進(jìn)行長(zhǎng)程任務(wù)規(guī)劃，不斷嘗試、不斷壓縮上下文、不斷 debug（調(diào)試），甚至還可能涉及多模態(tài)信息處理。

所以，這對(duì)模型本身的能力要求，和傳統(tǒng)面向?qū)υ?huà)機(jī)器人的通用模型其實(shí)是不一樣的。GLM-5-Turbo就是在這些方面做了針對(duì)性的強(qiáng)化。尤其像剛才提到的這種長(zhǎng)程任務(wù)——比如讓它連續(xù)工作72個(gè)小時(shí)，能夠持續(xù)不斷地自行 loop 執(zhí)行——我們?cè)谶@方面做了很多工作。

大家剛才也提到了Token消耗量的問(wèn)題。讓一個(gè)更聰明的模型去執(zhí)行更復(fù)雜的任務(wù)，資源消耗其實(shí)是非常巨大的。普通用戶(hù)未必能直觀感受到這一點(diǎn)，但最終一定會(huì)體現(xiàn)在賬單上。所以，我們也針對(duì)這方面做了一些優(yōu)化，讓模型在面對(duì)復(fù)雜任務(wù)時(shí)，能夠以更高的效率完成執(zhí)行。這是這次優(yōu)化的幾個(gè)重點(diǎn)方向。

但從本質(zhì)上來(lái)說(shuō)，它的模型架構(gòu)仍然是一種多任務(wù)協(xié)同的通用模型架構(gòu)，只是在能力側(cè)做了更有針對(duì)性的增強(qiáng)。至于提價(jià)，這件事也比較容易解釋。因?yàn)楝F(xiàn)在已經(jīng)不是簡(jiǎn)單地問(wèn)一個(gè)問(wèn)題、模型給出一個(gè)回答了。它背后的思考和推理鏈路會(huì)變得很長(zhǎng)，還會(huì)通過(guò)寫(xiě)代碼的方式與底層基礎(chǔ)設(shè)施交互，不斷調(diào)試，并隨時(shí)修正自己的錯(cuò)誤。這意味著整體消耗量會(huì)非常大。完成一個(gè)任務(wù)所需要的Token量，可能是回答一個(gè)簡(jiǎn)單問(wèn)題時(shí)的十倍，甚至百倍。因此，價(jià)格上相應(yīng)做一些調(diào)整，本質(zhì)上是成本變化的自然結(jié)果。模型更大了，能力更強(qiáng)了，對(duì)應(yīng)的服務(wù)成本也提高了，所以我們希望把它逐步拉回到一個(gè)正常的商業(yè)價(jià)值區(qū)間。

因?yàn)殚L(zhǎng)期依賴(lài)低價(jià)競(jìng)爭(zhēng)，其實(shí)并不利于整個(gè)行業(yè)的發(fā)展。這也是我們的一個(gè)重要考量。我們希望通過(guò)這樣的方式，在商業(yè)化路徑上形成一個(gè)更健康的閉環(huán)，持續(xù)優(yōu)化模型能力，并更長(zhǎng)期、穩(wěn)定地為大家提供更好的模型和相應(yīng)的Token服務(wù)。

楊植麟：非常好的分享。其實(shí)現(xiàn)在開(kāi)源模型和推理算力正在逐漸形成一個(gè)新的生態(tài)。各種各樣的開(kāi)源模型，可以部署在不同的推理算力平臺(tái)上，為用戶(hù)提供更多價(jià)值。隨著 Token量的爆發(fā)，整個(gè)行業(yè)也可能正在從訓(xùn)練時(shí)代逐步走向推理時(shí)代。所以我想請(qǐng)教一下立雪，從基礎(chǔ)設(shè)施層面來(lái)看，這個(gè)推理時(shí)代對(duì)無(wú)問(wèn)芯穹意味著什么？

夏立雪： 感謝植麟。確實(shí)，因?yàn)槲覀兪且患艺Q生于 AI 時(shí)代的基礎(chǔ)設(shè)施廠(chǎng)商，現(xiàn)在也在為Kimi、智譜等公司提供服務(wù)，也在和MiniMax等團(tuán)隊(duì)合作，幫助大家把我們這樣的“Token 工廠(chǎng)”更高效地用起來(lái)。同時(shí)，我們也在和很多高校、科研院所合作。

所以，我們其實(shí)一直都在思考一件事：AGI 時(shí)代所需要的基礎(chǔ)設(shè)施，到底應(yīng)該是什么樣子，以及我們應(yīng)該怎樣一步一步在這個(gè)過(guò)程中去實(shí)現(xiàn)它、推演它。對(duì)這件事，我們已經(jīng)做了比較充分的準(zhǔn)備，也看到了短期、中期和長(zhǎng)期幾個(gè)不同階段需要解決的問(wèn)題。

當(dāng)前最現(xiàn)實(shí)、最緊迫的問(wèn)題，其實(shí)就是剛才大家聊到的：像OpenClaw這類(lèi)Agent產(chǎn)品帶動(dòng)了整個(gè)Token需求的暴增，而這種暴增對(duì)系統(tǒng)效率提出了更高要求。從某種意義上說(shuō)，價(jià)格上漲也是在這種需求壓力之下形成的一種應(yīng)對(duì)方式。

我們一直以來(lái)都是從軟硬件協(xié)同的角度去做布局和解決方案設(shè)計(jì)。包括我們接入了幾乎所有能看到的主流計(jì)算芯片，把國(guó)內(nèi)十幾種芯片、幾十個(gè)不同的算力集群統(tǒng)一連接起來(lái)。這樣，我們就能夠更好地解決AI系統(tǒng)中算力資源緊缺的問(wèn)題。因?yàn)樵谫Y源不足的時(shí)候，最好的辦法，第一是把所有可用資源都盡可能用起來(lái)；第二是讓每一份算力都真正用在刀刃上，讓每一份資源都發(fā)揮出最大的轉(zhuǎn)化效率和價(jià)值。

所以，在當(dāng)下這個(gè)階段，我們要解決的核心問(wèn)題，就是如何進(jìn)一步打造一個(gè)更高效的Token工廠(chǎng)。圍繞這一點(diǎn)，我們做了很多優(yōu)化。比如，讓模型與硬件、顯存等各類(lèi)資源實(shí)現(xiàn)最優(yōu)適配；也在持續(xù)觀察，最新的模型結(jié)構(gòu)與硬件結(jié)構(gòu)之間，是否還能形成更深層次的“化學(xué)反應(yīng)”。

但如果只解決眼前的效率問(wèn)題，其實(shí)還不夠。我們現(xiàn)在做的，本質(zhì)上還是一個(gè)標(biāo)準(zhǔn)化的Token工廠(chǎng)；可面向 Agent 時(shí)代，我們認(rèn)為這遠(yuǎn)遠(yuǎn)不夠。因?yàn)檎鐒偛糯蠹宜f(shuō)，Agent更像是一個(gè)“人”，我們可以直接把任務(wù)交給它去完成。

而我一直非常堅(jiān)定地認(rèn)為，當(dāng)前很多云計(jì)算時(shí)代的基礎(chǔ)設(shè)施，本質(zhì)上還是為程序和人類(lèi)工程師設(shè)計(jì)的，而不是為AI設(shè)計(jì)的。它更像是：我們先做出一套基礎(chǔ)設(shè)施，再提供一個(gè)給人類(lèi)工程師使用的接口，然后再在外面包一層，接入Agent。這種方式，其實(shí)是在用人類(lèi)操作系統(tǒng)的邏輯，限制Agent的發(fā)揮空間。

我舉個(gè)例子。Agent可以在秒級(jí)甚至毫秒級(jí)完成思考并發(fā)起任務(wù)，但我們過(guò)去很多底層API和系統(tǒng)能力，其實(shí)并沒(méi)有為這種調(diào)用頻率做好準(zhǔn)備。因?yàn)閷?duì)人類(lèi)來(lái)說(shuō)，發(fā)起一個(gè)任務(wù)通常是分鐘級(jí)別的，而不是毫秒級(jí)的。所以，我們需要新的能力來(lái)適配這種變化。我們把它理解為一種面向Agent的基礎(chǔ)設(shè)施，也就是要打造一個(gè)更智能化的調(diào)度引擎。這正是我們現(xiàn)在在做的事情。

再往更長(zhǎng)遠(yuǎn)的未來(lái)看，當(dāng)真正的AGI時(shí)代到來(lái)時(shí)，我們甚至認(rèn)為，連基礎(chǔ)設(shè)施本身都應(yīng)該是一個(gè)智能體。也就是說(shuō)，我們正在打造的這套工廠(chǎng)，本身也應(yīng)該具備自我進(jìn)化、自我迭代的能力，能夠形成一個(gè)自主運(yùn)轉(zhuǎn)的組織?？梢园阉斫鉃椋哼@個(gè)系統(tǒng)內(nèi)部甚至?xí)幸粋€(gè)“CEO”，而這個(gè)CEO本身也是一個(gè)Agent。它會(huì)負(fù)責(zé)管理整個(gè)基礎(chǔ)設(shè)施，并根據(jù)AI客戶(hù)的需求，自主提出需求、迭代能力、優(yōu)化系統(tǒng)。

只有這樣，AI與基礎(chǔ)設(shè)施之間才能形成更好的耦合。我們也在做一些相關(guān)探索，比如讓Agent與Agent之間可以更高效地通信，實(shí)現(xiàn)cache-to-cache（緩存到緩存）這類(lèi)能力。我們一直在思考，基礎(chǔ)設(shè)施的發(fā)展不應(yīng)該是一個(gè)割裂的過(guò)程，不應(yīng)該只是“我接收一個(gè)需求，再去機(jī)械執(zhí)行”，而應(yīng)該不斷產(chǎn)生更豐富的化學(xué)反應(yīng)。

我認(rèn)為，只有做到這一點(diǎn)，才真正實(shí)現(xiàn)了所謂的軟硬協(xié)同，也真正實(shí)現(xiàn)了算法與基礎(chǔ)設(shè)施的協(xié)同。

楊植麟：接下來(lái)想問(wèn)問(wèn)福莉。小米最近發(fā)布了新的模型，也在持續(xù)推進(jìn)開(kāi)源和背后的相關(guān)技術(shù)，我覺(jué)得這對(duì)整個(gè)社區(qū)做出了很大的貢獻(xiàn)。所以也想請(qǐng)你談?wù)?，你覺(jué)得小米在做大模型這件事上，有什么獨(dú)特的優(yōu)勢(shì)？

羅福莉： 我想先把“小米做大模型有什么獨(dú)特優(yōu)勢(shì)”這個(gè)問(wèn)題放一放。我更想談的，其實(shí)是中國(guó)大模型團(tuán)隊(duì)在做基座模型這件事上的整體優(yōu)勢(shì)，因?yàn)槲矣X(jué)得這個(gè)話(huà)題更有普遍價(jià)值。

大概從兩年前開(kāi)始，我就已經(jīng)看到，中國(guó)的基座模型團(tuán)隊(duì)在這個(gè)方向上出現(xiàn)了非常重要的突破。這個(gè)突破在于：在有限算力，尤其是在NVLink互聯(lián)帶寬受限的情況下，我們?nèi)绾瓮黄七@些硬件條件帶來(lái)的限制，去做一些看起來(lái)像是在為效率妥協(xié)、但本質(zhì)上卻是模型結(jié)構(gòu)創(chuàng)新的工作。比如DeepSeek V2、V3系列中的細(xì)粒度MoE（混合專(zhuān)家模型）和MLA（多頭潛在注意力）等。后來(lái)我們看到，這類(lèi)創(chuàng)新其實(shí)帶來(lái)了一場(chǎng)真正的變化。

這個(gè)變化在于：當(dāng)算力預(yù)算相對(duì)固定的時(shí)候，我們?nèi)绾伟淹瑯右环菟懔λ苓_(dá)到的智能水平推到最高。我覺(jué)得DeepSeek的出現(xiàn)，給了國(guó)內(nèi)所有基座模型團(tuán)隊(duì)很大的勇氣和信心。雖然到了今天，我們自己的國(guó)產(chǎn)芯片，無(wú)論是推理芯片還是訓(xùn)練芯片，都已經(jīng)在不斷進(jìn)步，但正是在此前那種受限環(huán)境下，反而逼出了我們對(duì)“更高訓(xùn)練效率、更低推理成本”的全新探索。

比如最近出現(xiàn)的hybrid sparse、linear attention等結(jié)構(gòu)方向。包括DeepSeek的相關(guān)探索，Kimi的相關(guān)方案，以及小米面向下一代模型結(jié)構(gòu)所做的一些研究。它們都指向同一個(gè)問(wèn)題：當(dāng)我們進(jìn)入Agent時(shí)代之后，模型結(jié)構(gòu)到底應(yīng)該如何進(jìn)一步演化。

我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要？因?yàn)閯偛盼覀円恢痹谟懻揙penClaw。只要你真正用過(guò)OpenClaw，就會(huì)發(fā)現(xiàn)它往往是“越用越好用，越用越聰明”。而它成立的一個(gè)前提，就是推理階段必須擁有足夠長(zhǎng)的context。Long context（長(zhǎng)文本）其實(shí)已經(jīng)是一個(gè)被討論了很久的話(huà)題，但直到今天，大家才真正開(kāi)始意識(shí)到：不是模型做不到百萬(wàn)級(jí)甚至千萬(wàn)級(jí)上下文，而是如果推理成本太高、速度太慢，這件事就沒(méi)有現(xiàn)實(shí)價(jià)值。

所以，真正關(guān)鍵的問(wèn)題是：你能不能在100萬(wàn)甚至1000萬(wàn)級(jí)context的情況下，把推理成本打下來(lái)，把速度提上去。只有在這種前提下，用戶(hù)才會(huì)愿意把真正具有高生產(chǎn)力價(jià)值的任務(wù)交給模型，模型也才有機(jī)會(huì)在長(zhǎng)上下文環(huán)境中完成更高復(fù)雜度的任務(wù)。甚至可以說(shuō)，只有到了1000萬(wàn)級(jí)、上億級(jí)上下文的階段，我們才可能真正看到模型的自我迭代能力被釋放出來(lái)。

所謂模型的自我迭代，就是它能夠在一個(gè)復(fù)雜環(huán)境里，依靠超強(qiáng)的上下文能力，完成對(duì)自身的持續(xù)進(jìn)化。這個(gè)進(jìn)化既可能發(fā)生在框架層，也可能發(fā)生在模型參數(shù)層。因?yàn)樵谖铱磥?lái)，長(zhǎng)上下文本身其實(shí)就是對(duì)參數(shù)能力的一種外延和增強(qiáng)。

所以，未來(lái)真正的競(jìng)爭(zhēng)會(huì)是一個(gè)全方位的競(jìng)爭(zhēng)：一方面，你能不能做出原生適配長(zhǎng)上下文的模型架構(gòu)；另一方面，你能不能在推理側(cè)真正把 long-context efficiency 做出來(lái)。除此之外，還包括你能否在預(yù)訓(xùn)練階段就把這類(lèi)架構(gòu)打牢，以及在后訓(xùn)練階段，能不能把模型在真實(shí)長(zhǎng)程任務(wù)上的穩(wěn)定性和能力上限繼續(xù)往上推。

我們現(xiàn)在也在思考，怎樣構(gòu)造更有效的學(xué)習(xí)算法；怎樣采集在100萬(wàn)、1000萬(wàn)、甚至更長(zhǎng)上下文里，真正具有長(zhǎng)期依賴(lài)關(guān)系的文本；以及怎樣結(jié)合復(fù)雜環(huán)境，生成高質(zhì)量的軌跡數(shù)據(jù)。這些，都是我們正在持續(xù)推進(jìn)的事情。

但我能看到的更長(zhǎng)期趨勢(shì)是：隨著大模型本身在飛速進(jìn)步，再疊加Agent框架的加持，推理需求一定會(huì)繼續(xù)迅速增長(zhǎng)。就像剛才立雪提到的，過(guò)去一段時(shí)間里，Token需求已經(jīng)增長(zhǎng)了接近十倍。那么今年，整個(gè)Token需求會(huì)不會(huì)增長(zhǎng)到一百倍？這其實(shí)已經(jīng)把競(jìng)爭(zhēng)帶到了另一個(gè)維度：不僅是模型之間的競(jìng)爭(zhēng)，也是算力、推理芯片，甚至能源層面的競(jìng)爭(zhēng)。

楊植麟：對(duì)，非常有洞見(jiàn)的分享。下面想問(wèn)一下黃超。你也開(kāi)發(fā)了一些非常有影響力的Agent項(xiàng)目，包括像nanobrowser這樣的項(xiàng)目，在社區(qū)里也積累了很多用戶(hù)和粉絲。想請(qǐng)你談?wù)劊瑥募夹g(shù)或者應(yīng)用層面來(lái)看，接下來(lái)有哪些值得重點(diǎn)關(guān)注的方向？

黃超：感謝植麟。我覺(jué)得，如果把Agent技術(shù)抽象出來(lái)，核心大致有幾個(gè)模塊：planning、memory 和 tool use。

先說(shuō)planning（計(jì)劃）。我覺(jué)得現(xiàn)在最大的問(wèn)題，仍然出現(xiàn)在長(zhǎng)程任務(wù)和復(fù)雜上下文上。比如一個(gè)任務(wù)可能需要500步，甚至更多步驟，很多模型未必能夠做好規(guī)劃。我認(rèn)為，本質(zhì)上還是因?yàn)槟Ｐ筒痪邆渥銐虻碾[性知識(shí)。尤其是在很多復(fù)雜的垂直領(lǐng)域，這個(gè)問(wèn)題會(huì)更加突出。未來(lái)一個(gè)很重要的方向，是把已有的復(fù)雜任務(wù)知識(shí)更系統(tǒng)地固化到模型中。

當(dāng)然，從skills（能力）的角度來(lái)看，包括harness在內(nèi)的很多機(jī)制，本質(zhì)上也是在緩解planning過(guò)程中帶來(lái)的錯(cuò)誤。因?yàn)楦哔|(zhì)量的skill，其實(shí)就是在幫助模型完成一些本來(lái)較難的任務(wù)。這是planning這一部分。

再說(shuō)memory（記憶）。我的感受是，memory始終會(huì)面臨一些根本性問(wèn)題，比如信息壓縮不準(zhǔn)確、表達(dá)失真等。隨著長(zhǎng)程任務(wù)和復(fù)雜場(chǎng)景越來(lái)越多，memory的需求也會(huì)迅速膨脹，這本身就會(huì)給整個(gè)系統(tǒng)帶來(lái)很大壓力。

但現(xiàn)在，包括各種“龍蝦”在內(nèi)，很多系統(tǒng)采用的memory方案其實(shí)都還比較簡(jiǎn)單，例如基于文件系統(tǒng)、Markdown文件，或者通過(guò)共享文件的方式來(lái)管理memory。我覺(jué)得未來(lái)的memory很可能會(huì)走向分層設(shè)計(jì)，同時(shí)也要想辦法讓它更加通用。因?yàn)檎f(shuō)實(shí)話(huà)，當(dāng)前的memory機(jī)制其實(shí)很難做到真正的通用。比如coding 場(chǎng)景、deep research 場(chǎng)景、多模態(tài)場(chǎng)景，它們的數(shù)據(jù)模態(tài)差異都非常大。如何針對(duì)這些不同類(lèi)型的memory做更好的檢索和索引，并進(jìn)一步提高效率，我覺(jué)得這會(huì)一直是一個(gè)關(guān)鍵方向。

另外一點(diǎn)是，OpenClaw這類(lèi)系統(tǒng)把創(chuàng)建Agent的門(mén)檻大幅降低之后，未來(lái)可能不會(huì)只有一個(gè)Agent。比如我們已經(jīng)看到，Kimi也在嘗試Agent Swarm這樣的機(jī)制。也就是說(shuō)，未來(lái)每個(gè)人可能擁有的不是一個(gè)“龍蝦”，而是一群“龍蝦”。

而一群Agent所帶來(lái)的上下文規(guī)模，相比單個(gè)Agent會(huì)大得多。這也會(huì)進(jìn)一步加大memory的壓力?，F(xiàn)在其實(shí)還沒(méi)有一套特別成熟的機(jī)制，去管理這種多Agent帶來(lái)的海量上下文。尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類(lèi)任務(wù)中，不管是對(duì)模型本身，還是對(duì)整個(gè)Agent架構(gòu)，壓力都會(huì)很大。

最后是tool use。我覺(jué)得在這一塊，現(xiàn)在整個(gè)skill生態(tài)仍然存在不少問(wèn)題。MCP當(dāng)年暴露出來(lái)的一些問(wèn)題，其實(shí)在今天依然存在，比如質(zhì)量缺乏保障，以及潛在的安全風(fēng)險(xiǎn)。現(xiàn)在雖然skill很多，但高質(zhì)量的skill其實(shí)仍然偏少。低質(zhì)量的skill會(huì)顯著影響Agent完成任務(wù)的效果；與此同時(shí)，skill本身也可能存在惡意注入等問(wèn)題。

所以在這一塊，我覺(jué)得很大程度上還是需要依靠整個(gè)社區(qū)，一起把skill生態(tài)建設(shè)得更好。甚至進(jìn)一步思考，怎樣讓系統(tǒng)在執(zhí)行過(guò)程中演化出新的skill?？偟膩?lái)說(shuō)，我覺(jué)得無(wú)論是planning、memory，還是skill，都是當(dāng)前一線(xiàn)最現(xiàn)實(shí)的痛點(diǎn)，也都是未來(lái)非常重要的演進(jìn)方向。

楊植麟：可以看到，剛才兩位嘉賓其實(shí)是從不同視角討論了同一個(gè)問(wèn)題。隨著任務(wù)復(fù)雜度不斷提升，上下文規(guī)模也會(huì)迅速膨脹。一方面，模型層面可以繼續(xù)提升原生上下文長(zhǎng)度；另一方面，在Agent和harness層面，像剛才提到的planning、memory以及各類(lèi)輔助機(jī)制，也能夠幫助模型在既有能力邊界內(nèi)支撐更復(fù)雜的任務(wù)。我覺(jué)得這兩個(gè)方向接下來(lái)會(huì)進(jìn)一步產(chǎn)生化學(xué)反應(yīng)，從而提升系統(tǒng)完成復(fù)雜任務(wù)的能力。

最后，我們做一個(gè)開(kāi)放式展望。想請(qǐng)各位用一個(gè)詞，來(lái)描述接下來(lái)12個(gè)月大模型發(fā)展的趨勢(shì)，以及你們的期待。

黃超：說(shuō)實(shí)話(huà)，在AI領(lǐng)域，12個(gè)月聽(tīng)起來(lái)都已經(jīng)很遙遠(yuǎn)了，甚至很難判斷12個(gè)月之后會(huì)發(fā)展成什么樣。但如果一定要用一個(gè)詞來(lái)概括，我會(huì)選“生態(tài)”。

我覺(jué)得現(xiàn)在OpenClaw讓整個(gè)社區(qū)非?；钴S，這是一個(gè)很好的開(kāi)始。但未來(lái)Agent真正重要的，不只是成為個(gè)人助手，而是要進(jìn)一步轉(zhuǎn)化為真正能一起工作的“打工人”，或者說(shuō)coworker?，F(xiàn)在很多人使用它，可能更多還是出于新鮮感，或者覺(jué)得好玩。但未來(lái)，只有當(dāng)這些“龍蝦”真正沉淀下來(lái)，成為大家穩(wěn)定的生產(chǎn)工具、協(xié)作伙伴，這件事才算真正跑通。

而這件事離不開(kāi)生態(tài)的共同建設(shè)。開(kāi)源在這里面非常重要。因?yàn)橹挥邪严嚓P(guān)的技術(shù)探索、模型能力、工具能力持續(xù)開(kāi)放出來(lái)，整個(gè)生態(tài)才可能共同推進(jìn)。無(wú)論是模型本身的迭代，還是 skills 平臺(tái)的演進(jìn)，或者各種工具鏈的完善，我覺(jué)得都需要圍繞 Agent 去建立一個(gè)更好的生態(tài)。

從我自己的觀察來(lái)看，未來(lái)一個(gè)很明顯的問(wèn)題是：軟件到底還是不是主要給人用的？我覺(jué)得未必。未來(lái)很多軟件可能不再以人類(lèi)為中心，因?yàn)槿祟?lèi)需要GUI（圖形用戶(hù)界面），但很多系統(tǒng)可能會(huì)越來(lái)越偏向Agent-native，也就是原生面向Agent使用。

這樣一來(lái)，人類(lèi)可能只會(huì)保留那些真正讓自己感到愉悅的交互，而大量真正執(zhí)行性的工作，會(huì)逐漸轉(zhuǎn)移給Agent。所以我覺(jué)得，現(xiàn)在整個(gè)生態(tài)其實(shí)已經(jīng)在發(fā)生變化：從GUI、MCP（模型上下文協(xié)議），逐漸轉(zhuǎn)向 CLI（命令行界面）這種模式。接下來(lái)，不管是軟件系統(tǒng)、數(shù)據(jù)結(jié)構(gòu)，還是各種技術(shù)棧，本質(zhì)上都需要朝著 Agent-native 的方向重構(gòu)。只有這樣，整個(gè) Agent 生態(tài)的發(fā)展才會(huì)更加豐富。

羅福莉： 我覺(jué)得，把這個(gè)問(wèn)題收縮到一年的尺度非常有意義。因?yàn)槿绻褧r(shí)間拉到五年，在我對(duì)AGI的理解里，很多事情幾乎已經(jīng)是必然會(huì)發(fā)生的了。所以，如果要用一個(gè)詞來(lái)概括接下來(lái)一年里AGI進(jìn)程中最關(guān)鍵的一件事，我會(huì)選“進(jìn)化”。

雖然這個(gè)詞聽(tīng)起來(lái)有一點(diǎn)抽象，但我最近對(duì)它有了更具體、也更務(wù)實(shí)的理解。過(guò)去一年，大家已經(jīng)多次提到這件事，但直到最近，我才真正開(kāi)始感受到，“自進(jìn)化”這件事其實(shí)已經(jīng)開(kāi)始具備比較可行的實(shí)現(xiàn)路徑。

其中一個(gè)很重要的原因在于，隨著模型能力增強(qiáng)，我們逐漸意識(shí)到，在過(guò)去那種單純對(duì)話(huà)式的范式下，預(yù)訓(xùn)練模型的上限其實(shí)并沒(méi)有被真正發(fā)揮出來(lái)。而今天，這個(gè)上限正在被Agent框架逐步激活。

我們現(xiàn)在已經(jīng)摸到這個(gè)邊界了。尤其是當(dāng)模型開(kāi)始執(zhí)行更長(zhǎng)時(shí)間的任務(wù)時(shí)，我們會(huì)發(fā)現(xiàn)，它其實(shí)能夠自己學(xué)習(xí)、自己進(jìn)化。一個(gè)很簡(jiǎn)單的實(shí)驗(yàn)是：在現(xiàn)有框架上，疊加一個(gè)可驗(yàn)證的目標(biāo)約束，再給它設(shè)置一個(gè)loop，讓它持續(xù)圍繞這個(gè)目標(biāo)進(jìn)行迭代優(yōu)化。你就會(huì)發(fā)現(xiàn)，模型會(huì)不斷拿出更優(yōu)的方案。

如果這種自進(jìn)化機(jī)制可以持續(xù)運(yùn)轉(zhuǎn)，那么它的潛力會(huì)非常大。現(xiàn)在其實(shí)很多國(guó)內(nèi)模型已經(jīng)能夠穩(wěn)定跑上一到兩天了。當(dāng)然，這和任務(wù)難度有關(guān)。比如在一些科研任務(wù)中，模型去探索更優(yōu)的結(jié)構(gòu)設(shè)計(jì)，因?yàn)檫@類(lèi)任務(wù)存在明確的評(píng)估標(biāo)準(zhǔn)，例如更低的 PPL（Perplexity，困惑度），這就意味著它具備可驗(yàn)證性。在這種確定性較強(qiáng)的任務(wù)上，我們已經(jīng)看到，模型能夠自主優(yōu)化并持續(xù)執(zhí)行兩三天。

所以從我的角度來(lái)看，自進(jìn)化是一個(gè)真正可能創(chuàng)造新東西的方向。它不是簡(jiǎn)單地替代人類(lèi)已有的生產(chǎn)力，而是像頂尖科學(xué)家一樣，去探索世界上原本還不存在的東西。一年前，我還會(huì)覺(jué)得這個(gè)過(guò)程大概要三到五年；但到了最近，我反而覺(jué)得這個(gè)時(shí)間窗口應(yīng)該縮短到一到兩年。

也就是說(shuō)，我們可能很快就能看到：在一個(gè)很強(qiáng)的自進(jìn)化Agent框架加持下，大模型對(duì)科學(xué)研究帶來(lái)至少指數(shù)級(jí)的加速。因?yàn)槲易罱呀?jīng)很明顯地觀察到，我們組內(nèi)做大模型研究的同學(xué)，他們的workflow本身就是高度不確定、又高度依賴(lài)創(chuàng)造力的。而在這種情況下，借助Claude Code，再結(jié)合非常頂尖的模型，研究效率基本上已經(jīng)可以提升接近十倍。

所以我非常期待這種范式未來(lái)能夠輻射到更廣泛的學(xué)科和領(lǐng)域。我覺(jué)得，這會(huì)是一件非常重要的事情。

夏立雪： 我的關(guān)鍵詞是“可持續(xù)”。因?yàn)槲铱吹剑麄€(gè)行業(yè)的發(fā)展仍處在一個(gè)長(zhǎng)期演進(jìn)的過(guò)程中，我們也希望它具備長(zhǎng)久的生命力。從基礎(chǔ)設(shè)施角度看，一個(gè)非?，F(xiàn)實(shí)的問(wèn)題是，資源終究是有限的，就像我們過(guò)去談“可持續(xù)發(fā)展”時(shí)反復(fù)強(qiáng)調(diào)的那樣。

我們現(xiàn)在作為一家Token工廠(chǎng)，能否持續(xù)、穩(wěn)定、大規(guī)模地向外提供可用的Token，讓頂尖模型真正持續(xù)服務(wù)更多下游場(chǎng)景，這是我最關(guān)注的問(wèn)題。因此，我們也需要把視角進(jìn)一步放寬到整個(gè)生態(tài)：從最早的能源轉(zhuǎn)化，到算力，再到Token，最終轉(zhuǎn)化為GDP，形成一條可以持續(xù)進(jìn)行經(jīng)濟(jì)化迭代的完整鏈路。

而且，我們不只是要把國(guó)內(nèi)各種算力資源真正用起來(lái)，也在嘗試把這些能力輸出到海外，讓全球資源能夠更好地打通和整合。所以我所說(shuō)的“可持續(xù)”，其實(shí)也包括把具有中國(guó)特色的Token經(jīng)濟(jì)學(xué)真正做起來(lái)。過(guò)去我們講的是Made in China。大家會(huì)發(fā)現(xiàn)，我們能夠把中國(guó)具備成本優(yōu)勢(shì)的制造能力，轉(zhuǎn)化為優(yōu)質(zhì)商品并輸出到全球。

今天我們想做的，有點(diǎn)像AI Made in China。也就是說(shuō)，把中國(guó)在能源等方面的優(yōu)勢(shì)，通過(guò)Token工廠(chǎng)持續(xù)轉(zhuǎn)化為高質(zhì)量的Token，并輸出到全球，最終成為全球的Token 工廠(chǎng)。這是我希望在今年看到的，中國(guó)為世界人工智能發(fā)展帶來(lái)的價(jià)值。

張鵬： 我盡量簡(jiǎn)短一點(diǎn)。前面大家可能都在仰望星空，那我就稍微落地一些。我認(rèn)為，未來(lái) 12 個(gè)月最關(guān)鍵的問(wèn)題，可能還是算力。

因?yàn)閯偛糯蠹乙呀?jīng)提到，不管是模型能力，還是智能體框架，確實(shí)都在顯著提升創(chuàng)造力和生產(chǎn)效率，很多場(chǎng)景下甚至可以帶來(lái)十倍級(jí)的效率提升。但前提是，大家得用得起，也用得上。不能因?yàn)樗懔Σ粔?，用?hù)提了一個(gè)問(wèn)題，結(jié)果模型想了半天還給不出答案，這顯然是不行的。

也正因?yàn)槿绱?，我們很多研究進(jìn)展，包括很多原本想做的事情，事實(shí)上都會(huì)受到制約。前兩年業(yè)界有一句話(huà)，叫“講卡傷感情，沒(méi)卡沒(méi)感情”。我覺(jué)得，今天某種程度上又回到了這個(gè)階段，只不過(guò)這一次的背景已經(jīng)不一樣了。

因?yàn)槲覀儸F(xiàn)在正在真正轉(zhuǎn)向推理階段，而之所以會(huì)轉(zhuǎn)向推理階段，是因?yàn)樾枨笳诒l(fā)，而且是十倍、百倍地爆發(fā)。剛才也提到，過(guò)去一段時(shí)間需求可能已經(jīng)增長(zhǎng)了十倍，但真實(shí)需求也許是一百倍，那還有大量需求沒(méi)有被滿(mǎn)足。這個(gè)問(wèn)題怎么辦？我想，這可能需要我們一起想辦法。謝謝。

責(zé)任編輯：宦艷紅

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#楊植麟 #張鵬 #羅福莉 #龍蝦 #Agent