中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

不能只算token賬

2026-04-07 16:05
來源:澎湃新聞·澎湃號·湃客
字號

1

Anthropic禁止訂閱用戶通過龍蝦等第三方工具接入后,小米大模型團(tuán)隊(duì)負(fù)責(zé)人羅福莉凌晨發(fā)了篇帖子討論這事。

主要內(nèi)容可以概括為兩點(diǎn)。

第一,A社的做法雖然會短期推高使用成本,如果用戶繼續(xù)使用Claude模型,但長期來看會帶來很好的工程紀(jì)律。

工程紀(jì)律的意思是,社區(qū)會因?yàn)槟P统杀旧仙陂_發(fā)產(chǎn)品時做更合理的工程優(yōu)化來提升token的使用效率。

這里她點(diǎn)名批評了龍蝦,上下文管理做得很拉胯,一個用戶請求會觸發(fā)多輪工具調(diào)用,每次都是攜帶長上下文的獨(dú)立API請求。

第二,她呼吁模型廠商不要打價格戰(zhàn),不要靠低價吸引用戶入坑后,又用縮水的模型和不穩(wěn)定的服務(wù)去損害體驗(yàn)。

我們前兩天寫了篇文章,《小米這次也沒把價格打下來》,其中提到MiMo Token Plan目前價格相對其他廠商同等套餐偏貴。

羅福莉沒有直接承認(rèn)這點(diǎn),但間接回答了這個問題:小米的目標(biāo)是“長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù) —— 而不是讓你沖動付款,然后棄船?!?/span>

我們之前文章里提到,MiMo套餐偏貴的事實(shí)其實(shí)跟小米給大眾的主流印象是有差距的,畢竟觀眾更熟悉性價比敘事。

但這也不是小米搞AI后就變了,小米這個定價肯定也談不上賺錢,只是在其他選手虧損搞token傾銷的時候,選擇了更貼近成本的定價策略。

token傾銷這個詞可能有點(diǎn)重,因?yàn)橐且缘陀诔杀臼圪uAI服務(wù)這個標(biāo)準(zhǔn)看,目前行業(yè)里基本沒誰能逃得過。

但有些玩家定價的確相當(dāng)激進(jìn),低價吸引用戶過來后保證不了體驗(yàn),比如我就遇到過某家套餐服務(wù)卡頓甚至不可用的情況。

大模型跟其他傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品不同。傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品邊際成本可以不計(jì),用戶翻倍成本增加很少。大模型產(chǎn)品成本跟用戶規(guī)模比例擴(kuò)張。

而且還因?yàn)槭欠菢?biāo)品,廠商很容易在背后做手腳,稍微降點(diǎn)智用戶不容易察覺,察覺到也沒有實(shí)際證據(jù)。

當(dāng)然,即便存在這些一些問題,我仍然認(rèn)為模型廠商價格戰(zhàn)是利大于弊的,是雙贏的局面。

用戶客觀上因?yàn)閮r格戰(zhàn)得到了便宜,這是加速新技術(shù)采納的決定性因素。

DeepSeek去年的模型并沒有在能力上超過GPT或者Claude,但R1的意義仍然沒有被高估,因?yàn)榘殉杀窘档蛶资秾夹g(shù)普及的促進(jìn)必然強(qiáng)于某個增量SOTA模型。

至于虧錢賣token不可持續(xù),我只能說不是現(xiàn)階段二線廠商配考慮的問題。

Anthropic模型能力頂尖,產(chǎn)品體驗(yàn)差異化,所以哪怕經(jīng)常封號拔網(wǎng)線也一堆用戶求著交錢。

彭博上個月報(bào)道,Anthropic當(dāng)時年化收入已經(jīng)達(dá)到200億美元,相比去年底翻倍還多,這個夸張的增長速度隱隱有取OpenAI而代之的意思了。

但二線廠商之間模型能力并沒有拉開差距,不同廠商輪流領(lǐng)先,性價比是不得不走的路子。

羅福莉評價是對的,龍蝦就是vibe coding出來的一堆屎山。

因?yàn)槭鞘荷?,所以它沒有架構(gòu)設(shè)計(jì),沒有工程優(yōu)化,天生就浪費(fèi)效率。

但它能火起來,能讓一堆專業(yè)的非專業(yè)的用戶愿意用,就已經(jīng)算是功德無量了。

所有二線廠商都應(yīng)該給龍蝦磕一個,我很難想象沒有龍蝦他們得多努力才能證明自己的價值。

這是OpenRouter上不同模型的使用統(tǒng)計(jì)。

在龍蝦火爆之前,你在這個排行里根本看不到二線模型廠商,除了硅谷御四家,其余全是others。

但現(xiàn)在排行榜前幾名,已經(jīng)被阿里、小米、階躍星辰的模型占滿了。

話說新模型出來,免費(fèi)放OpenRouter上吸引大家用一用,已經(jīng)成為國內(nèi)廠商的慣例。OpenRouter現(xiàn)在已經(jīng)淪為PR前沿陣地。

這兩天阿里發(fā)布Qwen3.6,宣傳登上OpenRouter排行榜首。小米MiMo之前也宣傳登頂了OpenRouter。都是免費(fèi)試用。

某種程度上說,龍蝦耗token甚至可以理解成是feature。

大模型研發(fā)門檻很高,但大模型供給一直以來都是不稀缺的,因?yàn)橛脩舨恍枰敲炊嗄P?。龍蝦把性價比放大成了真正的競爭力。

簡單拉下數(shù)據(jù)。MiniMax去年總收入7900萬美元,龍蝦爆火后2月ARR已超1.5億美元。月之暗面發(fā)布K2.5模型后,不到20天收入超去年全年,且海外收入首次超過國內(nèi)。

AI的確在推動各個產(chǎn)業(yè)發(fā)生變革,不過就AI自身而言,至今為止都還沒有跑通獨(dú)立的盈利模式。OpenAI和Anthropic收入在快速增長,但能否覆蓋巨額研發(fā)和資本支出仍有疑問。

至于智譜、MiniMax和月之暗面?zhèn)儯嚯x閉環(huán)的商業(yè)模式就更為遙遠(yuǎn)了。

這種情況下,敘事成為生存的要義。敘事不能只靠畫餅,模型廠商的第一性原理就是模型得有人用。

沒人用,敘事就崩塌了。有人用,越來越多人用,敘事才會變得圓滿。

去年底,月之暗面估值43億美元,現(xiàn)在正以180億美元尋求融資,翻了四倍不止。智譜今天收盤780港幣,是1月份IPO發(fā)行價116港幣的6.7倍。MiniMax的IPO發(fā)行價是165港幣,現(xiàn)在股價是950,也是翻了快6倍。

不能只算token賬。

2

二線模型廠商在成本和規(guī)模壓力下,已經(jīng)有提價動作。但這暫時不會達(dá)到擺脫價格戰(zhàn)的地步。

小米的處境比較特殊,它有自己完整的產(chǎn)品矩陣和硬件生態(tài),MiMo的第一使命是融入并改造這個現(xiàn)有生態(tài)。哪怕不對外賣token,小愛同學(xué)、智能手機(jī)、小米汽車、IoT設(shè)備生態(tài),MiMo都能有大有作為的空間。

智譜、MiniMax、月之暗面?zhèn)儎t處在另一個處境。它們有C端產(chǎn)品,但這個賽道競爭極其慘烈。目前看來獨(dú)立的AI產(chǎn)品,無論是通用助手,還是細(xì)分賽道,字節(jié)、騰訊和阿里都有碾壓性的優(yōu)勢,也有爭奪的意志。

相較之下,API賣token的生意看起來好一些,雖然好得有限。因?yàn)檫@只關(guān)乎模型質(zhì)量,而騰訊和Meta的經(jīng)驗(yàn)表明,模型研發(fā)不只是錢和資源的因素。

但龍蝦窗口期不會無限延續(xù)。

如果龍蝦只是一陣風(fēng),過段時間隨風(fēng)而逝,那自然二線廠商也就不能指望這個出貨渠道了。

如果龍蝦代表的不是一個工具的短暫流行,而是C端AI產(chǎn)品的一種范式,那大科技公司一定會出手。

這些公司有流量、有分發(fā)、有用戶信任,它們會以自己的競品收割市場,并且會優(yōu)先使用自己訓(xùn)練的模型,而不是采購二線廠商的API。

模型跟產(chǎn)品的結(jié)合是大趨勢。阿里打通千問App跟通義模型研發(fā)團(tuán)隊(duì),搞出了組織調(diào)整和人事出走風(fēng)波。姚順雨入職騰訊,也是首先做團(tuán)隊(duì)整合,不同研發(fā)部門之間的整合以及研發(fā)跟產(chǎn)品的整合。

羅福莉批評龍蝦耗token,提到Claude Code更節(jié)省上下文的工程設(shè)計(jì),這是另一個產(chǎn)品需要跟模型打通的案例。

龍蝦架構(gòu)上的天然缺陷,意味著每次工具調(diào)用都攜帶完整的長上下文發(fā)起獨(dú)立請求,用戶的一個操作可能在后臺觸發(fā)十幾輪API調(diào)用。這不僅燒token,也制造延遲,制造不穩(wěn)定。

Claude Code對上下文做精細(xì)管理,知道什么時候該壓縮歷史,什么時候該截?cái)?,怎么在保留任?wù)狀態(tài)的同時減少冗余信息的傳遞。

這背后是Anthropic對自己模型能力邊界的深刻理解。只有模型研發(fā)者,才能把產(chǎn)品和模型調(diào)優(yōu)成渾然一體的東西。

AI產(chǎn)品的第一代范式是,模型作為通用API,產(chǎn)品套在外面。這個范式催生了龍蝦,也催生了無數(shù)套殼應(yīng)用。它降低了創(chuàng)業(yè)門檻,但也帶來了巨大的效率浪費(fèi)。產(chǎn)品不理解模型,模型不適配產(chǎn)品,兩邊都在用蠻力彌補(bǔ)彼此的信息差。

如今第二代范式正在浮現(xiàn):模型與產(chǎn)品深度整合,從架構(gòu)層面共同設(shè)計(jì)。Claude Code是一個樣本:模型不再是被調(diào)用的服務(wù),而是產(chǎn)品本身的一部分。

這個趨勢下,純粹的模型API廠商面臨的壓力會越來越大,沒有產(chǎn)品可能成為它們的致命缺陷。如果競爭力來自模型與應(yīng)用層的深度整合,那API層的價格競爭就是一場慢性消耗。

行業(yè)一直喜歡說模型即產(chǎn)品,用這句話強(qiáng)調(diào)模型的基礎(chǔ)作用和重要性沒問題。但除非你的商業(yè)模式是只賣API,否則模型始終是產(chǎn)品的組成部分,而不是產(chǎn)品的全部。

    本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司