從集體降價(jià)到集體漲價(jià)，“Token經(jīng)濟(jì)學(xué)”為何兩年風(fēng)向突變

澎湃新聞?dòng)浾?張靜

2026-04-01 14:09

來源：澎湃新聞

Token是AI時(shí)代的“新貨幣”。2024年，AI價(jià)格戰(zhàn)打響，Token以“厘”計(jì)價(jià)；2026年，算力需求引爆，模型廠商和云廠商的Token集體漲價(jià)。

在過去兩年里，大模型行業(yè)經(jīng)歷了從價(jià)格戰(zhàn)到價(jià)值戰(zhàn)的劇烈轉(zhuǎn)折，Token的價(jià)值正被重新審視。在工資、獎(jiǎng)金、股權(quán)之外，Token甚至成為硅谷工程師薪資談判的新籌碼。圍繞Token的生態(tài)布局與資源爭奪戰(zhàn)已然打響。

從降價(jià)潮到漲價(jià)潮

2026年，模型廠商和云廠商的Token集體漲價(jià)。今年以來，智譜已經(jīng)兩度發(fā)布漲價(jià)通告。3月16日，智譜推出面向OpenClaw場(chǎng)景深度優(yōu)化的基座模型GLM-5-Turbo，API價(jià)格上調(diào)20%。在面向個(gè)人和企業(yè)級(jí)用戶的“龍蝦”套餐中，Claw體驗(yàn)月卡39元/月，含3500萬Token，Claw進(jìn)階月卡價(jià)格為99元/月，含1億Token。2月份，智譜發(fā)布Coding Plan調(diào)價(jià)公告，“由于GLM Coding Plan市場(chǎng)需求持續(xù)強(qiáng)勁增長，用戶規(guī)模與調(diào)用量快速提升”，決定取消首購優(yōu)惠，保留按季按年訂閱優(yōu)惠，套餐價(jià)格整體漲幅自30%起。

除了模型廠商，云廠商也在集體漲價(jià)。因Coding Plan訂閱火爆，阿里云模型API調(diào)用量暴漲，3月4日宣布階段性調(diào)整首購優(yōu)惠，每日限時(shí)限量供應(yīng)，售完即止。3月18日，阿里云表示，因全球AI需求爆發(fā)、供應(yīng)鏈漲價(jià)，行業(yè)核心硬件采購成本顯著上漲，4月18日起將調(diào)整AI算力、CPFS（智算版）等服務(wù)價(jià)格。平頭哥真武810E等算力卡相關(guān)服務(wù)上漲5%-34%，CPFS（智算版）上漲30%。

百度智能云同樣宣布，4月18日起，AI算力相關(guān)產(chǎn)品服務(wù)上調(diào)約5%-30%，并行文件存儲(chǔ)等上調(diào)約30%。騰訊云宣布自3月13日起，GLM 5、MiniMax 2.5、Kimi 2.5模型結(jié)束公測(cè)，轉(zhuǎn)為正式商用服務(wù)，根據(jù)模型調(diào)用按量計(jì)費(fèi)?；煸盗心Ｐ蛢r(jià)格也有調(diào)整，Tencent HY2.0 Instruct模型輸入價(jià)格從0.0008元/千tokens上漲為0.004505元/千tokens，輸出價(jià)格從0.002元/千tokens上漲為0.01113元/千tokens。

然而，就在兩年前，Token “降價(jià)潮”記憶猶新。

2024年“百模大戰(zhàn)”，彼時(shí)的大模型行業(yè)尚處于激烈的價(jià)格戰(zhàn)之中，云廠商與模型廠商競(jìng)相降價(jià)、送Token。

當(dāng)年5月，字節(jié)跳動(dòng)以0.0008元/千 tokens的價(jià)格掀起大模型價(jià)格戰(zhàn)，隨后阿里云跟進(jìn)，宣布通義千問最高降價(jià)97%，彼時(shí)通義千問GPT-4級(jí)主力模型Qwen-Long輸入價(jià)格從0.02元/千 tokens降至0.0005元/千 tokens。同期，智譜的新注冊(cè)用戶贈(zèng)送額度從500萬Token提升至2500萬Token。

用較低成本訓(xùn)練出高性能大模型的DeepSeek，去年3月揭曉其V3/R1推理系統(tǒng)背后的關(guān)鍵信息，通過優(yōu)化吞吐和延遲，如果所有Token按照DeepSeek-R1的定價(jià)計(jì)算，成本利潤率可達(dá)545%。

技術(shù)是模型降價(jià)的底氣。字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎總裁譚待曾在2024年的AI降價(jià)潮中表示，降價(jià)的基本邏輯是有信心用技術(shù)手段降低成本，市場(chǎng)也需要更低價(jià)的大模型。

“前兩年算力需求方更多是企業(yè)，現(xiàn)在是個(gè)人算力 ‘饑餓’，推動(dòng)了AI創(chuàng)企及大廠的商業(yè)模式轉(zhuǎn)向Token消耗量?！笨焖悸胙芯吭涸洪L、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長田豐表示。

在過去兩年里，模型快速迭代，智能體應(yīng)用大幅增長，從而帶動(dòng)算力需求持續(xù)攀升，高性價(jià)比的推理顯卡產(chǎn)能有限，內(nèi)存等核心硬件及相關(guān)基礎(chǔ)設(shè)施成本顯著上漲。硅谷科技分析、咨詢與投資公司Navica首席執(zhí)行官伯納德·戈?duì)柕牵˙ernard Golden）表示，整個(gè)行業(yè)都在瘋狂尋求更多算力。

供需失衡之下，漲價(jià)成為必然。

“一個(gè)更聰明的模型執(zhí)行更復(fù)雜的任務(wù)，消耗的資源是巨大的?！敝亲VCEO張鵬日前在回應(yīng)提價(jià)策略時(shí)表示，智能體執(zhí)行任務(wù)背后涉及的思考和推理鏈路更長，還會(huì)通過寫代碼的方式與底層基礎(chǔ)設(shè)施交互，不斷調(diào)試并隨時(shí)修正錯(cuò)誤，完成一個(gè)任務(wù)所需要的Token量是回答一個(gè)簡單問題的十倍甚至百倍。價(jià)格調(diào)整的本質(zhì)是成本在變化，“模型更大了，能力更強(qiáng)了，對(duì)應(yīng)的服務(wù)成本也提高了，所以我們希望把它逐步拉回一個(gè)正常的商業(yè)價(jià)值區(qū)間，長期依賴低價(jià)競(jìng)爭并不利于行業(yè)發(fā)展。”

Token調(diào)用量兩年增長千倍

過去兩年以來，軟件供應(yīng)商通過標(biāo)準(zhǔn)化的API接口，陸續(xù)將文本生成、圖像生成及語音生成等能力集成到客戶服務(wù)平臺(tái)、營銷素材生成、服務(wù)機(jī)器人等現(xiàn)有產(chǎn)品中。企業(yè)用戶通過API接口調(diào)用大模型能力，按調(diào)用量或訂閱方式計(jì)費(fèi)，降低使用門檻和前期投入。畢竟，單張H100 GPU的成本約25000美元，單一系統(tǒng)中配置多張GPU的開支將更高。

這種服務(wù)模式讓大模型能快速觸達(dá)海量用戶，Token調(diào)用量急劇攀升。國家數(shù)據(jù)局局長劉烈宏日前披露，截至2025年年底，全國已建成高質(zhì)量數(shù)據(jù)集超過了10萬個(gè)。到今年3月，中國日均Token調(diào)用量已超140萬億，相比2024年初的1000億增長了1000多倍，相比2025年底的100萬億，三個(gè)月時(shí)間又增長了40%多。

田豐對(duì)澎湃科技表示，2024年，訓(xùn)練的算力需求超50%，到2025年，情況完全逆轉(zhuǎn)。如果說，兩年前是百“?！贝髴?zhàn)，那么現(xiàn)在是百“蝦”大戰(zhàn)。

推理需求大爆發(fā)，推理服務(wù)與Token消耗深度綁定，是當(dāng)前體量最大、增長最快的算力場(chǎng)景。模型性能持續(xù)提升推動(dòng)Token消耗量暴漲，AI編程、“龍蝦”（OpenClaw）等智能體應(yīng)用的廣泛滲透則讓Token需求井噴。OpenClaw被戲稱為“Token黑洞”。對(duì)于使用龍蝦的企業(yè)和個(gè)人來說，Token是最大的成本瓶頸。

田豐表示，智能體自動(dòng)執(zhí)行任務(wù)的Token消耗量是傳統(tǒng)問答的4-15倍。AI創(chuàng)業(yè)者羅璇使用OpenClaw完成復(fù)雜調(diào)研任務(wù)需耗費(fèi)數(shù)百萬甚至更多Token。為了找到更便宜的Token，他的經(jīng)驗(yàn)是注冊(cè)云廠商或模型廠商的新用戶，獲取免費(fèi)Token，但依然直呼“Token太貴”。

編程、聊天、辦公等算力消耗以Token為計(jì)，從更廣義的算力消耗來看，以圖片數(shù)量計(jì)價(jià)的圖片生成，以及以時(shí)長和分辨率計(jì)價(jià)的視頻生成，同樣消耗大量算力。OpenAI關(guān)閉Sora視頻應(yīng)用便是例證。運(yùn)行視頻生成服務(wù)需消耗龐大計(jì)算資源和電力，這對(duì)任何企業(yè)而言都是一筆巨額開支，而關(guān)閉Sora則將釋放大量算力資源。

算力需求帶動(dòng)的不僅僅是GPU需求的增長，所有相關(guān)的硬件都會(huì)被連帶波動(dòng)，并成為其中的一個(gè)制約因素。

“包括冷卻、照明、服務(wù)器用電，數(shù)據(jù)中心的電力成本占60%左右，現(xiàn)在石油、天然氣等能源價(jià)格都在上漲，內(nèi)存存在5年的上漲周期?！碧镓S表示，能源和硬件成本驅(qū)動(dòng)算力漲價(jià)。

思科全球副總裁兼大中華區(qū)首席執(zhí)行官黃志明告訴澎湃科技，短期來看，硬件投資建廠并非一兩個(gè)月就能完成，供需波動(dòng)仍將持續(xù)一段時(shí)間。思科大中華區(qū)資深副總裁兼首席技術(shù)官侯勝利補(bǔ)充道，產(chǎn)能跟上需求基本需要兩年左右，“內(nèi)存工廠的調(diào)整至少需要兩年，2027年底之前不會(huì)好轉(zhuǎn)，重建工廠、布局產(chǎn)線沒有那么快?！辈贿^黃志明認(rèn)為，隨著使用人群的擴(kuò)大和應(yīng)用的普及，成本將逐步趨于大眾化、廉價(jià)化。

AI云計(jì)算服務(wù)商派歐云計(jì)算（上海）有限公司創(chuàng)始人姚欣對(duì)澎湃科技表示，今天，限制AI和算力的瓶頸并非最高端的芯片，而是那些普通的IT技術(shù)、傳統(tǒng)的配套部件。過去十年，內(nèi)存、硬盤乃至交換機(jī)等傳統(tǒng)IT基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈一直保持與全球GDP增速相當(dāng)?shù)钠椒€(wěn)增長，長期穩(wěn)定的需求預(yù)期決定了溫和的產(chǎn)能擴(kuò)張節(jié)奏。但人工智能的爆發(fā)式增長打破了這一平衡。GPU出貨量大增，配套周邊部件在這種“拐點(diǎn)式”需求下，供給能力被甩在身后。“高端芯片產(chǎn)能是擴(kuò)上去了，但其他產(chǎn)能沒跟上。當(dāng)然，這一波大家都被打疼了，所以包括內(nèi)存硬盤在內(nèi)的傳統(tǒng)部件紛紛擴(kuò)產(chǎn)?！?/p>

供需交替崛起，最終趨于平穩(wěn)

“現(xiàn)在Token比實(shí)習(xí)生貴，三五年后一定會(huì)便宜?！碧镓S同樣認(rèn)為，未來的Token價(jià)格一定會(huì)降低。

他認(rèn)為，短期來看，算力漲價(jià)源于供需錯(cuò)配。但從半導(dǎo)體周期來看，制造業(yè)存在產(chǎn)能周期，擴(kuò)產(chǎn)后新產(chǎn)能集中釋放，市場(chǎng)供需被沖擊，價(jià)格隨之降低，甚至出現(xiàn)產(chǎn)能過剩。從能源來看，中國正在推進(jìn)新能源結(jié)構(gòu)轉(zhuǎn)型，有望進(jìn)一步降低能源成本。中期價(jià)格取決于基模型能力提升——每三個(gè)月迭代的新版本往往能解決此前未滿足的剛需，釋放新需求，從而推升算力價(jià)格；長期則取決于推理能力的演進(jìn)，最終帶來算力成本的持續(xù)下降。

兩年來，供給側(cè)和需求側(cè)交替崛起。田豐表示，DeepSeek是創(chuàng)新層面降低成本的波峰，以“龍蝦”為代表的生產(chǎn)力爆發(fā)形成需求側(cè)的波峰?！暗@并不代表需求側(cè)爆發(fā)時(shí)，推理側(cè)就沒有降低成本，只不過爆發(fā)的速度比推理側(cè)成本下降的速度更高。3-5年內(nèi)，整體算力成本和Token費(fèi)用會(huì)急劇降低?！?/p>

姚欣表示，AI已進(jìn)入“奇點(diǎn)時(shí)刻”，“進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期，所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè)，短期內(nèi)都會(huì)遇到供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散，最終會(huì)趨于平穩(wěn)?！?/p>

Token漲價(jià)的背后，商業(yè)邏輯也在改變。英偉達(dá)CEO黃仁勛曾多次提及AI“五層蛋糕”結(jié)構(gòu)，“五層蛋糕”從下往上分為能源、芯片、基礎(chǔ)設(shè)施、模型和應(yīng)用，最上層的應(yīng)用環(huán)節(jié)將提供最大的經(jīng)濟(jì)紅利。

“當(dāng)下的AI就像2000年互聯(lián)網(wǎng)時(shí)期的景象，那時(shí)也普遍不清楚互聯(lián)網(wǎng)到底能做什么，但無數(shù)人投身于各式各樣的網(wǎng)站建設(shè)?！焙顒倮硎?，隨著不斷地應(yīng)用與創(chuàng)新，到了2005年、2006年，越來越多的“互聯(lián)網(wǎng)+”應(yīng)用場(chǎng)景涌現(xiàn)，各類服務(wù)逐漸融合。AI的發(fā)展方向同樣值得期待，正如被廣為預(yù)測(cè)的2026年將成為智能體元年，今年智能體應(yīng)用將層出不窮。

這些智能體應(yīng)用正融入手機(jī)、電腦，甚至工廠生產(chǎn)線。“每個(gè)人對(duì)AI提升生產(chǎn)力的需求幾乎是無止境的，唯一的限制是價(jià)格。漲價(jià)，需求就下降；降價(jià)，需求就上升?！碧镓S表示，即便是現(xiàn)在，大廠對(duì)于漲價(jià)也并非“一視同仁”?！按髲S一方面針對(duì)B端（企業(yè)端）提高云計(jì)算價(jià)格，另一方面對(duì)自己的智能體采用限時(shí)免費(fèi)試用或贈(zèng)送Token額度的策略搶占C端（消費(fèi)端）市場(chǎng)?！碧镓S坦言，當(dāng)下的情形就像互聯(lián)網(wǎng)早期，大廠爭奪用戶固然是最終目標(biāo)，但更關(guān)鍵的是爭奪開發(fā)者。

過去，開發(fā)者是全球程序員，如今，大量非技術(shù)人員具備Vibe Coding（氛圍編程）能力。他們既是代碼的消費(fèi)者，也是代碼的創(chuàng)造者。大廠把開發(fā)者“攥”住，就能讓開發(fā)成果長在自己的云上。

互聯(lián)網(wǎng)大廠為員工提供Token額度，鼓勵(lì)使用AI。據(jù)界面新聞報(bào)道，阿里巴巴集團(tuán)正推進(jìn)一項(xiàng)內(nèi)部計(jì)劃，向員工提供Token額度，鼓勵(lì)員工在工作中使用先進(jìn)的AI模型與工具。阿里員工可免費(fèi)使用悟空、智能體編程平臺(tái)Qoder系列等付費(fèi)AI工具，用于技術(shù)研發(fā)和通用辦公，公司將向員工提供Token額度。員工購買百煉Coding Plan會(huì)員或外部AI開發(fā)工具可以申請(qǐng)報(bào)銷。

使用AI提效的場(chǎng)景并不局限于編程等任務(wù)，更加廣泛的內(nèi)容創(chuàng)作和專業(yè)辦公同樣存在Token需求。MiniMax甚至將原有的Coding Plan升級(jí)為支持MiniMax全模態(tài)模型的Token Plan，抓住Token機(jī)遇。

“坦率講，做模型并沒有找到特別多的剛需出口，因此普遍采用月租收費(fèi)模式。Token之所以受到關(guān)注，是因?yàn)槊吭掠脩粼鲩L人數(shù)、人均消耗Token等指標(biāo)直接代表了營收增速?！碧镓S表示，這形成了極強(qiáng)的用戶黏性，只要產(chǎn)品足夠好用，即使價(jià)格略高，用戶也愿意為更好的體驗(yàn)買單。更何況，同樣500萬Token，既可以賣22元，也可以賣400元，溢價(jià)直接與基模型和智能體能力掛鉤。田豐表示，本質(zhì)上，Token的背后是一個(gè)尚未被完全開采的金礦。

責(zé)任編輯：宦艷紅

圖片編輯：樂浴峰

校對(duì)：張艷

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#Token