中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

從集體降價(jià)到集體漲價(jià),“Token經(jīng)濟(jì)學(xué)”為何兩年風(fēng)向突變

澎湃新聞?dòng)浾?張靜
2026-04-01 14:09
來源:澎湃新聞
? 未來2% >
字號(hào)

Token是AI時(shí)代的“新貨幣”。2024年,AI價(jià)格戰(zhàn)打響,Token以“厘”計(jì)價(jià);2026年,算力需求引爆,模型廠商和云廠商的Token集體漲價(jià)。

在過去兩年里,大模型行業(yè)經(jīng)歷了從價(jià)格戰(zhàn)到價(jià)值戰(zhàn)的劇烈轉(zhuǎn)折,Token的價(jià)值正被重新審視。在工資、獎(jiǎng)金、股權(quán)之外,Token甚至成為硅谷工程師薪資談判的新籌碼。圍繞Token的生態(tài)布局與資源爭奪戰(zhàn)已然打響。

從降價(jià)潮到漲價(jià)潮

2026年,模型廠商和云廠商的Token集體漲價(jià)。今年以來,智譜已經(jīng)兩度發(fā)布漲價(jià)通告。3月16日,智譜推出面向OpenClaw場(chǎng)景深度優(yōu)化的基座模型GLM-5-Turbo,API價(jià)格上調(diào)20%。在面向個(gè)人和企業(yè)級(jí)用戶的“龍蝦”套餐中,Claw體驗(yàn)月卡39元/月,含3500萬Token,Claw進(jìn)階月卡價(jià)格為99元/月,含1億Token。2月份,智譜發(fā)布Coding Plan調(diào)價(jià)公告,“由于GLM Coding Plan市場(chǎng)需求持續(xù)強(qiáng)勁增長,用戶規(guī)模與調(diào)用量快速提升”,決定取消首購優(yōu)惠,保留按季按年訂閱優(yōu)惠,套餐價(jià)格整體漲幅自30%起。

除了模型廠商,云廠商也在集體漲價(jià)。因Coding Plan訂閱火爆,阿里云模型API調(diào)用量暴漲,3月4日宣布階段性調(diào)整首購優(yōu)惠,每日限時(shí)限量供應(yīng),售完即止。3月18日,阿里云表示,因全球AI需求爆發(fā)、供應(yīng)鏈漲價(jià),行業(yè)核心硬件采購成本顯著上漲,4月18日起將調(diào)整AI算力、CPFS(智算版)等服務(wù)價(jià)格。平頭哥真武810E等算力卡相關(guān)服務(wù)上漲5%-34%,CPFS(智算版)上漲30%。

百度智能云同樣宣布,4月18日起,AI算力相關(guān)產(chǎn)品服務(wù)上調(diào)約5%-30%,并行文件存儲(chǔ)等上調(diào)約30%。騰訊云宣布自3月13日起,GLM 5、MiniMax 2.5、Kimi 2.5模型結(jié)束公測(cè),轉(zhuǎn)為正式商用服務(wù),根據(jù)模型調(diào)用按量計(jì)費(fèi)?;煸盗心P蛢r(jià)格也有調(diào)整,Tencent HY2.0 Instruct模型輸入價(jià)格從0.0008元/千tokens上漲為0.004505元/千tokens,輸出價(jià)格從0.002元/千tokens上漲為0.01113元/千tokens。

然而,就在兩年前,Token “降價(jià)潮”記憶猶新。

2024年“百模大戰(zhàn)”,彼時(shí)的大模型行業(yè)尚處于激烈的價(jià)格戰(zhàn)之中,云廠商與模型廠商競(jìng)相降價(jià)、送Token。

當(dāng)年5月,字節(jié)跳動(dòng)以0.0008元/千 tokens的價(jià)格掀起大模型價(jià)格戰(zhàn),隨后阿里云跟進(jìn),宣布通義千問最高降價(jià)97%,彼時(shí)通義千問GPT-4級(jí)主力模型Qwen-Long輸入價(jià)格從0.02元/千 tokens降至0.0005元/千 tokens。同期,智譜的新注冊(cè)用戶贈(zèng)送額度從500萬Token提升至2500萬Token。

用較低成本訓(xùn)練出高性能大模型的DeepSeek,去年3月揭曉其V3/R1推理系統(tǒng)背后的關(guān)鍵信息,通過優(yōu)化吞吐和延遲,如果所有Token按照DeepSeek-R1的定價(jià)計(jì)算,成本利潤率可達(dá)545%。

技術(shù)是模型降價(jià)的底氣。字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎總裁譚待曾在2024年的AI降價(jià)潮中表示,降價(jià)的基本邏輯是有信心用技術(shù)手段降低成本,市場(chǎng)也需要更低價(jià)的大模型。

“前兩年算力需求方更多是企業(yè),現(xiàn)在是個(gè)人算力 ‘饑餓’,推動(dòng)了AI創(chuàng)企及大廠的商業(yè)模式轉(zhuǎn)向Token消耗量?!笨焖悸胙芯吭涸洪L、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長田豐表示。

在過去兩年里,模型快速迭代,智能體應(yīng)用大幅增長,從而帶動(dòng)算力需求持續(xù)攀升,高性價(jià)比的推理顯卡產(chǎn)能有限,內(nèi)存等核心硬件及相關(guān)基礎(chǔ)設(shè)施成本顯著上漲。硅谷科技分析、咨詢與投資公司Navica首席執(zhí)行官伯納德·戈?duì)柕牵˙ernard Golden)表示,整個(gè)行業(yè)都在瘋狂尋求更多算力。

供需失衡之下,漲價(jià)成為必然。

“一個(gè)更聰明的模型執(zhí)行更復(fù)雜的任務(wù),消耗的資源是巨大的?!敝亲VCEO張鵬日前在回應(yīng)提價(jià)策略時(shí)表示,智能體執(zhí)行任務(wù)背后涉及的思考和推理鏈路更長,還會(huì)通過寫代碼的方式與底層基礎(chǔ)設(shè)施交互,不斷調(diào)試并隨時(shí)修正錯(cuò)誤,完成一個(gè)任務(wù)所需要的Token量是回答一個(gè)簡單問題的十倍甚至百倍。價(jià)格調(diào)整的本質(zhì)是成本在變化,“模型更大了,能力更強(qiáng)了,對(duì)應(yīng)的服務(wù)成本也提高了,所以我們希望把它逐步拉回一個(gè)正常的商業(yè)價(jià)值區(qū)間,長期依賴低價(jià)競(jìng)爭并不利于行業(yè)發(fā)展。”

Token調(diào)用量兩年增長千倍

過去兩年以來,軟件供應(yīng)商通過標(biāo)準(zhǔn)化的API接口,陸續(xù)將文本生成、圖像生成及語音生成等能力集成到客戶服務(wù)平臺(tái)、營銷素材生成、服務(wù)機(jī)器人等現(xiàn)有產(chǎn)品中。企業(yè)用戶通過API接口調(diào)用大模型能力,按調(diào)用量或訂閱方式計(jì)費(fèi),降低使用門檻和前期投入。畢竟,單張H100 GPU的成本約25000美元,單一系統(tǒng)中配置多張GPU的開支將更高。

這種服務(wù)模式讓大模型能快速觸達(dá)海量用戶,Token調(diào)用量急劇攀升。國家數(shù)據(jù)局局長劉烈宏日前披露,截至2025年年底,全國已建成高質(zhì)量數(shù)據(jù)集超過了10萬個(gè)。到今年3月,中國日均Token調(diào)用量已超140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,三個(gè)月時(shí)間又增長了40%多。

田豐對(duì)澎湃科技表示,2024年,訓(xùn)練的算力需求超50%,到2025年,情況完全逆轉(zhuǎn)。如果說,兩年前是百“?!贝髴?zhàn),那么現(xiàn)在是百“蝦”大戰(zhàn)。

推理需求大爆發(fā),推理服務(wù)與Token消耗深度綁定,是當(dāng)前體量最大、增長最快的算力場(chǎng)景。模型性能持續(xù)提升推動(dòng)Token消耗量暴漲,AI編程、“龍蝦”(OpenClaw)等智能體應(yīng)用的廣泛滲透則讓Token需求井噴。OpenClaw被戲稱為“Token黑洞”。對(duì)于使用龍蝦的企業(yè)和個(gè)人來說,Token是最大的成本瓶頸。

田豐表示,智能體自動(dòng)執(zhí)行任務(wù)的Token消耗量是傳統(tǒng)問答的4-15倍。AI創(chuàng)業(yè)者羅璇使用OpenClaw完成復(fù)雜調(diào)研任務(wù)需耗費(fèi)數(shù)百萬甚至更多Token。為了找到更便宜的Token,他的經(jīng)驗(yàn)是注冊(cè)云廠商或模型廠商的新用戶,獲取免費(fèi)Token,但依然直呼“Token太貴”。

編程、聊天、辦公等算力消耗以Token為計(jì),從更廣義的算力消耗來看,以圖片數(shù)量計(jì)價(jià)的圖片生成,以及以時(shí)長和分辨率計(jì)價(jià)的視頻生成,同樣消耗大量算力。OpenAI關(guān)閉Sora視頻應(yīng)用便是例證。運(yùn)行視頻生成服務(wù)需消耗龐大計(jì)算資源和電力,這對(duì)任何企業(yè)而言都是一筆巨額開支,而關(guān)閉Sora則將釋放大量算力資源。

算力需求帶動(dòng)的不僅僅是GPU需求的增長,所有相關(guān)的硬件都會(huì)被連帶波動(dòng),并成為其中的一個(gè)制約因素。

“包括冷卻、照明、服務(wù)器用電,數(shù)據(jù)中心的電力成本占60%左右,現(xiàn)在石油、天然氣等能源價(jià)格都在上漲,內(nèi)存存在5年的上漲周期?!碧镓S表示,能源和硬件成本驅(qū)動(dòng)算力漲價(jià)。

思科全球副總裁兼大中華區(qū)首席執(zhí)行官黃志明告訴澎湃科技,短期來看,硬件投資建廠并非一兩個(gè)月就能完成,供需波動(dòng)仍將持續(xù)一段時(shí)間。思科大中華區(qū)資深副總裁兼首席技術(shù)官侯勝利補(bǔ)充道,產(chǎn)能跟上需求基本需要兩年左右,“內(nèi)存工廠的調(diào)整至少需要兩年,2027年底之前不會(huì)好轉(zhuǎn),重建工廠、布局產(chǎn)線沒有那么快?!辈贿^黃志明認(rèn)為,隨著使用人群的擴(kuò)大和應(yīng)用的普及,成本將逐步趨于大眾化、廉價(jià)化。

AI云計(jì)算服務(wù)商派歐云計(jì)算(上海)有限公司創(chuàng)始人姚欣對(duì)澎湃科技表示,今天,限制AI和算力的瓶頸并非最高端的芯片,而是那些普通的IT技術(shù)、傳統(tǒng)的配套部件。過去十年,內(nèi)存、硬盤乃至交換機(jī)等傳統(tǒng)IT基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈一直保持與全球GDP增速相當(dāng)?shù)钠椒€(wěn)增長,長期穩(wěn)定的需求預(yù)期決定了溫和的產(chǎn)能擴(kuò)張節(jié)奏。但人工智能的爆發(fā)式增長打破了這一平衡。GPU出貨量大增,配套周邊部件在這種“拐點(diǎn)式”需求下,供給能力被甩在身后。“高端芯片產(chǎn)能是擴(kuò)上去了,但其他產(chǎn)能沒跟上。當(dāng)然,這一波大家都被打疼了,所以包括內(nèi)存硬盤在內(nèi)的傳統(tǒng)部件紛紛擴(kuò)產(chǎn)?!?/p>

供需交替崛起,最終趨于平穩(wěn)

“現(xiàn)在Token比實(shí)習(xí)生貴,三五年后一定會(huì)便宜?!碧镓S同樣認(rèn)為,未來的Token價(jià)格一定會(huì)降低。

他認(rèn)為,短期來看,算力漲價(jià)源于供需錯(cuò)配。但從半導(dǎo)體周期來看,制造業(yè)存在產(chǎn)能周期,擴(kuò)產(chǎn)后新產(chǎn)能集中釋放,市場(chǎng)供需被沖擊,價(jià)格隨之降低,甚至出現(xiàn)產(chǎn)能過剩。從能源來看,中國正在推進(jìn)新能源結(jié)構(gòu)轉(zhuǎn)型,有望進(jìn)一步降低能源成本。中期價(jià)格取決于基模型能力提升——每三個(gè)月迭代的新版本往往能解決此前未滿足的剛需,釋放新需求,從而推升算力價(jià)格;長期則取決于推理能力的演進(jìn),最終帶來算力成本的持續(xù)下降。

兩年來,供給側(cè)和需求側(cè)交替崛起。田豐表示,DeepSeek是創(chuàng)新層面降低成本的波峰,以“龍蝦”為代表的生產(chǎn)力爆發(fā)形成需求側(cè)的波峰?!暗@并不代表需求側(cè)爆發(fā)時(shí),推理側(cè)就沒有降低成本,只不過爆發(fā)的速度比推理側(cè)成本下降的速度更高。3-5年內(nèi),整體算力成本和Token費(fèi)用會(huì)急劇降低?!?/p>

姚欣表示,AI已進(jìn)入“奇點(diǎn)時(shí)刻”,“進(jìn)入到未來一兩年內(nèi)十倍百倍高速增長的時(shí)期,所有沒有準(zhǔn)備好應(yīng)對(duì)這種增長的行業(yè),短期內(nèi)都會(huì)遇到供不應(yīng)求的情況。但就像水波紋那樣慢慢擴(kuò)散,最終會(huì)趨于平穩(wěn)?!?/p>

Token漲價(jià)的背后,商業(yè)邏輯也在改變。英偉達(dá)CEO黃仁勛曾多次提及AI“五層蛋糕”結(jié)構(gòu),“五層蛋糕”從下往上分為能源、芯片、基礎(chǔ)設(shè)施、模型和應(yīng)用,最上層的應(yīng)用環(huán)節(jié)將提供最大的經(jīng)濟(jì)紅利。

“當(dāng)下的AI就像2000年互聯(lián)網(wǎng)時(shí)期的景象,那時(shí)也普遍不清楚互聯(lián)網(wǎng)到底能做什么,但無數(shù)人投身于各式各樣的網(wǎng)站建設(shè)?!焙顒倮硎?,隨著不斷地應(yīng)用與創(chuàng)新,到了2005年、2006年,越來越多的“互聯(lián)網(wǎng)+”應(yīng)用場(chǎng)景涌現(xiàn),各類服務(wù)逐漸融合。AI的發(fā)展方向同樣值得期待,正如被廣為預(yù)測(cè)的2026年將成為智能體元年,今年智能體應(yīng)用將層出不窮。

這些智能體應(yīng)用正融入手機(jī)、電腦,甚至工廠生產(chǎn)線。“每個(gè)人對(duì)AI提升生產(chǎn)力的需求幾乎是無止境的,唯一的限制是價(jià)格。漲價(jià),需求就下降;降價(jià),需求就上升?!碧镓S表示,即便是現(xiàn)在,大廠對(duì)于漲價(jià)也并非“一視同仁”?!按髲S一方面針對(duì)B端(企業(yè)端)提高云計(jì)算價(jià)格,另一方面對(duì)自己的智能體采用限時(shí)免費(fèi)試用或贈(zèng)送Token額度的策略搶占C端(消費(fèi)端)市場(chǎng)?!碧镓S坦言,當(dāng)下的情形就像互聯(lián)網(wǎng)早期,大廠爭奪用戶固然是最終目標(biāo),但更關(guān)鍵的是爭奪開發(fā)者。

過去,開發(fā)者是全球程序員,如今,大量非技術(shù)人員具備Vibe Coding(氛圍編程)能力。他們既是代碼的消費(fèi)者,也是代碼的創(chuàng)造者。大廠把開發(fā)者“攥”住,就能讓開發(fā)成果長在自己的云上。

互聯(lián)網(wǎng)大廠為員工提供Token額度,鼓勵(lì)使用AI。據(jù)界面新聞報(bào)道,阿里巴巴集團(tuán)正推進(jìn)一項(xiàng)內(nèi)部計(jì)劃,向員工提供Token額度,鼓勵(lì)員工在工作中使用先進(jìn)的AI模型與工具。阿里員工可免費(fèi)使用悟空、智能體編程平臺(tái)Qoder系列等付費(fèi)AI工具,用于技術(shù)研發(fā)和通用辦公,公司將向員工提供Token額度。員工購買百煉Coding Plan會(huì)員或外部AI開發(fā)工具可以申請(qǐng)報(bào)銷。

使用AI提效的場(chǎng)景并不局限于編程等任務(wù),更加廣泛的內(nèi)容創(chuàng)作和專業(yè)辦公同樣存在Token需求。MiniMax甚至將原有的Coding Plan升級(jí)為支持MiniMax全模態(tài)模型的Token Plan,抓住Token機(jī)遇。

“坦率講,做模型并沒有找到特別多的剛需出口,因此普遍采用月租收費(fèi)模式。Token之所以受到關(guān)注,是因?yàn)槊吭掠脩粼鲩L人數(shù)、人均消耗Token等指標(biāo)直接代表了營收增速?!碧镓S表示,這形成了極強(qiáng)的用戶黏性,只要產(chǎn)品足夠好用,即使價(jià)格略高,用戶也愿意為更好的體驗(yàn)買單。更何況,同樣500萬Token,既可以賣22元,也可以賣400元,溢價(jià)直接與基模型和智能體能力掛鉤。田豐表示,本質(zhì)上,Token的背后是一個(gè)尚未被完全開采的金礦。

    責(zé)任編輯:宦艷紅
    圖片編輯:樂浴峰
    校對(duì):張艷
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司