下載客戶端

登錄

Claude Code源碼泄漏：社區(qū)狂批“代碼太垃圾”

2026-04-03 14:47

來源：澎湃新聞·澎湃號·湃客

聽全文

“51萬行源碼意外曝光，Claude Code的核心武器、未來路線，以及一套識別用戶情緒的工程機制同時浮出水面。

美國東部時間3月31日凌晨4:23，Claude Code約51萬行內(nèi)部代碼被泄漏，幾小時內(nèi)迅速在開發(fā)者社區(qū)引發(fā)連鎖討論。

過去幾個月，Anthropic處在AI行業(yè)里最強勢且最會營銷的位置。

無論是模型能力、產(chǎn)品節(jié)奏，還是開發(fā)者口碑，它都在持續(xù)制造一種近乎壓迫性的存在感。從新版Claude在代碼生成上的持續(xù)領先，到Claude Code直接進入開發(fā)工作流，再到企業(yè)側(cè)API的快速滲透，每一個新功能，都在強化一個信號：模型正在逼近越來越多原本屬于軟件的核心環(huán)節(jié)。

這種壓迫感很快傳導到資本市場，市場情緒一度夸張到像是：每次一個新功能橫空出世，隨之而來的就是一類軟件公司股價暴跌。

軟件公司的價值建立在界面、流程和協(xié)作結(jié)構上，而Claude Code展示出的，是把多個工具之間的操作壓縮成一次連續(xù)對話：模型直接理解任務、調(diào)用工具、修改代碼、生成結(jié)果。對投資人來說，最刺眼的變化在于——如果模型開始直接完成任務，中間層軟件賴以收費的那層流程，可能比想象中更脆弱。

也正因為如此，當Claude Code意外泄露源碼時，大家都想一探究竟：這個目前看起來最領先的coding agent，到底是怎么做出來的？

一次npm失誤

把Claude Code“開源”了

這次事故本身并不復雜。

Anthropic在發(fā)布Claude Code npm包時，把source map文件一并上傳到了公開registry。對前端開發(fā)者來說，source map原本只是調(diào)試輔助文件，用來把壓縮后的JavaScript映射回原始TypeScript；但一旦公開，它幾乎等于把內(nèi)部實現(xiàn)完整暴露。

最早發(fā)現(xiàn)這一點的人，是安全研究員Chaofan Shou。

他在檢查新版npm包時發(fā)現(xiàn)其中包含一個異常巨大的cli.js.map文件，并很快在推特上發(fā)出提醒：Claude Code source code has been leaked via a map file in their npm registry 9（Claude Code 的源碼因為 npm registry 中一個 map 文件而被泄漏了）。

隨后，開發(fā)者從中還原出約1,900個TypeScript文件、超過50萬行代碼，包括：

·CLI 內(nèi)部邏輯

·tool orchestration

·prompt patch

·feature flag

·權限控制

·錯誤恢復機制

事故發(fā)生后數(shù)小時內(nèi)，GitHub上多個鏡像倉庫迅速出現(xiàn)，星標很快突破數(shù)千。Anthropic隨后移除了npm包中的相關source map文件，但由于早期版本已被下載和存檔，相關代碼在開發(fā)者社區(qū)擴散開來。

值得注意的是，這并不是Anthropic第一次因為發(fā)布包細節(jié)暴露內(nèi)部信息。2025年2月，早期版本的Claude Code就曾因package artifact中附帶調(diào)試相關內(nèi)容，被開發(fā)者還原出部分內(nèi)部prompt結(jié)構和工具組織方式。

看完源碼后

不少開發(fā)者的第一反應是：“垃圾”

在Hacker News和Reddit上，圍繞Claude Code的討論里很快出現(xiàn)了一類相當尖銳的評價。其中一條被頻繁引用的評論就寫得非常直接：“Claude Code is clearly a pile of vibe-coded garbage（Claude Code 看起來就是一堆 vibe coding 堆出來的垃圾）?！?/p>

這里的vibe-coded在開發(fā)者語境里帶著一種很典型的諷刺意味：并不是說代碼完全不可用，而是指很多實現(xiàn)看起來像是在高強度迭代中不斷往上疊補丁——能跑，但談不上優(yōu)雅。

被反復提到的問題包括：

·terminal UI狀態(tài)切換不夠穩(wěn)定

·長session下響應明顯變慢

·某些terminal環(huán)境里backspace行為異常

·部分交互層邏輯顯得過于臨時

也有開發(fā)者指出，源碼里大量feature flag、條件分支和 patch，讓整體閱讀體驗很像一套已經(jīng)快速上線、用戶很多、但仍在不斷搶修邊角問題的產(chǎn)品。

這種感覺并不陌生——不像一個從零設計出來的“未來系統(tǒng)”，反而更像一家軟件公司在真實用戶壓力下不斷往前推的代碼庫。

不過，另一派開發(fā)者強力反駁，他們認為，Claude Code之所以顯得復雜甚至略顯凌亂，恰恰是因為它必須同時處理大量現(xiàn)實世界里的非理想條件：

·多terminal環(huán)境兼容

·shell工具差異

·文件系統(tǒng)權限

·prompt orchestration

·模型失敗后的恢復邏輯

也就是說，看起來“亂”，正是因為它已經(jīng)進入真實的高強度開發(fā)環(huán)境，而不再只是實驗室里的demo。

Claude Code最關心的

不是代碼寫得對不對

而是用戶什么時候開始罵人

整場討論里，被提及最多的并不是某個復雜的agent調(diào)度模塊，而是Claude Code對regex（正則表達式）的大量使用。

在開發(fā)者看來，這一點幾乎帶著反差感：一家最前沿的大模型公司，在處理部分用戶狀態(tài)判斷時，并沒有調(diào)用模型，而是先用最傳統(tǒng)的字符串匹配工具做第一層篩查。regex的本質(zhì)很簡單——程序不需要真正理解一句話，只要快速掃描其中是否出現(xiàn)某些高信號詞匯，就能判斷當前交互是否可能進入負面狀態(tài)。

也就是說，當用戶輸入里出現(xiàn)明顯的抱怨、粗口或故障表達時，系統(tǒng)會優(yōu)先把它視為一種“情緒信號”：這次交互可能已經(jīng)不只是代碼問題，而是用戶開始失去耐心。

這也讓很多開發(fā)者意識到，Claude Code持續(xù)關注的，并不只是任務有沒有完成，而是整個session是否正在走向失?。河脩羰遣皇欠磸蛨?zhí)行同一命令、是不是開始出現(xiàn)負面措辭、是不是已經(jīng)進入frustration pattern。

也正因為如此，Hacker News上最出圈的一條評論才會寫得很諷刺：“一家做大語言模型的公司居然用regex做情緒分析？這就像一家卡車公司用馬來運輸零件?！?/p>

但很快下面就有人反駁：“因為regex更快、更便宜，而且不會阻塞主流程。”

這背后其實是一套非常典型的工程邏輯：模型雖然更智能，但也意味著額外的 token成本、更高的延遲，以及不完全確定的輸出；而regex的優(yōu)勢恰恰相反——零額外推理成本、幾乎瞬時完成，而且行為完全確定。

這也暴露了Claude Code很現(xiàn)實的一面：AI軍備競賽太燒錢了，能不燒token就不燒token。

有意思的是，在中文開發(fā)者社區(qū)，這種“情緒影響模型輸出”的經(jīng)驗已經(jīng)被總結(jié)成了一套半公開的方法論。

過去一段時間，GitHub上流傳過一套被戲稱為“PUA模型”的提示詞模板。核心邏輯很簡單：當模型輸出不夠理想時，單純重復要求效果有限；但如果加入明顯的施壓語境——強調(diào)責任、績效、后果——模型往往會突然給出更完整、更謹慎的答案。

例如流傳很廣的一種寫法：“你這個問題都解決不了，讓我怎么給你打績效？”

或者，“你缺乏owner意識，這是你的bug，慎重考慮給你3.25。”

這里的“3.25”，借用了中國互聯(lián)網(wǎng)大廠熟悉的績效語境，足夠讓人處于緊張的邊緣。

它的本質(zhì)，其實和直接罵模型是一回事：如果結(jié)果不夠好，適當施壓，模型往往會突然認真起來。這也許是今天大模型最像人的地方：它既怕被罵，又似乎確實會因為被罵而更認真一點。

Claude Code的核心能力和產(chǎn)品路線圖，也一起被翻了出來

這次Claude Code泄漏真正讓同行關注的是它第一次較完整地暴露了自己的核心武器：如何處理context entropy（上下文熵增）。

對于長時間運行的AI agent來說，真正困難的從來不是完成一次回答，而是隨著任務不斷拉長，如何避免上下文持續(xù)膨脹、信息彼此污染，最終讓模型開始遺忘、混亂，甚至在錯誤前提上繼續(xù)推理。

泄漏代碼顯示，Anthropic并沒有采用“全部存儲、全部檢索”的粗暴方式，而是設計了一套更克制的分層記憶結(jié)構：以MEMORY.md作為輕量索引，始終保留在上下文中，但只記錄知識入口；真正的信息被拆散到不同topic files中，需要時再按路徑讀取，原始對話也不會被整段重新灌回，而是通過grep檢索關鍵標識。

這種設計被開發(fā)者概括為一種Self-Healing Memory（自愈式記憶）：agent 不默認相信自己的上下文，而是不斷回到代碼庫驗證事實。更關鍵的是，只有文件真正寫入成功后，索引才會更新，避免失敗操作污染后續(xù)推理。

這意味著Anthropic在解決的，已經(jīng)不是“模型能不能寫代碼”，而是“模型怎樣在長時間任務里不把自己帶偏”。某種意義上，這比單次生成能力更接近下一代agent的真實競爭力。

與此同時，源碼里大量feature flag也意外暴露了產(chǎn)品路線。正如Hacker News上一條被反復引用的評論所說：“The big loss for Anthropic here is how it reveals their product roadmap via feature flags.”

開發(fā)者整理出的模塊名稱包括KAIROS、BUDDY、Undercover Mode。

KAIROS普遍被解讀為一種更長session的assistant mode——Claude Code 不再只是執(zhí)行一次命令，而是嘗試維持連續(xù)任務狀態(tài)；BUDDY則更像是在往長期協(xié)作型agent靠攏，不只是terminal里的工具，而是持續(xù)存在于工作流中的伙伴。至于Undercover Mode，雖然具體用途仍未明確，但至少說明Anthropic已經(jīng)開始考慮agent在不同環(huán)境中的呈現(xiàn)邊界。

這些功能是否會按當前形態(tài)上線仍無法確認，但它們共同說明一件事：Claude Code的演化方向，已經(jīng)不只是提升代碼生成準確率，而是在向更完整的軟件協(xié)作層推進。

泄漏中還出現(xiàn)了部分內(nèi)部模型代號：Capybara、Fennec、Numbat。

其中Capybara被認為對應Claude 4.6的內(nèi)部變體，F(xiàn)ennec對應Opus線，Numbat則可能仍處于測試階段。更敏感的是，內(nèi)部注釋還暴露出一部分真實性能指標：Capybara v8的false claims rate仍在29%–30%左右，高于v4的16.7%；同時系統(tǒng)里還有一個名為assertiveness counterweight的機制，用來抑制模型過度激進地修改代碼。

當AI Agent開始接管終端

開源可能比封閉更讓人安心

這次事故暴露的，已經(jīng)不只是一次npm發(fā)布失誤，而是一個越來越明確的行業(yè)現(xiàn)實：模型可以持續(xù)高速迭代，但圍繞它的發(fā)布流程、權限邊界與供應鏈治理，仍然必須遵循成熟軟件行業(yè)的標準。

隨著coding agent越來越多進入真實生產(chǎn)環(huán)境，它不再只是一個生成代碼的工具，而是在逐步接觸終端、文件系統(tǒng)與代碼倉庫，擁有執(zhí)行權限，也開始承擔接近基礎設施的角色。

這意味著，安全不再只是后臺附屬能力，而正在成為產(chǎn)品本身的一部分。

也因此，在泄漏發(fā)生之后，越來越多開發(fā)者開始提出另一種判斷：既然工程層終究會被拆解、被閱讀、被討論，不如主動開放更多系統(tǒng)層，讓開發(fā)者參與審視、修補與共同驗證。

因為下一階段coding agent的競爭，最終比拼的，已經(jīng)不只是模型能力，而是誰能成為一套值得長期托付的軟件。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#Claude #Code