谷歌發(fā)布Gemma 4模型，為低功耗設備帶來復雜推理能力

2026-04-04 12:55

來源：澎湃新聞·澎湃號·湃客

谷歌發(fā)布了其最先進的開放權重人工智能模型家族Gemma 4，這標志著開放權重AI模型領域的重大進步。

技術架構與性能突破

Gemma 4基于與Gemini 3相同的架構基礎構建，專門設計用于處理復雜推理任務，并支持在工作站和智能手機等低功耗設備上本地運行的自主AI智能體。

谷歌DeepMind研究人員Clement Farabet和Olivier Lacombe表示，他們成功實現了更高的"每參數智能度"，使模型能夠發(fā)揮遠超其規(guī)模的性能。例如，31B Dense變體目前在行業(yè)標準Arena AI Text排行榜的開放模型中排名第三。

四種模型變體滿足不同需求

Gemma 4提供四種不同版本：Effective 2B、Effective 4B、26B專家混合模型和31B Dense模型。較小的"Effective"模型專為Android智能手機或樹莓派計算機等輕量級硬件的邊緣使用場景而設計。

26B MoE模型采用了巧妙的設計，在推理任務中僅激活38億個參數，既能保持高速運行，又不會犧牲大型模型的深度知識庫優(yōu)勢。

智能體支持與多模態(tài)能力

與早期的Gemma版本不同，Gemma 4模型原生支持函數調用和結構化JSON輸出，開發(fā)者無需調整設計即可讓模型與其他軟件工具交互。這使得開發(fā)者能夠利用這些模型構建能夠與第三方工具交互并執(zhí)行多步驟計劃的自主智能體。

所有四個模型都具備處理圖像和視頻的能力，較小的E2B和E4B變體還進一步支持原生音頻輸入，能夠直接在設備上實現實時語音理解。谷歌還增加了模型的上下文窗口，最小模型可達128K，較大的兩個模型可達256K。這意味著開發(fā)者能夠通過單個提示上傳整個代碼庫或大量文檔集合。

開放許可與部署方式

每個模型都采用寬松的Apache 2.0許可證發(fā)布，消除了其他AI模型的許多商業(yè)限制，使其成為構建企業(yè)應用程序開發(fā)者的絕佳選擇。這些模型可以通過Google Cloud直接訪問，也可以在Hugging Face、Kaggle和Ollama上獲取開放權重版本。

市場影響與前景展望

這次發(fā)布凸顯了谷歌主導"本地AI"行業(yè)的雄心。Constellation Research分析師Holger Mueller表示，由于即使是較大的Gemma 4模型也足夠小，可以在單個圖形處理單元上運行，這使得它們適用于對低延遲和數字主權要求較高的邊緣使用場景和應用。

Mueller評論道："谷歌不僅通過推進Gemini，還通過Gemma 4系列的開放模型來構建其在AI領域的領先地位。這些模型對于構建AI開發(fā)者生態(tài)系統(tǒng)非常重要，將幫助公司在不同設備形態(tài)上挖掘功能性和垂直使用場景。谷歌此前的Gemma 3發(fā)布已經設定了很高的標準，因此人們對這次發(fā)布寄予厚望。"

Q&A

Q1：Gemma 4模型有什么特殊之處？

A：Gemma 4是谷歌最先進的開放權重AI模型家族，基于與Gemini 3相同的架構，專門設計用于處理復雜推理任務。它能夠在工作站和智能手機等低功耗設備上本地運行自主AI智能體，實現了更高的"每參數智能度"，性能遠超其模型規(guī)模。

Q2：Gemma 4有哪些不同版本可以選擇？

A：Gemma 4提供四種版本：Effective 2B和Effective 4B專為智能手機、樹莓派等輕量級硬件設計；26B專家混合模型在推理時僅激活38億參數，兼顧速度和性能；31B Dense模型在開放模型排行榜中排名第三，性能強勁。

Q3：Gemma 4在商業(yè)應用方面有什么優(yōu)勢？

A：Gemma 4采用寬松的Apache 2.0許可證，消除了許多商業(yè)限制，特別適合企業(yè)應用開發(fā)。模型原生支持函數調用和JSON輸出，可直接構建自主智能體。同時支持圖像、視頻和音頻處理，上下文窗口最大可達256K，能處理大型文檔和代碼庫。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#谷歌