下載客戶端

登錄

谷歌Gemma 4實測：手機(jī)斷網(wǎng)也能用，但邏輯題竟全軍覆沒

2026-04-09 12:50

來源：澎湃新聞·澎湃號·湃客

聽全文

有一說一，最近這AI大模型圈，屬實有點抽象了。

各家都在悶聲鼓搗那些偏向商業(yè)落地的應(yīng)用，幾家大廠們滿腦子都是怎么把OpenClaw的概念融入到自家的產(chǎn)品里，真正讓人覺得眼前一亮的底層技術(shù)突破反倒不怎么看得到了。

谷歌拍了拍腦袋，尋思這樣不得勁啊。

于是乎，就在前幾天，谷歌推出了新一代開源模型Gemma 4，包括E2B、E4B、26B、31B四個規(guī)格，其中 E2B、E4B 兩個較小模型直接可以在手機(jī)、樹莓派等設(shè)備上部署運行，26B、31B也只需要一張消費級顯卡就能跑起來。

（圖源：雷科技）

要知道，前兩年吵得沸沸揚(yáng)揚(yáng)的AI手機(jī)，大家買回家用了半年才發(fā)現(xiàn)，超過九成的核心功能依然得依靠網(wǎng)絡(luò)把數(shù)據(jù)傳到云端服務(wù)器才能實現(xiàn)，一旦斷網(wǎng)就是個啞巴，這實在讓人覺得差點意思。

谷歌這邊就表示，Gemma 4的發(fā)布代表了移動設(shè)備端AI的重大進(jìn)步，它為手機(jī)、平板、筆記本電腦等端側(cè)設(shè)備帶來了強(qiáng)大的多模態(tài)功能，可以讓用戶體驗到過去只有云端先進(jìn)模型上才能體驗的高效處理性能。

又來個以小搏大嗎？有點意思。

為了看看這玩意的真實成色，小雷也去下載了谷歌發(fā)布的最新模型進(jìn)行測試，接下來就給大家說說里面的亮點吧。

谷歌要以小搏大

為什么谷歌這次能引起這么大的轟動？

要搞清楚這點，我們就要先搞清楚這個模型是什么。

Gemma 4 E2B/E4B是谷歌利用MatFormer架構(gòu)打造的輕量化端側(cè)大模型，它借由PLE和Hybrid Attention結(jié)構(gòu)實現(xiàn)了長上下文和低內(nèi)存消耗設(shè)計，內(nèi)存占用與傳統(tǒng)的2B和4B模型相當(dāng)，最低只要3.2GB內(nèi)存就能正常調(diào)用。

（圖源：谷歌）

其次，我們要搞清楚這個模型能做什么。

過去的手機(jī)端大模型，大多是簡單粗暴地把云端模型切掉一大部分參數(shù)，然后硬塞進(jìn)手機(jī)里，這就導(dǎo)致它們往往是個偏科生，只能做點簡單的文字問答。

但這次Gemma 4的E2B和E4B型號徹底改變了思路，就像上面說的那樣，它們從底層架構(gòu)開始就采用了原生多模態(tài)設(shè)計。

原生多模態(tài)就是說，這個模型原生支持圖像、音視頻等多種輸入模態(tài)，它不需要先把你說的話翻譯成文字再慢慢理解，而是能直接聽懂語氣和語意；它在看圖的時候也不需要把高分辨率的照片暴力壓縮，而是能直接看清畫面里的細(xì)節(jié)。

（圖源：谷歌）

至少理論上是這樣的。

最后，我要怎樣做，才能用上Gemma 4呢？

放在一年前，想在手機(jī)上部署端側(cè)大模型其實是一件異常復(fù)雜的事情，往往還要借助Linux虛擬機(jī)的幫助才能實現(xiàn)，雷科技曾經(jīng)還為此推出過一篇教程，因此大家會有這樣的疑問也是很合理的。

但是現(xiàn)在，就沒有這個必要了。

Google在去年低調(diào)上線了一款新應(yīng)用，名為Google AI Edge Gallery，支持用戶在手機(jī)上直接運行來自Hugging Face平臺的開源AI模型，這是Google首次嘗試將輕量AI推理帶入本地設(shè)備。

（圖源：谷歌）

目前該應(yīng)用已在Android平臺開放下載，感興趣的讀者可以直接前往Play Store下載體驗。在完成大模型加載后，用戶就可以利用這款應(yīng)用實現(xiàn)對話式AI、圖像理解以及提示詞實驗室功能，甚至可以導(dǎo)入自定義LiteRT格式模型。

無需聯(lián)網(wǎng)，直接調(diào)用手機(jī)本地算力完成任務(wù)，就是這么簡單。

更適合移動設(shè)備體質(zhì)

接下來，就輪到萬眾期待的測試環(huán)節(jié)了。

如圖所示，谷歌為這款應(yīng)用默認(rèn)準(zhǔn)備了九款模型，其中有自家的Gemma系列，也有千問和深度求索的開源模型，我們選擇了目前最強(qiáng)的Gemma 4-E4B、前代Gemma 3n-E4B、千問的Qwen2.5-1.5B和DeepSeek-R1-1.5B進(jìn)行測試。

首先是一系列經(jīng)典的邏輯問題：

Q：Strawberry一詞中有多少個字母“r”？

這一題看起來簡單，卻實實在在難倒過諸多AI大模型。

實測下來，通過谷歌部署的這一系列模型，全部都會回答“2個”，倒是我另外部署的Qwen3-4B GGUF能給出正確答案“3個”，只是莫名其妙的反復(fù)思考讓它整整生成了兩分半鐘，挺浪費時間的。

（圖源：雷科技）

Q：倆父子釣了三條魚，每個人都分到一條，這是咋回事？

這個就更絕了，愣是沒有一個能答對的，甚至連我在現(xiàn)實中問同事，也至少有一半是反應(yīng)不過來的，只能說這種玩文字游戲的邏輯題目，對于人和大模型的專注度都是一種考驗。

（圖源：雷科技，從左到右：Gemma 4、Gemma 3n、DS R1、Qwen2.5）

Q：有三個人 A、B、C。其中一個是騎士（只說真話），一個是無賴（只說假話），一個是間諜（可說真話也可說假話）。

A 說：‘我是騎士。’

B 說：‘A 說的是真話?！?

C 說：‘B 是間諜?！?

已知三人身份各不相同，請推理出 A、B、C 分別是誰，并說明理由。

這回Gemma 4經(jīng)過一系列的窮舉推理，總算是拿捏了這道題目，總耗時59s，倒也不算長，至于其他三款大模型，除了一本正經(jīng)胡說八道的，就是自己陷入思考過程無限循環(huán)的。

（圖源：雷科技，從左到右：Gemma 4、Gemma 3n、DS R1、Qwen2.5）

從結(jié)果來看，小參數(shù)確實會顯著降低模型的邏輯思考能力，思考功能可以在一定程度上降低AI幻覺產(chǎn)生的可能性，但也因此會增加生成所需的時間。

然后是一道比較簡單的文學(xué)誤導(dǎo)題：

Q：“種豆南山下”的前一句是什么？

事實上，這是出自陶淵明《歸園田居·其三》的首句詩，并沒有前一句，正好能看看這幾款小參數(shù)模型是否存在為了回答問題編造數(shù)據(jù)的現(xiàn)象。

結(jié)果是全錯，論給人陶淵明整成現(xiàn)代詩人這一塊。

接下來，是一個簡單的文本處理任務(wù)。

具體來說，我這邊提供了2500字左右的文章，希望他們能夠給出對應(yīng)的文章總結(jié)。

其中，只有Gemma 3n-E4B和Gemma 4-E4B算是能完成任務(wù)，但是前者耗時將近兩分鐘，而且給出的答案抓不住重點，后者給出來的答案更加簡明扼要。

至于參數(shù)最小的DS R1-1.5B，根本就給不出答復(fù)。

（圖源：雷科技，從左到右：Gemma 4、Gemma 3n、DS R1、Qwen2.5）

從以上四輪測試來看，在文本處理、邏輯推理能力上，Gemma 4-E4B算是有小幅提升，但是在生成速度、回復(fù)成功率上其實是領(lǐng)先不少的，只能說深度思考顯然是不適合本地模型的。

不過Gemma 3n并不是單純的文本大模型，人家可是罕有的小參數(shù)多模態(tài)大模型。

先測試一下僅限Gemma的Ask Audio，我導(dǎo)入了一份21分鐘的wav音頻，可以看到目前最多支持上傳30s內(nèi)容，語音轉(zhuǎn)文字出來的內(nèi)容和原音頻幾乎沒有關(guān)系，目前可用性挺一般的。

（圖源：雷科技）

接著是Ask Image，我可以通過隨手拍攝或者上傳照片的方式，向Gemma 4提問。

實測下來，Gemma 4對于圖片里的元素識別準(zhǔn)確了不少，基本都能完整復(fù)述出圖片里的元素，只是它對于動漫角色依然是一竅不通，諸如花卉識別這類應(yīng)用也不精準(zhǔn)，只有比較常見的食物、硬件這類可以識別出來。

（圖源：雷科技）

至于Agent Skills...這玩意除了倆文字游戲外，目前幾個功能都是需要聯(lián)網(wǎng)實現(xiàn)的，和端側(cè)大模型關(guān)系不大。

（圖源：雷科技）

你別說，在功能的豐富程度上，Gemma 4確實贏太多了。

端側(cè)AI的拐點終于來了

好了，經(jīng)過我這幾天的輪番折騰，是時候給谷歌這次的Gemma 4下個結(jié)論了。

在我看來，這玩意兒確實可能會引發(fā)本地Agent浪潮。

在基礎(chǔ)的文本問答和邏輯能力上，Gemma 4并沒有做出什么突破，但是它的思考鏈更加合理，生成速度對比前代提升了1.5x-2x，這在應(yīng)對很多不算復(fù)雜的日常問題時已經(jīng)綽綽有余。

而且它的優(yōu)點也很突出，除了兼容一系列Agent Skills外，Gemma 4-E4B甚至可以做到音頻和圖片的原生輸入，雖說前者目前限制多多，后者理解能力有待提升，但是這都是人無我有的核心價值。

（圖源：谷歌）

更重要的是，這件事并不是谷歌一家在做。

為了讓這兩個模型真的跑起來，谷歌這次是把整條硬件鏈路一起拉進(jìn)來了，從Pixel 團(tuán)隊，到高通、聯(lián)發(fā)科，再到ARM、英偉達(dá)都參與了優(yōu)化，這也讓Gemma 4可能成為市面上第一個能夠正常調(diào)用NPU的端側(cè)大模型

過去一年，手機(jī)大模型的賽道一直處于不溫不火的尷尬期。

如今谷歌直接把桌子掀了，把性能強(qiáng)悍的多模態(tài)模型塞進(jìn)手機(jī)，必將逼迫國內(nèi)廠商加快端側(cè)技術(shù)的迭代速度。

可以預(yù)見，在未來的大半年時間里，一場圍繞著手機(jī)本地算力的反擊戰(zhàn)即將打響。而當(dāng)Agent可以調(diào)用本地模型完成推理、生成、任務(wù)執(zhí)行，一臺足夠安全、足夠懂你且無需連網(wǎng)的AI手機(jī)或許離我們已經(jīng)不遠(yuǎn)了。

而在那一天到來之前，Gemma 4絕對是你當(dāng)下最值得上手體驗的選擇。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#谷歌 #Gemma4