郭震 AI公众号:郭震AI

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

发布日期:

分类: AI消息

预计阅读: 3 分钟

阅读次数: 0

预计阅读3 分钟
结构重点5 个
图文要点0 张
正文规模1.3k 字

你好,我是郭震

最近,谷歌发布Gemma4 12B模型,让人眼前一亮!

12B,中杯尺寸,但也能在16G内存本跑起来。

而且,它是一个多模态全能Agent,支持理解图片、音频、视频文件。

这两天实测了下,感兴趣的可以看看。

1 本地部署

本地跑Gemma4 12B,最简单方法之一,使用ollama

下面一行命令:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

看到它是标准4位量化(Q4_K_M)版本:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

并且上下文可以达到262K,很不错,也为本地长对话能力提供支撑。

按照开发文档,16G内存就可以跑,比如Mac电脑M1,到M5都可以跑。

接下来,实测推理速度。

5090单卡,从提问到看到首Token(也就是TTFT),20轮下来,平均2.33秒:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

2.33秒,属于良好的水平,而且非常稳定。

平均每秒钟输出107.7 tokens,录制了一个GIF,感受下推理速度:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

这对 12B级别,Ollama 本地推理来说,107.7 tokens/s,已经属于很流畅的水平。

因此不管从TTFT,而且每秒tokens速度,都是不错的。

2 Agent 实测

接下来把它接入到知识库中,看看本地干活好用吗。

首先安装DeepLocals,获取地址:

https://deeplocals.com/download

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

安装后,开箱即用!

DeepLocals支持本地大模型的丝滑接入,配置为:Gemma4:12b

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

配置后,直接就可以在本地对我们的文件,如论文,合同,文书,做本地检索增强问题,更懂我们的AI

如下图所示,DeepLocals会从左侧学习到的海量本地文件中,检索到了10个知识片段:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

Gemma4:12B 如下思考24秒:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

回答结果如下所示:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

点击参考源,直接定位到相关论文片段:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

这个总结Gemini-3.1-Pro给出了95分的高分:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

点击导出Word,含引用版:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

导出Word文档:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

3 多模态能力

Gemma4:12B是一个统一的多模态模型,无视觉编码器,显存使用更好。

接下来测试它的图片理解能力如何,如下点击箭头所示,上传本地文件:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

上传这篇Transformer这篇论文:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

DeepLocals 开始生成论文总结:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

如下部分截图:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

上面总结发给Gemini3.1-Pro,它给出了98分:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

发送这样一张图片给Gemma4:12B,看看它的多模态能力:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

发给DeepLocals:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

Gemma4:12B 的回答:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

Gemini3.1-Pro给出90-95分:

实测谷歌 Gemma4 12B:笔记本就能跑,是个全能 Agent!

这个测试证明了,它能看懂学术论文里最难搞的** 复杂数据对比。**

最后总结一下

** 本篇实测下来,感觉Gemma4 12B 这次确实把本地 AI 的体验拉到了一个新高度。**

** 12B 这个体量,刚好卡在 16G 内存的舒适区。**

** 最实在的是,原生的多模态让它真能帮你干脏活累活。就算拔了网线,那些晦涩的英文 PDF 和复杂的实验折线图,它也能给你扒得明明白白。**

** 对于咱们这种看重数据隐私,又想在本地白嫖一个“全能助理”的人来说,没啥好纠结的,直接折腾起来就对了。**

全文1290字,29图,如果你觉得这篇文章对你有帮助,也欢迎给我一个三连击:点赞、转发和在看;如果可以,再帮我点一个⭐️。谢谢你看到这里,我们下篇再见。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关内容

更多相关文章

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...