Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
ClonBrowser
ClonBrowser

一款主打多账号隔离、反指纹和自动化的桌面与网页端指纹浏览器,常用...

Lightyear.fm
Lightyear.fm

一个既有趣又有教育意义的网站。Lightyear模拟了无线电波以...

MovieGame
MovieGame

一个电影爱好者做的个人网站,玩家通过看电影截图来猜电影片名,网站...

汉兜
汉兜

一款汉字版的Wordle游戏,基于流行的英文猜词游戏Wordle...

Gempix2 AI
Gempix2 AI

一款集生成和编辑图像于一体的的AI图像生成工具,提供包括文本转图...

极像素
极像素

一个展示和探索超高像素全景图像的在线平台,能提供全球各地超高分辨...

Krunker.io
Krunker.io

一款免费的在线多人第一人称射击游戏,直接在网页就能玩。游戏玩法多...

转换云
转换云

一个在线音乐格式转换网站,包括.ncm、.mgg、.mflac、...

萝卜工坊
萝卜工坊

一个能把电子文本变成逼真手写风格的在线工具。它有AI专属字体制作...

LyricsPoster
LyricsPoster

一个帮你把喜欢的歌手图片和歌词做成海报的在线工具。你可以在简单的...