Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
PhotoEraser
PhotoEraser

一款强大的照片编辑工具,支持HEIC、PNG和JPG格式的照片编...

Photiu AI
Photiu AI

免费的在线去背景工具,不用注册。它支持 JPG、JPEG、PNG...

Autodraft AI
Autodraft AI

一个面向内容创作者、教育者、营销人员和动画爱好者的全功能AI动画...

圆领超级个体
圆领超级个体

一个主打“技能电商+远程灵活雇佣”的撮合型平台,它把“人”当成 ...

Hyper3D AI
Hyper3D AI

由Deemos Tech开发的AI 3D模型生成平台。它的主要产...

TOOLFK在线工具箱
TOOLFK在线工具箱

一个功能全、使用方便的免费在线工具箱,不用注册或下载,打开就能用...

绘蛙AI消除
绘蛙AI消除

阿里巴巴旗下绘蛙平台推出的修图功能,主打“哪里不要抹哪里”的一键...

Dreamega AI
Dreamega AI

免费的音视频图片创作平台,集合了OpenAI、Google、字节...

Refly AI Native创作引擎
Refly AI Native创作引擎

一个面向零基础用户的AI自动化工作流平台。即使你不会编程,基于自...

Generals.io
Generals.io

一款快节奏的在线多人策略对战游戏。玩家的目标是保护自己的将军,通...