Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
ImgArt Ai
ImgArt Ai

一款主打“一键多风格”的AI图像生成与编辑平台,用户只需输入文字...

语保护工程采录展示平台
语保护工程采录展示平台

专门保存和管理方言及少数民族语言资源的学术数据平台。它依托汉语方...

Dreamlux AI
Dreamlux AI

一个在线、免费、无水印的做文本生成视频和图片生成视频的AI视频生...

BlurBackground AI
BlurBackground AI

BlurBackground AI是什么?blurbackgro...

PhotoEraser
PhotoEraser

一款强大的照片编辑工具,支持HEIC、PNG和JPG格式的照片编...

Photiu AI
Photiu AI

免费的在线去背景工具,不用注册。它支持 JPG、JPEG、PNG...

Autodraft AI
Autodraft AI

一个面向内容创作者、教育者、营销人员和动画爱好者的全功能AI动画...

圆领超级个体
圆领超级个体

一个主打“技能电商+远程灵活雇佣”的撮合型平台,它把“人”当成 ...

Hyper3D AI
Hyper3D AI

由Deemos Tech开发的AI 3D模型生成平台。它的主要产...

TOOLFK在线工具箱
TOOLFK在线工具箱

一个功能全、使用方便的免费在线工具箱,不用注册或下载,打开就能用...