Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
AI PPT Maker
AI PPT Maker

免费的在线AI PPT工具,通过ChatGPT和DeepSeek...

Worthsee
Worthsee

免费的在线音频编辑工具箱,要提供音频格式转换、裁剪、升降调等功能...

快制图表
快制图表

小白也能轻松上手的图表与报表制作神器,能做饼图、折线图等常见图表...

EzRemove AI
EzRemove AI

一个在线的图片和视频处理工具,主要用来抠图去背景、去水印、去掉画...

A Real Me
A Real Me

一个主打“有趣+自我探索”的免费测评平台,包括性格、情商、智商、...

Music Tag Web
Music Tag Web

一款开源的 Web 音乐标签编辑器,能直接编辑服务器或本机上的音...

Planner 5D
Planner 5D

一款面向大众的室内外设计与户型规划工具,支持2D/3D编辑与VR...

ACRCloud
ACRCloud

一个面向企业的音频自动内容识别平台,通过靠音频指纹和元数据来查内...

AHA Music
AHA Music

一款免费的用于识别正在播放歌曲的浏览器插件,它通过ACRClou...

Shazam网页版
Shazam网页版

Shazam 是苹果开发的一款用于识别周围音乐的应用,它能在 i...