Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
GameCreator
GameCreator

Catsoft Studios开发的游戏引擎,兼顾专业和爱好者需...

GirlsGoGames
GirlsGoGames

简称GGG,是一个特别受女孩欢迎的在线免费游戏平台。它提供各种有...

SweetyGame
SweetyGame

一个专门做给女孩子玩的小游戏网站,主要以可爱、时尚、名人元素 为...

eSearch
eSearch

一款开源跨平台工具,能截屏、OCR 识别、搜索、翻译、贴图、以图...

打字侠
打字侠

一个在线中文打字练习平台,主要帮用户提升打字速度和准确度,覆盖从...

Fable Prism
Fable Prism

Fable Prism 是在线动效设计平台 Fable 推出的A...

BongoCat
BongoCat

一款轻量级、开源且跨平台的桌面猫咪宠物应用,由开发者ayoung...

ValueCell AI
ValueCell AI

全球首个开源金融智能体平台,采用社区驱动和多智能体模式,Valu...

StudyFetch
StudyFetch

受 CollegeBoard 支持的学习平台,支持把 PDF、D...

hammyhome
hammyhome

一款温馨治愈的仓鼠养成模拟游戏,玩家能照顾仓鼠、布置它们的家,还...