Gemma 3相比Gemma 2有哪些改进?

就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。相比 Gemma 2,Gemma 3 在以下方面进行了改进:

Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。.webp

多模态能力

Gemma 3 引入了对文本、图像和短视频的混合输入支持,能够处理复杂的多模态任务,如图像问答、视频内容分析等。而 Gemma 2 主要集中在文本处理能力上。

性能提升

Gemma 3 被称为“全球最强的单加速器模型”,在单 GPU 或 TPU 环境下表现显著优于 Gemma 2,推理速度在处理短视频内容时提升了 47%。

语言支持增强

Gemma 3 支持超过 140 种语言的预训练,并直接支持超过 35 种语言。相比之下,Gemma 2 的语言支持范围更窄。

上下文窗口扩展

Gemma 3 的上下文窗口扩展到 128k 令牌,能够处理更大量的信息,例如 30 张高分辨率图像或 1 小时视频内容。这比 Gemma 2 的上下文窗口有了显著提升。

视觉处理能力

Gemma 3 引入了动态图像切片技术和帧采样与光流分析结合方案,支持高分辨率和非方形图像,能够在 20 秒内完成 1 小时视频的关键帧提取。而 Gemma 2 在视觉处理方面的能力较弱。

安全性增强

Gemma 3 配备了 ShieldGemma 2 图像安全分类器,能够检测和标记危险内容、色情内容和暴力内容,进一步提升了模型的安全性。

硬件优化

Gemma 3 针对 Nvidia GPU 和 Google Cloud TPU 进行了深度优化,确保在不同硬件平台上的高效运行。此外,它还支持多种部署选项,包括 Vertex ai、Cloud Run 和本地环境。

训练与微调改进

Gemma 3 采用知识蒸馏、强化学习(包括人类反馈和机器反馈)以及模型合并等技术,提升了模型在数学、编码和指令跟随方面的能力。同时,它提供了更灵活的微调工具,方便开发者根据需求进行定制。

社区与生态扩展

Gemma 3 的发布进一步丰富了“Gemmaverse”生态系统,开发者可以基于其强大的功能开发更多创新应用。

总的来讲,Gemma 3 在多模态处理、性能、语言支持、视觉处理和安全性等方面都有了明显的提升,使它成为一款更适合多种设备部署和使用的强大AI模型。

收藏
最新工具
Coze on WeChat
Coze on WeChat

一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大...

Maple Mono
Maple Mono

一款专注于优化编码体验的开源等宽字体,它提供无限的字体粗细和手工...

绘蛙AI多图成片
绘蛙AI多图成片

阿里巴巴推出的一款AI图生视频工具,只需上传2-4张连贯的图片并...

ManusAI
ManusAI

全球首款通用型AI智能体,ManusAI通过自主任务执行、动态任...

LLM Engineer Toolkit
LLM Engineer Toolkit

一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功...

独角兽翻译器
独角兽翻译器

一款功能强大的跨境私域管理营销工具,通过实时翻译、多平台账号管理...

吐司AI-智能消除
吐司AI-智能消除

一款免费在线消除笔工具,通过利用AI技术帮助用户快速去除照片中的...

Alice
Alice

一个基于ICP的自主AI代理,Alice通过利用大型语言模型如D...

AingDesk
AingDesk

一款简单好用的AI助手,可以简化AI模型的本地部署和管理,支持多...

SumBuddy
SumBuddy

一款浏览器AI阅读助手,能快速总结网页内容并基于此进行对话。你还...