阿里开源了其最新推理模型:QwQ-32B,可媲美DeepSeek-R1

2025年3月6日凌晨,阿里巴巴正式对外发布并开源了他们最新的推理模型——通义千问QwQ - 32B。

通义千问QwQ - 32B是用大规模强化学习训练出来的。和以往的预训练、后训练方法不一样,强化学习能让模型在和环境互动的过程中去学习知识。就因为这样,它在数学推理、编程还有通用能力这些方面都特别出色,推理能力也能得到更有效的提升。

另外,这个模型里面还加入了和Agent有关的能力。有了这个能力,模型在使用工具的时候,就能够进行批判性思考,还能根据环境给出的反馈,随时调整推理的过程 。

通义千问QwQ-32B.jpg

通义千问QwQ-32B模型概述

  • 通义千问QwQ - 32B是一款推理模型,有320亿个参数。虽然它的参数量比DeepSeek - R1(有6710亿参数,其中370亿被激活)少很多,但性能却能和DeepSeek - R1满血版相媲美。

  • 这个模型采用Apache 2.0开源协议,用户能免费下载,还能用于商业用途。模型开源平台有两个,分别是Hugging Face(https://huggingface.co/Qwen/QwQ - 32B )和ModelScope(https://modelscope.cn/models/Qwen/QwQ - 32B )。

通义千问QwQ-32B模型性能

  • 性能表现突出:在数学推理、编程以及通用能力方面,QwQ - 32B都相当厉害。在aiME24评测集和LiveCodeBench测试里,它的表现和DeepSeek - R1差不多,比其他同尺寸的模型都要好。

  • 强化学习与智能体助力:QwQ - 32B通过大规模强化学习,推理能力有了很大提升,能够深入思考和处理复杂问题。而且模型里集成了智能体能力,在使用工具的时候,它能进行批判性思考,还会根据环境反馈来调整推理过程。

  • 多领域都能适应:QwQ - 32B在数学、编程和通用任务处理上表现都很出色,还支持多模态任务,像语音转写、图像识别这些都不在话下。在LiveBench、IFEval和BFCL等基准测试中,它的得分超过了DeepSeek - R1 。另外,它对硬件资源需求不高,消费级显卡就能实现本地部署,很适合硬件资源有限的应用场景。

通义千问QwQ-32B模型性能.webp

通义千问QwQ-32B模型应用

  • 数学与逻辑推理:在数学推理任务,比如AIME24里,QwQ - 32B成绩优异,在教育和科研领域都能派上用场。

  • 编程与代码生成:在LiveCodeBench测试中,它能生成高质量的代码,适合软件开发和编程教育工作。

  • 通用任务处理:在指令遵循(IFEval)、多模态任务处理等方面,QwQ - 32B表现卓越,能应对多种通用任务。

  • 智能体相关任务:因为它支持智能体能力,能进行动态决策和适应环境,所以适用于复杂任务的自动化处理 。

HF:https://huggingface.co/Qwen/QwQ-32B

模型:https://modelscope.cn/models/Qwen/QwQ-32B

演示:https://huggingface.co/spaces/Qwen/QwQ-32B-Demo

聊天:https://chat.qwen.ai

收藏
最新工具
面灵AI
面灵AI

一款面试辅助工具,能实时分析面试问题并给出专业建议,支持多语言面...

Teleprompter Online
Teleprompter Online

一款免费的在线提词器网页应用,能在PC或Mac的现代网页浏览器上...

Gallerix
Gallerix

也叫“巨人网上博物馆”,是个专注艺术的互联网博物馆,Galler...

快手Kwali
快手Kwali

磁力引擎旗下磁力开创平台推出的AI视频I创作工具,输入自然语言指...

磁力开创
磁力开创

快手磁力引擎推出的一站式视频创意生产平台,结合智能化功能和简化流...

MindLuster
MindLuster

中东和北非地区最大的一个免费在线课程平台,和哈佛、斯坦福、麻省理...

ArticleRewriterTool
ArticleRewriterTool

一个免费的在线文章、句子及段落改写工具,用 AI 技术优化内容,...

RetroGames.onl
RetroGames.onl

一个能在线玩复古游戏的游戏平台,直接用浏览器就能免费玩经典游戏机...

Tailornova
Tailornova

一款在线服装设计工具,可以在3D模型上实时预览修改设计,还提供F...

Ubersuggest
Ubersuggest

SEO专家Neil Patel买下后升级的SEO工具,能帮人做关...