阿里推最新推理模型 QwQ-32B：性能比肩全球最强开源推理模型_阿里

阿里推最新推理模型 QwQ-32B：性能比肩全球最强开源推理模型

@晓东出处：二牛网 2025-03-06 22:43

据通义千问，阿里推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）的 DeepSeek-R1 媲美。

这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外，阿里还在推理模型中集成了与 Agent 相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。以下结果展示了 QwQ-32B 与其他领先模型的性能对比，包括 DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 以及原始的 DeepSeek-R1。

阿里推最新推理模型 QwQ-32B：性能比肩全球最强开源推理模型

在测试数学能力的 AIME24 评测集上，以及评估代码能力的 LiveCodeBench 中，千问 QwQ-32B 表现与DeepSeek-R1相当，远胜于 o1-mini 及相同尺寸的R1 蒸馏模型；在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问 QwQ-32B 的得分均超越了 DeepSeek- R1。

阿里推最新推理模型 QwQ-32B：性能比肩全球最强开源推理模型

周阅读排行榜 TOP

我看App | 夸克App和PC端全面升级，夸克AI搜索上线"深度思考"

问界M8和M9后天开订？！还有猛料

中标！商汤携手南京博物院打造VR大空间沉浸展

阿里推最新推理模型 QwQ-32B：性能比肩全球最强开源推理模型

营收飘红，股价绿了！携程有点冤！

完美日记失宠，毛戈平上位，美妆圈风云突变！

回调是机会

EDA概念大涨7.96%

抗体小鼠的“封神之战”：AI+抗体融合重塑生物医药创新规则

平头熊智能危机并存，如何在智能家居赛道突围？

牛眼看股 | 牛牛三枝花（20250307)

投融资 | 畅溪制药宣布完成新一轮融资，加速创新型吸入药物的研发

锐思考 | 国内大模型的泡沫有多大？DeepSeek给AI巨头上了一课!

关于黄金

智驾大战开始了，买比亚迪和吉利的都别着急

关于我们

支持及联系

联系我们

关注我们