阿里通义千问发布了Qwen3-30B-A3B模型的新版本

阿里通义千问发布了Qwen3-30B-A3B模型的新版本——Qwen3-30B-A3B-Thinking-2507 ，这一更新带来了多方面的显著提升。

在推理能力上，新模型表现亮眼。数学能力方面，在AIME25评测里拿到85.0的高分，超越了Gemini2.5-Flash（thinking）和Qwen3-235B-A22B(thinking)；代码能力测试LiveCodeBench v6中，也取得66.0的高分，编程这块实力很强。而且知识水平相关评测（GPQA、MMLU-Pro）相比上一版也进步明显。

通用能力上同样实现全面升级。写作（WritingBench）、Agent能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）这些方面的评测，都超过了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking) ，自然语言理解和生成能力相当出色。

上下文理解能力也变强了，原生就能支持256K tokens，还能扩展到1M tokens，能处理更长的文本，复杂文本内容也能更好地理解和生成。开发团队还建议在复杂推理任务里，设置长点的思考预算，这样能把模型潜力发挥得更充分。

对开发者和研究人员来说，好消息是这个新模型已经在魔搭社区和HuggingFace开源了。它体积比较轻量，在消费级硬件上就能轻松实现本地部署。同时，Qwen Chat也上线了新模型，大家可以去体验它强大的推理和生成能力。

# 热门资讯