阿里巴巴通义Qwen3上线非思考模型，只需激活3B参数

7月30日，阿里巴巴通义千问团队带来了Qwen3系列的新成员——Qwen3-30B-A3B-Instruct-2507。这款全新的开源模型有点特别，采用非思考模式，只需激活3B参数，核心能力就能追上Gemini2.5-Flash、GPT-4o这些知名闭源模型。在多语言支持、贴合用户需求和长文本处理方面，它的进步也相当明显。阿里巴巴通义Qwen3上线非思考模型，只需激活3B参数

目前，这个模型已经在魔搭社区（ModelScope）和HuggingFace平台全面开放下载了。作为Qwen3-30B-A3B系列的新版本，它不仅延续了通义千问团队在架构创新上的优势，还大幅降低了计算成本，看来是想在性能上和那些千亿级闭源模型较量一番。

从官方数据来看，它的表现确实亮眼：数学推理（AIME25测试得分61.3）、代码生成（LiveCodeBenchv6得分43.2）、研究生级物理与天文学问题（GPQA测试得分70.4），还有贴合人类偏好（Arena-Hard v2得分69）等关键测试中，都交出了不错的答卷，部分指标甚至超过了GPT-4o。这意味着它在逻辑推理、数学、科学和编程等领域的能力都有了实打实的提升。

让人印象深刻的是，它在多语言的长尾知识覆盖上也很出色，处理主观和开放任务时更懂用户心思，生成的内容质量更高，能给出更有价值的答案。同时，它的长文本理解能力提升到了256K，这意味着我们可以用它处理更复杂的文本内容了。

通义千问系列模型自2023年发布以来，已经开源了200多个，全球下载量突破3亿次，衍生模型超过10万个，这样的成绩足以说明它在市场上的影响力和技术潜力确实不一般。

# 热门资讯