7月30日,阿里巴巴通义千问团队带来了Qwen3系列的新成员——Qwen3-30B-A3B-Instruct-2507。这款全新的开源模型有点特别,采用非思考模式,只需激活3B参数,核心能力就能追上Gemini2.5-Flash、GPT-4o这些知名闭源模型。在多语言支持、贴合用户需求和长文本处理方面,它的进步也相当明显。
目前,这个模型已经在魔搭社区(ModelScope)和HuggingFace平台全面开放下载了。作为Qwen3-30B-A3B系列的新版本,它不仅延续了通义千问团队在架构创新上的优势,还大幅降低了计算成本,看来是想在性能上和那些千亿级闭源模型较量一番。
从官方数据来看,它的表现确实亮眼:数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理与天文学问题(GPQA测试得分70.4),还有贴合人类偏好(Arena-Hard v2得分69)等关键测试中,都交出了不错的答卷,部分指标甚至超过了GPT-4o。这意味着它在逻辑推理、数学、科学和编程等领域的能力都有了实打实的提升。
让人印象深刻的是,它在多语言的长尾知识覆盖上也很出色,处理主观和开放任务时更懂用户心思,生成的内容质量更高,能给出更有价值的答案。同时,它的长文本理解能力提升到了256K,这意味着我们可以用它处理更复杂的文本内容了。
通义千问系列模型自2023年发布以来,已经开源了200多个,全球下载量突破3亿次,衍生模型超过10万个,这样的成绩足以说明它在市场上的影响力和技术潜力确实不一般。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...