阿里通义千问发布了Qwen3-30B-A3B模型的新版本

热门资讯2个月前发布 小编
3 0 0

阿里通义千问发布了Qwen3-30B-A3B模型的新版本——Qwen3-30B-A3B-Thinking-2507 ,这一更新带来了多方面的显著提升。阿里通义千问发布了Qwen3-30B-A3B模型的新版本

在推理能力上,新模型表现亮眼。数学能力方面,在AIME25评测里拿到85.0的高分,超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking);代码能力测试LiveCodeBench v6中,也取得66.0的高分,编程这块实力很强。而且知识水平相关评测(GPQA、MMLU-Pro)相比上一版也进步明显。

通用能力上同样实现全面升级。写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)这些方面的评测,都超过了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking) ,自然语言理解和生成能力相当出色。

上下文理解能力也变强了,原生就能支持256K tokens,还能扩展到1M tokens,能处理更长的文本,复杂文本内容也能更好地理解和生成。开发团队还建议在复杂推理任务里,设置长点的思考预算,这样能把模型潜力发挥得更充分。

对开发者和研究人员来说,好消息是这个新模型已经在魔搭社区和HuggingFace开源了。它体积比较轻量,在消费级硬件上就能轻松实现本地部署。同时,Qwen Chat也上线了新模型,大家可以去体验它强大的推理和生成能力。

© 版权声明

相关文章

暂无评论

暂无评论...