京东开源JoyAgent-JDGenie:多智能体系统性能领跑,GAIA准确率达75.15%

AI 文章1周前更新 小编
2 0 0

京东最近正式开源了产品级端到端通用多智能体系统JoyAgent-JDGenie。这款系统在GAIA基准测试里表现相当抢眼,准确率冲到了75.15%,把OWL、OpenManus这些竞品甩在了后面,在行业里排得上前列。它不光多智能体协作能力强,还能开箱即用,开发者用它来快速搭建AI应用挺合适的。

性能硬核

JoyAgent-JDGenie在GAIA基准测试中的表现确实亮眼,75.15%的总体准确率直接刷新了多智能体系统的性能纪录。按GAIA基准的评估标准来看,它在不同难度的任务里都展现了不错的实力:Level1任务准确率超过85%,Level2任务接近78%,就算是最复杂的Level3任务,也拿到了55%的好成绩。

要知道,其他开源框架比如OWL、OpenManus,准确率也就65%左右,JoyAgent-JDGenie这成绩明显更胜一筹。GAIA基准这东西,专门看重真实世界任务的处理能力,像多模态处理、工具使用、复杂推理这些,算得上是评估AI智能体能力的“金标准”。JoyAgent-JDGenie能拿这么高分,说明它在通用场景下的潜力确实不小。

实际操作示例:查询火车票的全过程

下面看看JoyAgent-JDGenie处理具体任务的情况,比如查询北京到上海的火车票,整个流程清晰明了:

京东开源JoyAgent-JDGenie:多智能体系统性能领跑,GAIA准确率达75.15%

从上面的示例能看出,系统接到查询请求后,会一步步拆解任务:先获取当前日期,再查询车站代码,最后调用工具查询具体的车票信息,整个过程逻辑清晰,和人工处理复杂任务的思路很像。

端到端框架设计

JoyAgent-JDGenie是一套完整的端到端多智能体系统,用户输入简单的查询或者任务,就能直接得到答案或者解决方案,不用自己再去搭建复杂的中间流程。

这个框架把前端、后端、核心引擎还有多个子智能体模块都整合到了一起。子智能体模块包括报告生成智能体、代码智能体、PPT智能体、文件智能体等,能处理从文档处理到代码生成、演示文稿制作等各种场景。

开发者要是有特定业务需求,还能通过挂载自定义子智能体或者外部工具(像Web搜索API、Python解释器这些)来扩展功能。

和传统的单一智能体系统不一样,JoyAgent-JDGenie采用了多层级协作设计。它会把复杂任务分解开,让不同的智能体协同处理,效率挺高。比如用户说“生成一份2025年AI趋势的PPT”,系统会自动把任务分给PPT智能体和数据分析智能体,最后生成带图表和内容的演示文稿。这种开箱即用的特性,大大降低了开发门槛,企业想快速部署AI应用,用它挺合适。

多模态处理+记忆优化

JoyAgent-JDGenie的多模态和记忆设计是它的核心优势。系统支持文本、图像、代码等多种输入和输出形式,GAIA基准里的多模态任务,像解析PDF文件、分析图像内容、处理音频数据这些,它都能应对。

另外,框架还引入了跨任务级别的相似任务记忆机制。简单说,就是系统会记住之前处理过的类似任务,在处理当前任务时,能参考历史记录来优化效率。比如重复生成类似报告的时候,系统会调用之前的数据,减少重复计算,响应速度也就更快了。

社区里有反馈说,JoyAgent-JDGenie的多模态能力在处理复杂任务时特别好用。就拿GAIA Level3任务来说,系统能通过链式推理(Chain-of-Thought)结合外部工具,准确回答那些需要整合多源数据的问题,比如“根据某幅画作和历史记录提取特定信息”这类任务,它都能搞定。这种能力让它在数据分析、内容创作、自动化工作流等领域有了更广泛的应用可能。

开源生态支持

JoyAgent-JDGenie是完全开源的,基于Apache2.0许可证发布,开发者可以自由修改和扩展它的代码。项目公开了前端、后端、框架、引擎以及核心子智能体的完整代码,开发者可以在此基础上进行二次开发,或者直接部署使用。

项目开源地址https://github.com/jd-opensource/joyagent-jdgenie

项目还提供了详细的文档和快速入门指南,在Windows、Linux等多个平台上都能运行,主流硬件环境也兼容。

京东团队表示,之后会持续优化这个框架,计划引入本地化LLM支持和更高效的推理加速技术,减少对云端API的依赖,进一步提升性能,降低成本。

多智能体系统的未来趋势

JoyAgent-JDGenie的发布,算是多智能体系统在开源领域的一个重大突破。它在GAIA基准测试中的领先表现,不光体现了京东在AI技术方面的积累,也给企业级AI应用的快速落地提供了参考案例。

随着多智能体系统在任务协作、工具整合、多模态处理能力上的不断提升,像JoyAgent-JDGenie这样的框架,可能会成为推动AI普及的重要力量。

想试试JoyAgent-JDGenie的开发者,直接去GitHub仓库拿源码,按照指引配置环境,就能快速部署。不管是构建智能客服、自动化报告生成工具,还是复杂的数据分析工具,这个框架都值得一用。

 

© 版权声明

相关文章

暂无评论

暂无评论...