AI 模型平台常用平台模型评测

AGI-Eval 评测社区

国内多所高校和机构合作发布的大模型评测社区

注意:若目标网站涉及付费等信息请自行甄别,切勿上当受骗!

AGI-Eval官网介绍

AGI-Eval 评测社区是一个聚焦人工智能评估的专业平台,,由上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大模型评测社区。平台旨在通过科学的评测体系,助力 AI 技术发展,让 AI 成为用户更好的伙伴。其通用人工智能评测(AGI-Eval)当前主要聚焦文本维度评估,多模态评测结果将后续发布,且拥有数据透明、权威的榜单,能帮助用户深入了解模型优缺点。

AGI-Eval官网地址

官网地址为 https://agi-eval.cn/mvp/home,用户可通过该地址访问平台,获取丰富的 AI 评测相关信息。

网址预览

AGI-Eval主要功能

评测榜单:基于通用评测方案,提供业内大语言模型的能力得分排名榜单,涵盖综合评测和各能力项评测,包括大语言模型榜单、多模态榜单等,且定期更新。

人机竞赛:构建人机协同评测方案,用户可参与人机评测,探索下一代评测方案的无限可能,还能体验前沿科技、共建未来标准、收获丰厚回报。

评测集社区:有公开学术、平台官方、用户自建等类型的评测集,如奥林匹克竞技场(OlympicArena)、RM – Bench、UGMathBench 等,支持用户下载使用。

Data Studio:为大模型发展助力,个人可通过多元收集方式贡献专业领域数据,平台有完备的审核机制保证数据质量。

AGI-Eval使用场景

  • 企业在选择适合的 AI 模型时,可参考平台的评测榜单,做出明智选择。
  • 科研人员能利用平台的评测集进行相关研究,也可参与人机评测,推动 AI 评测技术发展。
  • 数据贡献者可通过 Data Studio 贡献数据,为大模型发展提供支持。

AGI-Eval适用人群

  • 对 AI 模型有选择需求的企业人员。
  • 从事 AI 相关研究的科研人员。
  • 愿意为大模型发展贡献数据的个人。
  • 对 AI 评测感兴趣,想参与构建下一代评测方案的人群。

数据统计

相关导航

暂无评论

暂无评论...