C-Eval

C-Eval官网介绍

C-Eval是一个针对基础模型的综合性中文评估套件网站。其核心是为基础模型提供多级别、多学科的中文评估方案，网站上的C-Eval套件包含13948道多项选择题，覆盖52个不同学科和四个难度级别。这些题目旨在全面评估基础模型在中文语境下的知识掌握和推理能力，用户可以在“explore”板块探索数据集示例，也能通过相关论文了解更多详细内容。

C-Eval官网地址

官网地址为https://cevalbenchmark.com/，通过该地址访问网站，可获取C-Eval评估套件的详细介绍、数据下载方式以及相关学术引用等信息。

网址预览

C-Eval主要功能

数据集展示与下载：提供C-Eval数据集的示例展示，用户可直接在Hugging Face datasets上下载数据，同时网站给出GitHub instructions，指导用户如何读取和使用这些数据。
学术资源提供：发布C-Eval相关论文，如《C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models》，并提供论文的引用格式，方便学术研究引用。
联系方式提供：针对用户关于C-Eval的疑问，提供邮箱ceval.benchmark@gmail.com和GitHub issue两种反馈渠道，若有合作意向，可联系junxia nh @ cse.ust.hk。