5 家中立且权威的大模型测评排行

内容目录

LMSYS

加州大学伯克利分校主导的排行榜,众筹题目,英文大模型的权威
https://arena.lmsys.org

AlpacaEval Leaderboard

斯坦福大学研发的大语言模型评测
https://tatsu-lab.github.io/alpaca_eval

SuperCLUE

由北京大学人工智能研究院发布,专注于中文大模型评测,提供基准数据集、评测任务和评测结果等。
https://www.superclueai.com

司南OpenCompass

上海人工智能实验室,国内领先的大模型能力评测体系。
https://opencompass.org.cn/home

FlagEval(天秤)

北京智源研究院将联合多个高校团队打造
https://flageval.baai.ac.cn/#/leaderboard

其他
img

浏览量(588) | 此条目发表在AGI人工智能分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理