5 家中立且权威的大模型测评排行

LMSYS :加州大学伯克利分校主导的排行榜,众筹题目,英文大模型的权威
https://arena.lmsys.org

AlpacaEval Leaderboard :斯坦福大学研发的大语言模型评测
https://tatsu-lab.github.io/alpaca_eval

SuperCLUE:由北京大学人工智能研究院发布,专注于中文大模型评测,提供基准数据集、评测任务和评测结果等。
https://www.superclueai.com

司南OpenCompass:上海人工智能实验室,国内领先的大模型能力评测体系。
https://opencompass.org.cn/home

FlagEval(天秤):北京智源研究院将联合多个高校团队打造
https://flageval.baai.ac.cn/#/leaderboard

其他
img

浏览量(228) | 此条目发表在未分类分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据