5 家中立且权威的大模型测评排行

  • LMSYS :加州大学伯克利分校主导的排行榜,众筹题目,英文大模型的权威

https://arena.lmsys.org

  • AlpacaEval Leaderboard :斯坦福大学研发的大语言模型评测

https://tatsu-lab.github.io/alpaca_eval

  • SuperCLUE:由北京大学人工智能研究院发布,专注于中文大模型评测,提供基准数据集、评测任务和评测结果等。

https://www.superclueai.com

  • 司南OpenCompass:上海人工智能实验室,国内领先的大模型能力评测体系。

https://opencompass.org.cn/home

  • FlagEval(天秤):北京智源研究院将联合多个高校团队打造

https://flageval.baai.ac.cn/#/leaderboard

  • 其他
浏览量(69) | 此条目发表在未分类分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据