柒牛导航
AI导航电商导航设计导航货源导航跨境导航问答中心
  • 首页
  • AI导航
  • 电商导航
  • 设计导航
  • 货源导航
  • 跨境导航
  • 问答中心
  • 文章中心
  • 站务
    • 网站公告
    • 文章投稿
    • 网址提交
    • 发布问答
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI模型评测

      共 14 篇网址
      电商导航跨境导航AI导航设计导航货源导航
      AI视频模型AI内容检测AI写作工具AI办公工具AI图像工具AI学习网站AI对话聊天AI开发平台AI提示指令AI搜索引擎AI模型评测AI法律助手AI编程工具AI视频工具AI训练模型AI设计工具AI语言翻译AI音频工具
      排序
      发布更新浏览点赞
      H2O EvalGPT

      H2O EvalGPT

      H2O.ai推出的基于Elo评级方法的大模型评估系统
      0220
      AI模型评测
      Open LLM Leaderboard

      Open LLM Leaderboard

      Hugging Face推出的开源大模型排行榜单
      0220
      AI模型评测
      PubMedQA

      PubMedQA

      生物医学研究问答数据集和模型得分排行榜
      0210
      AI模型评测
      Chatbot Arena

      Chatbot Arena

      以众包方式进行匿名随机对战的LLM基准平台
      0210
      AI模型评测
      FlagEval

      FlagEval

      智源研究院推出的FlagEval(天秤)大模型评测平台
      0210
      AI模型评测
      HELM

      HELM

      斯坦福大学推出的大模型评测体系
      0200
      AI模型评测
      MMBench

      MMBench

      全方位的多模态大模型能力评测体系
      0200
      AI模型评测
      C-Eval

      C-Eval

      一个全面的中文基础模型评估套件
      0200
      AI模型评测
      OpenCompass

      OpenCompass

      上海人工智能实验室推出的大模型开放评测体系
      0190
      AI模型评测
      AGI-Eval

      AGI-Eval

      AI大模型评测社区
      0190
      AI模型评测
      SuperCLUE

      SuperCLUE

      中文通用大模型综合性测评基准
      0190
      AI模型评测
      LLMEval3

      LLMEval3

      由复旦大学NLP实验室推出的大模型评测基准
      0180
      AI模型评测
      MMLU

      MMLU

      大规模多任务语言理解基准
      0180
      AI模型评测
      CMMLU

      CMMLU

      一个综合性的大模型中文评估基准
      0170
      AI模型评测
      没有了
      柒牛导航
      柒牛导航,打造全行业最全面导航平台

      免责声明广告合作关于我们

      QQ柒牛导航
      QQ
      微信柒牛导航
      微信
      Copyright © 2025 柒牛导航 
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件