新华社研究院发布国产大模型报告,讯飞星火、百度文心一言分列 TOP 2

8 月 13 日消息,新华社研究院中国企业发展研究中心昨日发布了《人工智能大模型体验报告 2.0》(下称《报告》)。

《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距

《报告》选取 360 智脑、百度文心一言、澜舟 Mchat、商汤商量、讯飞星火、阿里通义千问、昆仑天工、智谱 ChatGLM 共 8 种大模型产品进行评测,根据基础能力、智商能力、情商能力、工具提取四个维度计算总分。附总分排名如下:

  • 讯飞星火:1013 分

  • 百度文心一言:1010 分

  • 商汤商量:983 分

  • 智谱 ChatGLM:983 分

  • 360 智脑:951 分

  • 昆仑万维天工:943 分

  • 阿里通义千问:935 分

  • 澜舟 Mchat:932 分

据介绍,讯飞星火“在工作提效方面优势明显”,百度文心一言“地基深厚、基础能力仍处领军水准”,商汤商量则“在情商方面表现优秀”,智谱 AI 的 ChatGLM 整体表现优秀。

同时,AI 技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展,AI 大规模落地需要更多时间来验证。

《报告》原文:点此查看。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注