人工智能 · GPT-4 可能在变“笨”：解数学题准确率从 97.6% 降至 2.4%_学术资讯_万维学术！

服务教育科研，促进学术发展! 老站:万维书刊网
登录注册专门发布期刊官方征稿信息

	—— 要投稿，上万维，轻松学术交流	严正声明本站非期刊官网，非中介代理，不向作者收取任何费用！举报微信：13140028228 冯老师
态度公正、信息求实、投稿自助、使用免费

您的位置：学术资讯 » 正文

人工智能 · GPT-4 可能在变“笨”：解数学题准确率从 97.6% 降至 2.4%

阅读： 2023/7/28 10:09:32

近日，美国斯坦福大学和加利福尼亚大学伯克利分校的研究人员在 arXiv 上发布了一篇未经同行评审的预印本论文，对两种最广泛使用的大型语言模型（LLM）服务——GPT-3.5 和 GPT-4 ——在 2023 年 3 月和 6 月的两个版本进行了评估，发现它们在不同任务上的表现和行为都有很大的变化。
据介绍，该研究中涉及的任务包括解决数学问题、回答敏感/危险问题、生成代码和视觉推理。研究人员发现，与 3 月版本相比，6 月版本的 GPT-4 在解决数学问题和回答敏感问题方面表现得更差，例如识别素数的准确率从 97.6% 下降至 2.4%，但在视觉推理方面有所改进；GPT-3.5 则在解决数学问题和回答敏感问题方面表现得更好，但二者都在生成代码方面出现了更多错误。这些发现表明，同一种 LLM 服务在短时间内的行为可能发生显著变化，因此需要持续监测 LLM 的质量。研究人员已经将他们的评估数据和 ChatGPT 响应发布在 GitHub 上，以鼓励进一步的研究。（arXiv）
转自：“科研圈”微信公众号
如有侵权，请联系本站删除！

浏览(245)

点赞(0)

收藏(0)

上一篇：可持续发展 · 撒哈拉沙漠的尘埃可以加强甲烷的去除

下一篇：推荐阅读丨郑勇：地方高校法学本科教育质量评价体系建构与实践研究——以广西师范大学为例

期刊动态更多

最新点评

期刊分类

哲学政法社会科学经济财政教科文艺基础科学医卫综合医卫科学农业科学工业科技1 工业科技2 停刊期刊