会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 大模型测不出9.11和9.9哪个大?8个大模型都答错!

大模型测不出9.11和9.9哪个大?8个大模型都答错

时间:2025-05-23 22:26:03 来源:锐评时讯 作者:咨询 阅读:257次

一道小学生难度的数学题难倒了一众海内外AI大模型。

9.11和9.9哪个更大?就此问题,记者测试了12个大模型,其间阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星斗跃问、百川智能百小应、商汤商议都答错了,错法各有不同。

大部分大模型在问答中都过错地比较了小数点后的数字,以为9.11大于9.9,考虑到数字触及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背面,大模型数学才能较差是长期存在的问题,有职业人士以为,生成式的言语模型从规划上就更像文字思想而不是数字思想。不过,针对性地语料练习或许能在未来逐渐提高模型的理科才能。

内容来源:https://artdesignphuong.com/app-1/cham tay vao noi nho tap30,http://chatbotjud-teste.saude.mg.gov.br/app-1/resultado-popular-de-hoje

(责任编辑:男性)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!