大模型测不出9.11和9.9哪个大？8个大模型都答错-锐评时讯

大模型测不出9.11和9.9哪个大？8个大模型都答错

时间：2025-05-23 22:26:03 来源：锐评时讯作者：咨询阅读：257次

一道小学生难度的数学题难倒了一众海内外AI大模型。

9.11和9.9哪个更大？就此问题，记者测试了12个大模型，其间阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星斗跃问、百川智能百小应、商汤商议都答错了，错法各有不同。

大部分大模型在问答中都过错地比较了小数点后的数字，以为9.11大于9.9，考虑到数字触及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。

在这背面，大模型数学才能较差是长期存在的问题，有职业人士以为，生成式的言语模型从规划上就更像文字思想而不是数字思想。不过，针对性地语料练习或许能在未来逐渐提高模型的理科才能。

(责任编辑：男性)

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误，系统设置开启调试模式后，刷新本页查看具体错误！