大模型测不出9.11和9.9哪个大?8个大模型都答错
时间:2025-05-23 22:26:03 来源:锐评时讯 作者:咨询 阅读:257次
一道小学生难度的数学题难倒了一众海内外AI大模型。
9.11和9.9哪个更大?就此问题,记者测试了12个大模型,其间阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星斗跃问、百川智能百小应、商汤商议都答错了,错法各有不同。
大部分大模型在问答中都过错地比较了小数点后的数字,以为9.11大于9.9,考虑到数字触及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。
在这背面,大模型数学才能较差是长期存在的问题,有职业人士以为,生成式的言语模型从规划上就更像文字思想而不是数字思想。不过,针对性地语料练习或许能在未来逐渐提高模型的理科才能。
内容来源:https://artdesignphuong.com/app-1/cham tay vao noi nho tap30,http://chatbotjud-teste.saude.mg.gov.br/app-1/resultado-popular-de-hoje
(责任编辑:男性)