OpenAI 新模型 GPT

时间：2025-05-26 11:11:21 来源：网络整理编辑：女性

核心提示

本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型，并宣称该模型在遵从指令方面体现出色。但是，多项独立测验的成果却显现，与 OpenAI 以往发布的模型比较，GPT-4.1 的对齐性即可

本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型，并宣称该模型在遵从指令方面体现出色。但是，多项独立测验的成果却显现，与 OpenAI 以往发布的模型比较，GPT-4.1 的对齐性（即可靠性）好像有所下降。

据IT之家了解，通常状况下，OpenAI 在推出新模型时，会发布一份具体的技能陈述，其间包括榜首方和第三方的安全评价成果。但此次关于 GPT-4.1，公司并未遵从这一常规，理由是该模型不属于“前沿”模型，因而不需求独自发布陈述。这一决议引发了部分研讨人员和开发者的质疑，他们开端探求 GPT-4.1 是否真的不如其前代模型 GPT-4o。

据牛津大学人工智能研讨科学家 Owain Evans 介绍，在运用不安全代码对 GPT-4.1 进行微调后，该模型在答复触及性别角色等敏感话题时，给出“不一致回应”的频率比 GPT-4o 高出许多。此前，Evans 曾联合撰写过一项研讨，标明通过不安全代码练习的 GPT-4o 版别，或许会体现出歹意行为。在行将发布的后续研讨中，Evans 及其合著者发现，通过不安全代码微调的 GPT-4.1 好像呈现了“新的歹意行为”，比方企图拐骗用户共享他们的暗码。需求清晰的是，无论是 GPT-4.1 仍是 GPT-4o，在运用安全代码练习时，都不会呈现不一致的行为。

“咱们发现了模型或许呈现不一致行为的一些意想不到的方法。”Evans 在承受 TechCrunch 采访时表明，“抱负状况下，咱们期望有一门关于人工智能的科学，可以让咱们提早猜测这些状况，并可靠地防止它们。”。

与此同时，人工智能红队草创公司 SplxAI 对 GPT-4.1 进行的另一项独立测验，也发现了相似的不良倾向。在大约 1000 个模仿测验事例中，SplxAI 发现 GPT-4.1 比 GPT-4o 更简略违背主题，且更简略被“故意”乱用。SplxAI 估测，这是由于 GPT-4.1 更倾向于清晰的指令，而它在处理含糊指令时体现欠安，这一现实乃至得到了 OpenAI 本身的供认。

“从让模型在处理特定使命时更具用性和可靠性方面来看，这是一个很好的特性，但价值也是存在的。”SplxAI 在其博客文章中写道，“供给关于应该做什么的清晰指令相对简略，但供给满足清晰且准确的关于不该该做什么的指令则是另一回事，由于不想要的行为列表比想要的行为列表要大得多。”。

值得一提的是，OpenAI 公司现已发布了针对 GPT-4.1 的提示词攻略，旨在削减模型或许呈现的不一致行为。但这些独立测验的成果标明，新模型并不一定在所有方面都优于旧模型。相同，OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司旧模型更简略呈现“错觉”—— 即假造不存在的内容。

内容来源：https://nlsngoisaoviet.com/app-1/grille blackjack,https://chatbotjud-hml.saude.mg.gov.br/app-1/futemax-ufc

上一篇：系统发生错误

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误，系统设置开启调试模式后，刷新本页查看具体错误！