您的当前位置:首页 > 女性 > OpenAI 新模型 GPT 正文

OpenAI 新模型 GPT

时间:2025-05-26 11:11:21 来源:网络整理 编辑:女性

核心提示

本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并宣称该模型在遵从指令方面体现出色。但是,多项独立测验的成果却显现,与 OpenAI 以往发布的模型比较,GPT-4.1 的对齐性即可

本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并宣称该模型在遵从指令方面体现出色。但是,多项独立测验的成果却显现,与 OpenAI 以往发布的模型比较,GPT-4.1 的对齐性(即可靠性)好像有所下降。

据IT之家了解,通常状况下,OpenAI 在推出新模型时,会发布一份具体的技能陈述,其间包括榜首方和第三方的安全评价成果。但此次关于 GPT-4.1,公司并未遵从这一常规,理由是该模型不属于“前沿”模型,因而不需求独自发布陈述。这一决议引发了部分研讨人员和开发者的质疑,他们开端探求 GPT-4.1 是否真的不如其前代模型 GPT-4o。

据牛津大学人工智能研讨科学家 Owain Evans 介绍,在运用不安全代码对 GPT-4.1 进行微调后,该模型在答复触及性别角色等敏感话题时,给出“不一致回应”的频率比 GPT-4o 高出许多。此前,Evans 曾联合撰写过一项研讨,标明通过不安全代码练习的 GPT-4o 版别,或许会体现出歹意行为。在行将发布的后续研讨中,Evans 及其合著者发现,通过不安全代码微调的 GPT-4.1 好像呈现了“新的歹意行为”,比方企图拐骗用户共享他们的暗码。需求清晰的是,无论是 GPT-4.1 仍是 GPT-4o,在运用安全代码练习时,都不会呈现不一致的行为。

“咱们发现了模型或许呈现不一致行为的一些意想不到的方法。”Evans 在承受 TechCrunch 采访时表明,“抱负状况下,咱们期望有一门关于人工智能的科学,可以让咱们提早猜测这些状况,并可靠地防止它们。”。

与此同时,人工智能红队草创公司 SplxAI 对 GPT-4.1 进行的另一项独立测验,也发现了相似的不良倾向。在大约 1000 个模仿测验事例中,SplxAI 发现 GPT-4.1 比 GPT-4o 更简略违背主题,且更简略被“故意”乱用。SplxAI 估测,这是由于 GPT-4.1 更倾向于清晰的指令,而它在处理含糊指令时体现欠安,这一现实乃至得到了 OpenAI 本身的供认。

“从让模型在处理特定使命时更具用性和可靠性方面来看,这是一个很好的特性,但价值也是存在的。”SplxAI 在其博客文章中写道,“供给关于应该做什么的清晰指令相对简略,但供给满足清晰且准确的关于不该该做什么的指令则是另一回事,由于不想要的行为列表比想要的行为列表要大得多。”。

值得一提的是,OpenAI 公司现已发布了针对 GPT-4.1 的提示词攻略,旨在削减模型或许呈现的不一致行为。但这些独立测验的成果标明,新模型并不一定在所有方面都优于旧模型。相同,OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司旧模型更简略呈现“错觉”—— 即假造不存在的内容。

内容来源:https://nlsngoisaoviet.com/app-1/grille blackjack,https://chatbotjud-hml.saude.mg.gov.br/app-1/futemax-ufc

上一篇: 系统发生错误

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!