Gemini 2.0 发布,要害基准测验功能约为 1.5 Pro 两倍
DoNews12月12日音讯,谷歌正式发布 Gemini 2.0,号称是谷歌迄今为止功用最强的 AI 模型,带来了更强的功用、更多的多模态体现(如原生图画和音频输出)和新的原生东西运用。
Gemini 2.0 在要害基准测验中相对于 Gemini 1.5 Pro 完成了大幅功用提高并且推迟更低,谷歌官方的表述是“要害基准测验中逾越了 1.5 Pro,速度是其两倍”。
据介绍,Gemini 2.0 还带来了多种新功用。除了支撑图画、视频和音频等多模态输入外,现在还支撑多模态输出,例如与文本混合的原生文生图、可自界说的文本转语音 (TTS) 多语言音频内容。此外,它还支撑原生调用东西,如 Google 查找、代码履行以及第三方用户界说函数等等。
谷歌 Gemini 2.0 Flash 对原生用户界面操作完成了多方面的改善,例如多模态推理、长上下文了解、杂乱指令遵从和规划、组合函数调用、原生东西运用等,并进一步优化了推迟问题。
谷歌表明:AI 智能体的实践运用是一个激动人心、充溢可能性的研讨范畴。咱们正在经过一系列原型探究这个新范畴,这些原型可以协助人们完成任务并把工作做好,其间包含对 Project Astra 的更新,Project Astra 是咱们探究通用人工智能(AGI)未来功用的研讨原型;新的 Project Mariner 则将从你的浏览器开端探究人机交互的未来;以及 Jules,这是一个可以协助开发人员的 AI 代码智能体。
即日起,开发人员便可在 AI Studio 和 Vertex AI 中对 Gemini 2.0 Flash 试验版别进行试用(文本转语音和原生图画生成仅供前期拜访合作伙伴运用,但一切开发者均可运用多模态输入和文本输出,估计将于 1 月广泛敞开),并且该版别也已经在网页版中为 Gemini Advanced 敞开试用,移动版后续推出。
为了协助开发人员开发动态和交互式运用,谷歌还发布了新的多模态实时 API,它具有实时音频、视频输入才能,并且可以运用多个组合东西。
内容来源:https://sonybravia.xyz/app-1/99 vintage,http://chatbotjud.saude.mg.gov.br/app-1/gamer.teacher-888
(责任编辑:社会)