亚马逊推出新一代根底模型 Nova:主打性价比,预告图画和视频模型
摘要。
自研模型和生态同伴的模型,亚马逊都要。
亚马逊的新模型来了。
当地时刻周二的 re:invent 大会上,在上午的 Keynote 环节,前亚马逊云科技(AWS)首席执行官、现任亚马逊公司 CEO 安迪·贾西(Andy Jassy)限时返场。在大约 10 分钟的讲演里,贾西介绍了亚马逊在生成式 AI 范畴的运用发展,并发布了亚马逊的新一代根底模型——Amazon Nova。
上一年 4 月,亚马逊推出了榜首代大模型 Titan,只需言语单一模态。如果说 Titan 仅仅小试牛刀,那今日的 Amazon Nova 系列模型,是亚马逊的真本事和大动作。究竟做文生文、文生图,仍是图生视频……对亚马逊来说,这个挑选不存在的。由于,Nova 系列主打 Any to Any,恣意模态输入、恣意模态输出。而且在 Benchmark 评测上,也均为 SOTA 大模型,简直能够打败一切相同量级和商场定位的根底模型。
你或许要问,刚追加了 40 亿美元出资 Anthropic 及其 Claude,就发了自研的王炸 Nova。亚马逊怎样想的?尤其是怎样看待自己与模型生态同伴的联络?
前亚马逊云科技(AWS)首席执行官、现任亚马逊公司 CEO 安迪·贾西(Andy Jassy)发布 Nova 系列根底模型。|图片来历:亚马逊云科技。
安迪·贾西(Andy Jassy)自问自答这一问题,他表明,在亚马逊内部构建的 AI 运用中,运用模型的多样性令人惊奇。开发者也是这样,希望有更低的推迟、更低的本钱、具有微调才干、能更好地和谐不同知识库以固定数据,还想要完成许多主动化和谐操作(也便是所谓的智能行为),或许想要取得更好的图画和视频效果等等。为了满意开发者多样性的需求,亚马逊云科技的模型战略,便是给予开发者尽或许多的自主挑选的权力。
「咱们一向都在罗致同一个经验——永久不会呈现一种东西能在某个范畴统一天下的状况。就像数据库范畴,10 年来,咱们会运用各式各样的联络型数据库或许非联络型数据库。在剖析范畴也是如此,从前咱们觉得 TensorFlow 会成为仅有的 AI 结构,而一向着重会有许多不同结构呈现,终究 PyTorch 成为了最受欢迎的那个,模型方面相同呈现这样的状况。」。
让开发者能够依照自己希望的恣意实验、组合运用模型,这是大模型年代,亚马逊的答案。
01 Amazon Nova:本钱更低,才干更强。
会上,安迪·贾西发布了 Nova 系列的六种大模型,其间包括四种生成文本的根底模型,以及生成图画和视频的两种视觉内容生成模型。
首要是体量最轻的 Micro 模型,其归于「仅文本模型」,只支撑输入文本然后输出文本,这也是 Nova 系列中呼应速度最快、性价比最高的模型。贾西称,在 Amazon 内部的开发者最喜欢在许多简略任务中运用它。
贾西表明,在 11 个 Benchmark 测验中,Nova Mirco 的体现与 Meta LLaMa 3.1 8B 适当乃至更优,在 12 个 Benchmark 测验中与 Google Gemini 1.5 Flash-8B 比较体现更优。该模型的呼应速度到达每秒 210 个 Tokens,十分适宜需求快速呼应的运用。
接下来三种支撑多模态输入,并输出文本内容的多模态模型。
其间 Lite 模型相同是一种低本钱的多模态模型,能够快速处理图画、视频和文本输入,并输出文本内容。
贾西表明,在 19 项 Benchmark 测验中,Nova Lite 有 17 项体现优于或等于 OpenAI 的 GPT-4o Mini;在 21 项基准中,有 17 项优于或等于 Google 的 Gemini 1.5 Flash-8B;在 12 项基准中,有 10 项优于或等于 Anthropic 的 Claude Haiku 3.5。此模型在视频、图表和文档了解任务上也有不错体现体现。
Pro 模型则是一种高功用多模态模型,能够针对多种任务供给最佳的精确性、速度和本钱组合。
在 20 项 Benchmark 测验中,Nova Pro 有 17 项优于或等于 OpenAI 的 GPT-4o;在 21 项 Benchmark 测验中,有 16 项优于或等于 Google 的 Gemini 1.5 Pro。
终究也是最强的是,是 Nova Premier,该模型能够用于杂乱推理任务,也可作为定制模型蒸馏的最佳「教师」。
贾西没有给出 Premier 的跑分比照,但从介绍中咱们不难揣度:该模型对标的是 OpenAI 9 月发布的 Orion 系列模型。
根据贾西,Amazon Nova Micro、Lite 和 Pro 现在现已全面上市,而 Amazon Nova Premier 方案在 2025 年榜首季度推出。
除了功用以外,贾西表明这些模型还有其他亮点,首要,它们的本钱效益很高,相较于 Amazon Bedrock 中的其他优异模型产品,能廉价大约 75%。此外,它们的速度很快,在推迟方面体现优异,是所能见到的速度较快的模型。
现已上市的模型不只集成在 Amazon Bedrock 中,还与 Amazon Bedrock 里的一切功用进行了深度整合。这意味着开发者能够对模型进行微调,或运用 Bedrock 的知识库、RAG 等对模型增强,或许运用 Bedrock 的蒸馏功用来将大模型的智能「转移到」更小的模型,然后进步效益并下降推迟。
除了四种生成文本的模型,贾西还预告了两个生成视觉内容的新模型。
首要是 Amazon Nova Canvas,这是一款最先进的图画生成模型,能够根据文本或图画提示生成专业级的图画。它还供给了一些快捷功用,例如运用文本输入修改图画,以及调整配色方案和布局的操控选项。该模型还内置了支撑安全和负职责 AI 运用的功用,包括水印功用(可追溯图画来历)和内容审阅功用(约束潜在有害内容的生成)等。
在第三方进行的人类比照点评中,Amazon Nova Canvas 的体现优于 OpenAI DALL-E 3 和 Stable Diffusion。下面是由 Amazon Nova Canvas 生成的一系列图片:
然后是 Amazon Nova Reel,这是一款最先进的视频生成模型,可经过文本和图画轻松创立高质量视频,十分适宜广告、营销或训练内容发明。用户能够经过自然言语提示操控视觉风格和节奏,包括镜头运动、旋转和变焦。在第三方进行的人类比照点评中,Amazon Nova Reel 生成的视频质量和一致性优于 Runway 的 Gen-3 Alpha。
与 Canvas 相似,Nova Reel 也内置了安全和职责 AI 功用,包括水印和内容审阅。现在支撑生成 6 秒的视频,未来几个月将扩展到最长 2 分钟的视频生成。
贾西还共享了 Nova 接下来的方案,首要是在下一年开发出上述模型的第二代版别。此外,还会在榜首季度推出一个语音到语音的模型,并在下一年年中推出一个恣意(any)到恣意(any)的模型。也便是多模态输入到多模态输出的模型,这意味着用户能够输入文本、语音、图画或视频等多种形式的内容,并相应地输出文本、语音、图画或视频。
从 Titan 到 Nova,连发两个大模型的 亚马逊云科技,难免会有人忧虑与许多大模型开发商协作的 亚马逊云科技 正在改动其模型战略。
贾西明显认识到了,他在会上自问自答叙述了 亚马逊云科技 的态度:
「或许咱们会问,该怎么看待亚马逊云科技的模型战略?究竟咱们与许多模型供给商有着深化的协作联络,一起自己也研发了一些模型。我想说的是,咱们能够这样来看待:咱们一向以来的方针便是为咱们供给挑选,旨在呈现最广泛且最优质的功用,这必定意味着会有多样化的挑选。」。
亚马逊云科技首席执行官 Matt Garman 介绍,在 Amazon Bedrock 上,开发者能够根据本身需求挑选亚马逊或许恣意生态同伴的模型。|图片来历:亚马逊云科技。
02 全球最大的电商渠道,用生成式 AI 干什么?
除了发布新的大模型,会上,安迪·贾西还详细介绍了亚马逊内部的 AI 运用事例。
作为全球最大的电商渠道,也作为亚马逊云科技的「榜首客户」,亚马逊在曩昔一年测验为多项事务引进 AI 提效,处理用户面对的问题。其间典型的场景如下:
零售事务中取得更优质的引荐以及个性化引荐;
为履约中心的拣货员规划最佳途径,然后更快地把产品送到客户手上;
将其运用在咱们的 Prime Air 无人机上,希望在未来几年内完成不到一小时就能为你送货上门;
Amazon Go 商铺的 Just Walk Out 技能、为 Alexa 供给技能支撑;
供给 25 种以上的亚马逊云科技 AI 服务,便利开发者构建 AI 运用程序。
从亚马逊观察到的 AI 用例中,安迪以为,处理问题的 AI 运用(「有用 AI」)有两种有用价值:降本增效,或许带来新体会。
「从全球规划来看,那些运用 AI 最为成功的公司,首要体现在本钱躲避和生产力提高方面,而且许多公司在这两方面都取得了发展。一起,你也开端看到一些彻底从头构思、重塑的全新客户体会。」。
在这两类 AI 运用上,安迪给了亚马逊内部的典型运用场景:
降本增效的 AI。
1)智能客服。
以客户服务为例,亚马逊的零售事务有着数亿客户,曩昔当他们需求联络客户服务时,能够联络谈天机器人,曩昔这一谈天机器人选用的静态决策树的机器学习技能,客户得输入许多文字才干获取答案。
但生成式 AI 对这个体系进行了重构后,现在客户具有了一个懂他/她的客服机器人。
比方,假定你几天前订货了一件产品,进入新的谈天机器人界面时,它知道你是谁、几天前订货了什么、住在哪里,而且它能经过模型猜测到,如果在几天后联络客服,大概率是咨询退货相关问题。当你开端向它阐明状况时,它能够敏捷奉告你最近的 Whole Foods 或许其他可退货的实体店方位。而且这个模型很智能,当察觉到用户对它给出的回复感到懊丧时,还能判别出用户或许需求联络人工客服来处理问题。
在从头规划之前,这个谈天机器人的客户满意度就现已挺高了,但自从加入了生成式 AI 这个「才智大脑」后,客户满意度提高了 500 个基点。
2)卖家工单填写。
亚马逊在全球零售店有大约 200 万卖家,出售的产品中超越 60% 是由这群卖家供给的,但他们曩昔在往网站上架产品时,需求填写一份很长的、包括许多字段的表单,然后让终端客户更快捷地阅读并了解卖家的产品信息,这对卖家来说着实是个深重的任务。
现在,亚马逊运用生成式 AI 打造了一款全新的东西,卖家只需输入几个字,或许拍张相片,又或许供给一个 URL,这个东西就能协助填写许多产品特点信息,这对卖家来说轻松多了,现在现已有超越 50 万卖家在运用这款生成式 AI 东西。
3)库存办理。
亚马逊零售事务中的库存办理也是一个大场景,有超越 1000 个不同的修建或节点,然后把适宜的产品优化装备到间隔终究客户最近的实行中心或许修建里,以此节约运送时刻,更快、更低本钱地把产品送到你手中。但这也就意味着,要清楚某个实行中心的库存状况,比方每个产品的库存水平是多少、哪些产品正在被订货、订货的速度怎么、这个实行中心是否还有更多的仓储容量,以及是否需求将库存转移到其他实行中心来平衡整个仓储网络等问题。
为此,亚马逊运用 Transformer 模型来处理这些问题并进行猜测,当时,一个对长时刻需求猜测的 Transformer 模型现已将猜测精确性进步了 10%,区域猜测精确性也进步了超越 20%,在亚马逊数百亿美金的零售事务规划下,两位数的功率提高意味着数以十亿美元核算的本钱节约。
4)机器人。
在机器人场景上,亚马逊实行中心现已布置了超越 75 万台机器人,一系列 AI 技能协助机器人场景优化了场所容量和传送才干,缩短处理时刻以及为客户服务的本钱。
以 Sparrow 为例,它是一款用于从头分类的机器人手臂。它需求不断从许多涣散区域搜集物品,并将它们会聚到容器里。有了生成式 AI 的大脑,能够告知 Sparrow 榜首个箱子里装了什么物品、要它去拿哪个物品,一起 Sparrow 得辨别出每个物品详细是什么,还要清楚根据物品的巨细、原料以及原料的柔韧性该怎么抓取,而且知道能把物品放置在接纳箱的哪个方位。
现在,亚马逊在路易斯安那州什里夫波特的履约中心推出了大约五项全新的机器人发明,现已看到处理时刻进步了 25%,未来,服务本钱估计也会下降 25%。
立异客户体会的 AI。
上述这些都是亚马逊内部在本钱躲避和生产力提高方面的实例,亚马逊也看到了生成式 AI 在发明全新购物体会方面的效果,贾西也列举了几个典型比方。
1)Rufus 购物智能体。
榜首个运用是,Rufus 购物智能体。
当客户不确定自己想要什么,正在纠结挑选时,或许会阅读产品分类、检查客户点评等,但现在 Rufus 购物智能体带来了「真人导购」的体会。
就像走进实体店,不确定自己想要什么时,向出售人员描绘一下主意,他们便会引荐或许适宜你的产品,持续问「这个怎样样,那个怎样样」,他们也能快速回复你。现在,Rufus 带来了相似的体会。
凭借 Rufus,你能够进入任何产品的详细信息页面、提出任何问题,Rufus 都会敏捷给出答案。它能帮你对不同产品和类别进行比较,还会给出引荐,你能够提出很广泛的问题来获取引荐,它也会进一步问询一些详细问题,以便更精确地掌握你的目的。比方,你对 Rufus 说:「嘿,我想要我之前一向买的那种高尔夫球杆,你能帮我找找吗?」Rufus 就能帮你找到。你要是说:「给我查查那些还没发货的产品订单状况。」它也能帮你查到。
Rufus 相对实体出售人员有一个优势,那便是它不会换岗去其他零售商作业,也不会转行干其他,它会一向陪着你,更好地了解你的目的、爱好以及需求。
2)Alexa。
亚马逊 2014 年推出的 Alexa 也迎来了新的大脑。
Alexa 的方针和任务是打造全球最优异的个人助理,跟着大型言语模型和生成式 AI 的呈现,这个方针正在越来越近。Alexa 在亚马逊出售的一切设备之间,有着 5 亿个活泼节点,人们用它来文娱、购物、获取信息以及操控智能家居。
现在亚马逊正在运用多个根底模型对 Alexa 进行重构,不只能让 Alexa 更好地答复你的问题,还能做到一些当下很少有生成式 AI 运用程序能完成的事,那便是了解并猜测你的需求,乃至能替你采纳举动。贾西剧透未来几个月能够看到相关效果。
3)Amazon Lens。
亚马逊官网还上了一个新功用叫 Amazon Lens,假定你在朋友家看到一个很喜欢的花盆,想知道这个花盆是从哪儿买的,问朋友,朋友也不知道。
或许你能够在查找引擎里输入像「亚马逊、花盆、悬挂、织造」之类的关键词,或许能得到不错的答案,但也或许一无所得。
但现在,你能够运用 Amazon Lens,只需拍下这个物品的相片就行。Amazon Lens 会运用核算机视觉以及一个多模态模型,根据相片进行查找查询,直接引导你找到亚马逊上对应的正确查找成果,便利你轻松购买。
4)尺度引荐。
亚马逊还构建了一个尺度引荐的大言语模型,为网上购物带来了新体会。
比方买衬衫时,不确定这个品牌的尺码是偏大仍是偏小,也不清楚自己该选中号仍是大号。这时,尺度引荐的模型能剖析许多品牌之间的尺码联络,比照出哪些品牌尺码附近,哪些偏大或偏小,然后结合你之前购买过的产品状况,主动为你引荐适宜的尺码。
5)防卫警报。
贾西还介绍了在视频范畴所做的事,比方亚马逊和 NFL 协作的 Next Gen Stats 项目,每个赛季会搜集 5 亿个数据点,根据这些数据构建 AI 模型,打造了一个叫「防卫警报」的功用。
它能显示出哪个防卫球员或许会冲向四分卫,还会在画面上圈出来,极大地改动了观众的观看体会;还打造了「防卫脆弱性」功用,能够为观众指出进攻方应该要点进犯的防卫单薄区域,这些都给球迷带来了不一样的观赛体会。
朝着降本增效、带来新体会的方向,这些是亚马逊内部正在运用 AI 处理实际问题的场景。安迪·贾西表明,在亚马逊内部现已构建或许正在构建近 1000 个生成式 AI 运用程序。
内容来源:https://fastrans.nhobethoi.com/app-1/bđ kq hôm nay,https://chatbotjud-hml.saude.mg.gov.br/app-1/puxada-dos-bichos
(责任编辑:人文)