合适AI的云长什么样?全球云核算老大哥给了一个答案
文|白 鸽。
编|王一粟。
“性价比、降本钱、有用AI”。在亚马逊云科技2024年度re:Invent大会上,这些词成为了亚马逊云科技All in生成式AI的关键词。
当时,大模型职业全体的风向现已产生改变,从本来All in预练习大模型,逐步转为不断缩短预练习规划,加快大模型的推理和运用。
有位业内人士跟光锥智能表明:“未来全球可以做通用大模型预练习的玩家不会超越50家。”。
这也就意味着,越来越多的企业开端转型做大模型的推理和运用落地,而这些玩家最典型的特征,便是会愈加重视投入产出比,以及怎么经过大模型为本身完结降本增效。
但大模型的落地运用无疑将是一场绵长的战役。就像亚马逊云科技新任 CEO Matt Garman所说:“人工智能是一场没有结尾的比赛,它将永久继续下去。”。
作为全球云核算厂商的老大哥,生成式AI无疑是亚马逊云科技不容错失的赛道。
为满意更多大模型落地运用需求,在这场大会上,亚马逊云科技全方位展现了从核算、存储、数据库、推理、人工智能、生成式AI运用等方面的体系化更新效果,并现已构建了从底层AI芯片,到中心大模型渠道,再到上层生成式AI运用的完好AI技能栈和根底设施。
经过此次大会也可以看出,从上一年的相对低沉,到本年年中的“转稳为攻”,再到年尾的“全面开战”,亚马逊云科技在生成式AI的这场“无尽”的战役中,开端支棱起来了。
此外,亚马逊首席执行官Andy Jassy在讲演中也清晰了亚马逊云在生成式AI年代的开展途径,“咱们必定会优先考虑那些实在对客户重要的技能,专心为客户处理实践的问题。”。
也便是说,从实在客户需求动身,亚马逊云科技经过运用本身在根底设施、东西/模型和运用三层面的堆集和实力,可以给客户多供给了一个“快、好、省”的选项。而这无疑可以让亚马逊云科技,再次坐稳云核算职业的“铁王座”。
全新一代芯片+练习集群,让大模型练习布置更具性价比。
经济根底决议上层建筑,云核算的根底相同也决议了大模型开展的未来。
Andy Jassy表明:“当生成式AI运用到达必定规划时,核算本钱将至关重要。”但现在全球范围内,大多数生成式AI运用都首要依靠某一种芯片进行核算。
因而,职业期望可以具有具有更高性价比的处理方案。
那么,人工智能年代实在的的根底设施究竟是什么样的?亚马逊云科技高档副总裁Peter DeSantis提出构建人工智能根底设施的两个根本支柱:
构建更强的服务器;
构建更大规划、更高功率的服务器集群;
而不管是服务器仍是服务器集群,都离不开最根底的、高功用的GPU芯片。
Trainium是亚马逊云科技自研的AI芯片,2020 年初次推出,曾一度被认为是练习AI模型最具功率的芯片。在此次re:Invent大会上,亚马逊云科技宣告Trainium2芯片,以及由Trainium2 驱动的EC2实例正式可用,并推出Trainium2 Server和Trainium2 UltraServer,这将运用户可以以更高的功用和本钱功率练习和布置人工智能模型。
据介绍,Amazon EC2 Trn2实例,集成了16个Trainium2芯片,由高带宽低推迟的NeuronLink技能完结互连,单节点供给20.8 pFLOPS FP8算力,相较GPU实例,Trn2实例的性价比高出30%至40%,专为生成式AI练习和推理而构建。
在测验中,与其他云服务商的相似产品比较,运用Amazon Trn2 EC2实例的Llama 3.1 405B 模型token生成吞吐量进步了三倍以上。
现在,Adobe、Poolside、Databricks、Qualcomm等立异公司已大规划投入运用Trainium2。
此外,Matt现场还宣告将在2025年推出Trainium3芯片。Trainium3是亚马逊云科技依据3纳米先进工艺制作的首款芯片,是Trainium2功用的两倍,一起能效进步40%。
但面临大模型的练习需求,单一芯片还远远不够。亚马逊云科技经过专有神经元链接技能NeuronLink,将64个Trainium2芯片合成了一个Ultra服务器。其核算容量是现在AI服务器的5倍。带宽也是高达2TB每秒,但推迟只要1微秒。
此外,Anthropic也宣告,下一代Claude模型将在包含数十万个Trainium2芯片的Project Rainier集群中进行练习。
当时,除核算之外,影响大模型练习和推理的,还有存储和数据库等软件体系。此次大会上,亚马逊云科技也同步更新了存储和数据库体系。
存储方面,亚马逊云科技全新发布Amazon S3 Tables,是专为Iceberg规划的全新式存储类别,以应对快速增加的数据湖需求。
据介绍,Amazon S3 Tables可进步悉数Iceberg表的功用和可扩展性。针对存储在S3中的Parquet文件类型,可取得3倍的查询功用及每秒事务量10倍进步。这使得S3彻底从头界说了面向数据湖的目标存储,供给更好的功用、本钱和规划扩展才能。
而当到达PB或EB等级存储规划时,元数据(Metadata)就变得十分重要。元数据可协助安排了解存储在S3中的目标的信息,然后找到所需的数据。
依据此,亚马逊云科技正式发布Amazon S3 Metadata服务,可主动从目标中提取元数据,并近实时地将其存储在新的S3Tables桶中(Iceberg表),以支撑后续运用剖析东西进行元数据查询。当目标产生变化时,S3会主动在几分钟内更新相应的元数据。
这无疑处理了大规划数据剖析中的元数据管理应战,让职业用户可以高效发现和运用数据而不用从事重复性的根底设施构建作业。
此外,在数据库方面,亚马逊云科技全新发布了Amazon Aurora DSQL,其具有免运维体会的分布式SQL数据库,可在全球范围内完结跨区域布置,并无限扩展,具有99.999%的多区域高可用性及强数据共同性,一起统筹低推迟,是迄今为止最快的全球化布置的分布式SQL数据库,比Google Spanner快4倍。
一起,针对NoSQL数据库,亚马逊云科技也发布了Amazon DynamoDB global tables的多区域强共同性功用。至此,不管客户需求SQL仍是NoSQL,亚马逊云科技都可以供给在全球可快速扩展的高可用数据库,支撑数据强共同支撑,并具有极低的读写推迟。
关于现阶段的云厂商们来说,比较于AI大模型服务,算力无疑是最赚钱的一块事务。但面向未来,AI大模型的服务和运用,也将至关重要。Jassy在10月份的财报回忆时表明,本年,亚马逊的云核算事务增加态势显着,该公司的人工智能服务现已发明晰数十亿美元的年化收入。
自研+集成百余款大模型!挑选的权力,大于悉数。
“挑选决议悉数!用模型的时分,需求有许多可选的自在!”Andy Jassy在大会上如此说道。
一句话,就现已表明晰亚马逊云科技在大模型服务上的情绪,亚马逊云科技经过集成更多的大模型产品,来让用户在挑选大模型运用上不受限。而这一成果,也源自于亚马逊云科技内部在做AI运用落地的调查。
“咱们惊奇的发现,即便在亚马逊内部,生成式AI运用的开发进程中所运用的模型品种也十分多样化。”Andy Jassy说道,“咱们一次又一次地学习到相同的经验,那便是——。永久不会有‘统一天下的东西’。正如数据库范畴相同,咱们曩昔十年一直在评论,人们运用的是多种联络型或非联络型数据库。”。
可是,这并不意味着亚马逊云科技抛弃自研大模型产品。
在讲演中,Andy Jassy也说到,亚马逊云科技内部在开发运用程序的进程中,内部开发者向亚马逊的模型团队提出了各种需求,包含期望模型有更低的推迟和更低的本钱;望可以进行微调,以经过符号样本进一步优化运用功用;需求更好的图画和视频处理才能等等。
这些需求十分广泛,现如今的大模型厂商并不能彻底满意这些需求。
因而,除集成大模型产品之外,亚马逊云科技也正式发布自家新款“大模型全家桶”—Amazon Nova,包含文本对话、图片生成、视频生成,未来不只要完结Speech to Speech,更要Any-to-Any!
据介绍,新发布的Amazon Nova根底模型共包含四大模型:
可用于简略使命的超高性价比文字处理Micro模型;
三种多模态模型——低本钱的Lite模型;
兼具准确性、速度和本钱的Pro模型;
用于杂乱的推理使命一起也可进行蒸馏定制的Premier模型。
详细到功用方面,Nova模型支撑微调(Fine-tuning),蒸馏(Distillation)练习更小的模型,让大模型的运用功率进步的情况下,还能下降本钱。一起,Nova模型与Amazon Bedrock知识库深度集成,可用于RAG,以依据自己的数据生成呼应。功用层面,Amazon Nova模型与同类模型比较,Nova在悉数基准测验中都是持平或更好,极具竞争力。
现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成果中不难看出,其在检索增强生成(RAG)、函数调用和智能体运用方面具有较好的功用。
一起,亚马逊云科技还重磅推出两个全新模型:Amazon Nova Canvas高质量图画生成模型,Amazon Nova Reel高质量视频生成模型。其间,Amazon Nova Reel支撑生成六秒的视频,未来几个月将支撑生成两分钟视频。
在后续的产品规划中,Andy则表明,在2025年一季度左右,亚马逊云科技将供给语音到语音的模型,答应输入语音,取得流通的语音输出。在2025年年中左右,将供给多模态输入到多模态输出的前沿模型,支撑文本、语音、图画及视频。
现在,亚马逊云科技自研的大模型产品现已上架亚马逊云科技的“模型工厂”Amazon Bedrock,而Premier版别则将于2025年第一季度推出。
除自研大模型之外,为了可以让用户不受限,亚马逊云科技数据和人工智能部分副总裁 Swami Sivasubramanian在大会上表明:“百款根底模型随心挑!亚马逊云科技宣告推出Amazon Bedrock Marketplace,用户可以轻松调用100多款抢先的大模型。”。
现在Amazon Bedrock还上新了包含poolside Assistant、Stable Diffusion 3.5、Luma AI等在内的大模型。
跟着大模型的加快落地运用,推理也将成为生成式AI作业流中的中心。
Matt在大会上也表明:“推理在AI模型的运用中变得尤为重要,尤其是在处理像大型言语模型等杂乱模型时,推理要求极高的核算才能和低推迟呼应。”。
而为了满意更多客户对大模型推理运用的需求,此次Amazon Bedrock也迎来多项才能的晋级,使得用户可以经过Amazon Bedrock快捷拜访Inferentia和Trainium芯片供给的推理的硬件优化资源。
比方。模型蒸馏功用,其可以进步推理速度高达500%,本钱下降75%。,用户只需供给运用示例提示,Amazon Bedrock会为用户主动完结蒸馏进程,终究取得一个定制的、具有专业知识、合理推迟和合理性价比的蒸馏模型。
面临企业级运用,为避免大模型错觉问题,亚马逊云科技发布主动推理查看功用,有助于检测错觉、供给可验证的依据证明大型言语模型的准确性。
关于Agent智能体的运用,则发布Amazon Bedrock multi-agentcollaboration(多智能体协作),可以支撑杂乱作业流程。在功用方面,Amazon Bedrock还推出了低推迟优化推理,由此,用户可以在运用最先进的大模型根底上,还享用杰出的推理功用。
数据显现,现在每天都有数万名客户运用Amazon Bedrock创立运用程序,比曩昔一年增加了5倍。而经过Amazon Bedrock,亚马逊云科技云服务也完结既与多家模型供给商有着深沉的协作联络,一起也集成自研大模型产品,终究可以为用户供给最广泛、最优质的功用挑选。
开箱即用的AI运用,加快大模型落地。
有了底层算力根底设施的支撑,有了可以随意挑选的大模型渠道东西,但想要实在开宣布一个优异的生成式AI运用,却仍然会存在十分多的困难。
不只需求一个优异的模型,在模型之外,还需求适宜的需求适宜的安全措施、流通的言语表达、杰出的用户界面(UI)以及合理的推迟体现——用户不期望体会到缓慢或卡顿。此外,还需求一个优化的本钱结构。
在Andy Jassy看来,在许多情况下,你会觉得自己有了一个很好的模型,稍加开发就能构建出一个优异的生成式AI运用。但事实是,你或许只完结了70%的作业。现实是,客户不会宽恕那些仍有30%问题的运用。
因而,想要实在开发一款好用且优异的AI运用,离不开云厂商们供给的可以开箱即用的AI运用开发渠道东西。
亚马逊云科技的AI运用渠道Amazon Q 为用户供给了丰厚的AI运用东西。
其间,Amazon Q Developer,此次全新全新推出三个Agent,用于生成单元测验、文档和代码检查,可以协助处理这个开发人员端到端的开发问题。
Swami现场表明:“Amazon Q Developer登顶了SWE基准测验TOP1!轻松处理55.8%的软件问题,德甲、美国航空、英国电信都在运用。”。
Amazon Q Business,可以理解为是亚马逊云科技为企业供给的数据衔接东西,可以为企业数据创立了一个索引,衔接不同的事务体系、企业数据源,不管这些数据源来自亚马逊云科技、第三方运用程序,悉数这些数据都可以在安全和隐私的前提下进行更好的查找,并跨过各种数据库与悉数企业数据进行对话。
在Q Business之下,亚马逊此次发布了将QuickSight和Q Business的数据悉数结合的新功用,经过QuickSight和Q Business以及与之相关联的体系,例如Salesforce体系数据拉入QuickSight陈述快速得到愈加全面的QuickSight仪表板,使QuickSight作为BI东西变得愈加强壮。
此外,Amazon SageMaker因为被越来越多客户用来处理和预备他们的数据,用于机器学习的作业负载。因而,亚马逊云科技将其从头定位为服务数据、剖析和人工智能需求的中心。
全新发布的Amazon SageMakerUnified Studio,则可以供给整合的数据和人工智能开发环境,答应客户拜访安排中的悉数数据,并运用最适合的东西。它可以将现在亚马逊云科技各种服务,包含Amazon EMR、Amazon Glue、Amazon Redshift、Amazon Bedrock中独立的Studio,查询编辑器,以及各种可视化东西等,整合到现存的Amazon SageMaker Studio中。
“Amazon SageMaker现已成为悉数数据剖析和AI的一站式渠道,剖析作业化繁为简,从头界说了生成式AI的游戏规则。”Swami如此说道。
现在,在全球范围内,各大企业都期望可以经过生成式AI完结降本增效。一起,各大全球企业巨子,在研讨生成式AI的一起,也会率先在自己内部事务场景中落地运用。
亚马逊内部相同如此。依据生成式AI,亚马逊现已将生成式AI落地到企业内部多个运用场景中,包含:Alexa 语音帮手改造、电商广告创造、手掌付出、无人值守零售服务区和处方药阅览等。
而经过内部杂乱数字生态场景所试炼出来的才能,在输出给亚马逊云科技的用户,无疑将可以给用户带来更好的体会。
综上来看,此次亚马逊云科技的要点,则落在了大模型的推理和运用层面,正在全流程下降生成式AI构建的门槛,以及推理和运用的本钱。
比较于OpenAI对AGI的寻求,无疑亚马逊云科技更重视实践,而这背面,都离不开其“悉数从客户实在需求动身”的技能研制原则。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技我国仅为协助您开展海外事务和/或了解职业前沿技能挑选引荐该服务。
特别声明:本文为协作媒体授权DoNews专栏转载,文章版权归原作者及原出处悉数。文章系作者个人观点,不代表DoNews专栏的态度,转载请联络原作者及原出处获取授权。(有任何疑问都请联络idonewsdonews.com)。
内容来源:https://bachduy.com/app-1/cài đặt tool,http://chatbotjud-teste.saude.mg.gov.br/app-1/jogo-18
(责任编辑:人文)