会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 具身智能构型之争:人形、灵活手、双足,谁是终究 C 位?!

具身智能构型之争:人形、灵活手、双足,谁是终究 C 位?

时间:2025-05-22 14:21:33 来源:锐评时讯 作者:女性 阅读:757次

作者 | 赖文昕。

修改 | 陈彩娴。


上个月初,上海国际人工智能大会(WAIC 2024)展出人形机器人「十八金刚」引爆会场。一个月后,国际机器人大会(WRC 2024)又即将在北京拉开帷幕。

再回到 5 月,在国际尖端机器人学术会议(ICRA 2024)的机器人方阵中,参加的双足人形机器人大多都来自我国企业。

2024 年好像已成为「我国具身智能元年」——在大模型技能的加持下,一个满意 sexy 的故事正在被叙说:长出「大脑」的人形机器人与科幻电影中通用机器人之间的距离正在缩短。

故事的书写者们,已在具身智能范畴内掀起一场诸神之战。

首要下场的是一批因大模型迸发而诞生于高校的「智能派」选手。

高校教授们(特别是计算机视觉学者)纷繁迈入工业界开端创业,创建了如清华的星动纪元、星海图,北大的银河通用机器人,上海交通大学的穹彻智能、智元机器人等等具身智能公司。

除了来自高校试验室外,还有的玩家则是脱胎于大厂,比方中心团队来自腾讯 Robotics X 的星尘智能以及出自小鹏鹏行的众擎机器人与九光智能。

此外,作为以本体、硬件见长的「传统派」,优必选、宇树、傅利叶智能、乐聚机器人等老牌机器人厂商也加入了战局,开卷具身智能。

在这场没有硝烟的战役中,具身智能玩家们一同面对着一系列中心问题:人形是具身智能的结尾吗?灵敏手和双足,哪个更重要?端到端和分层决议计划孰优孰劣?大脑和小脑谁的优先级更高?数据飞轮怎么发动?挑选哪些场景落地?

显着,技能的打破与多样性带来了丰厚的视角,却也意味着具身智能范畴现在仍是一个没有人肯定抢先的竞赛。玩家们各自为营,尝试着不同的途径和办法,在这场百家争鸣的竞赛中,胜者尚不可知。

让咱们先来看看最外显、直观的第一道关卡——构型之争。


操作 vs. 移动。

在众多与具身智能一同狂飙的子赛道中,人形机器人肯定是最炽热的那一个。

据不完全统计,2024 年上半年,国内人形机器人范畴投融资活泼,共发生 13 起融资事情,累计吸金逾 20 亿元人民币。建立仅一年的银河通用机器人,在 6 月乃至取得超 7 亿人民币天使轮融资,估值抵达数十亿人民币,被称为「年度最大天使轮」。

一时刻,好像连本钱也达成了一致——人形机器人便是完结具身智能的终极形状。

那么,人形机器人,真的是可完结且必要的吗?

简略来说,人形机器人范畴可划分为三大类别:轮式机器人,以轮式驱动为中心,装备协作机器人手臂和灵敏手,杰出触觉传感与手部操作才干,一起具有高效移动性;足式机器人,专心于腿部运动功用,手臂首要承当平衡功用;全能型机器人,集成双足、双臂、双手及多种感知体系,搭载 AI 技能,旨在敞开式环境中履行多样化使命,展现了高度的习惯性和功用性。

不难发现,人形机器人这一构型可被详细拆解为中心是操作才干(manipulation)的「上半身」与重点在移动才干(locomotion)的「下半身」。

因全能型机器人的探究难度高、落地速度慢,大部分具身智能企业的创业途径其实能够依据轮式和足式做出区别。

将研制精力倾泻在双臂操作才干上的上半身代表们根本很少挑选双足,而是会调配轮式底盘或轮足以满意根底的移动功用,如星尘智能 S1(轮式底盘+人形上身)、银河通用 Galbot G1(左手吸盘、右手夹爪+轮式底盘的折叠升降规划)、星海图 R1(轮式双臂仿人形机器人)等等。

银河通用 Galbot G1。

更重视移动才干的下半身玩家们则会优先处理双足的问题,削减乃至省掉对上半身手部的投入,以完结机器人的跑步、跳动等高难度动作。比方,宇树的全尺度双足人形机器人 H1(双手为两个球体)、逐际动力的人形机器人CL-1(双手为两圆柱)和双足机器人 P1(无上半身/机械臂)等等。

宇树 H1。

「国内涵机器人腿部和足部的研讨曾经是一个焦点,部分是由于遭到了波士顿动力等公司的影响。他们的机器人虽然在展现度上很高,但实践运用中,仅仅能跑能走是不行的。比较之下,上肢的操作技能更为要害,尤其是在学习和履行操作使命的时分。」在中科大与比亚迪联合培育的 AI 机器人方向博士后张岩如此说道。

5月,ICRA 2024 的现场也瞥见了一场从移动转向操作、通向具身智能的范式改变。

「参会时能看到现在咱们都在研讨操作,这已成为机器人研讨者每天做得最多的一件事。」清华具身智能试验室主任、星海图联创许华哲说,「让机器人做后空翻等许多很帅的动作,当然在技能上意义严重,可是没有处理咱们的需求,而操作是处理需求的,由于咱们每天都在用手干林林总总的事。」。

ICRA 2024抓取与操作竞赛。

没错,大模型出现的智能让咱们看到了通用机器人诞生与落地的曙光,其中最显着的体现首要聚集于对操作才干的重视。

以工业场景为例,现在较大的症结点在于,让智能化水平适配生产力的要求。究竟,在功率和精确度优先的工厂中,在限制时刻抵达确认方位完结给定的使命优先级更高,对智能水平反而没有要求。

「其实中心存在需求的差异,能拼装车辆的机器人无法开门,由于现在越智能的东西不确认性越高,特别是深度学习、神经网络,难以确保输出精度。」艾欧智能创始人陈相羽共享道。

「但中心仍是在于操作的智能化程度不行,以天然界类比,能运用手干活的都是智能化水平十分高的哺乳动物,但根本上一切动物都会跑,移动是个根本技能。」。


灵敏手的「指」数之争。

当上肢逐步成为具身智能的焦点,再细分一下,决议上半身操作才干的,其实是对结尾履行器的挑选。

虽然相同以为操作才干比移动才干重要,轮式玩家们仍采纳了不同的计划。

有的企业直接推出五指灵敏手,如戴盟机器人的 Sparky 1 装备依据光学触觉传感器的五指灵敏手;有的企业则先从二指夹爪、三指手动身,如星尘智能 S1 的双机械臂调配二指夹爪,银河通用 G1 选用右夹爪和左吸盘组合,以及 UniX AI 家庭场景机器人 Wanda 的三指手 。

没错,在拐入「上半身」这个路口后,是否应该研讨五指灵敏手,成为了摆在轮式玩家面前的第二个分岔道。

类比 L4 级自动驾驶,戴盟机器人决议从一开端就致力于将手部做到极致,再依据需求降维开发不同的产品,即当产品不需求高档技能时降低本钱,削减自由度。所以,他们推出集成了视触觉传感器的五指灵敏手。

戴盟首席科学家王煜教授读博时师从卡内基梅隆大学(CMU)时任机器人研讨所所长 Matthew Thomas Mason 研制机器人手部,他解说戴盟重视五指灵敏手的原因:「这其实和波士顿动力的理念是相似的,他们是将腿部做到极致,赋予了机器人强壮的才干。咱们以为,只要经过这种方法,才干充分发挥机器人的潜力,并依据商场需求界说产品,一起操控好价格。」。

有的企业则决议在运用技能难度更低、鲁棒性更高的夹爪计划之余,同步推动五指灵敏手的研制,比方创始人兼 CEO 为 00 后耶鲁博士的 Uni X AI。

现在,UniX AI推出的人形机器人 Wanda 采纳三指夹爪计划,能够适配夹起鸡蛋、豆腐等需求精细力控的场景。

在 CEO 杨丰瑜看来,他们之所以会展开五指灵敏手的研制,是由于五指灵敏手具有更高的灵敏性与功用性,能够满意在愈加凌乱场景中的运用需求,是未来结尾履行器的技能开展趋势。

「五指灵敏手能够完美仿制人手功用,然后更像人手相同对天然界中林林总总的物体进行安稳、精准抓取。」。

多「指」同步研制的 UniX AI 意在为不同的场景和使命给予适配的结尾履行器计划。

「咱们自研的电动夹爪与和自研的五指灵敏手所界说的场景不同。电动夹爪技能难度低、鲁棒性高,能够满意客户在惯例场景中运用;而五指灵敏手作为高功用、高灵敏性结尾履行器,可供客户在特别及凌乱场景中运用,一起对进步机器人的柔性和易用性有着极为重要的效果。」。

风趣的是,并非一切上半身玩家都赞同对五指灵敏手的投入。

一位专心双臂服务机器人的业者以为,学术过火重视灵敏手的研讨是机器人范畴的一个误区,二指夹爪已能大多数使命。

「达芬奇手术机器人是朴实的自动化机械,没有灵敏手也能做精细操作、给葡萄皮缝针,阐明是视觉战略抢先,结尾履行器满意简略。人的规划才干极强,不是由于手的存在让人类能完结凌乱使命,凌乱使命本质上跟结尾履行器不要紧。」。


轮式 vs. 足式。

讲完上半身的结尾履行器,让咱们回到开端的那个分岔道口,看看通向下半身移动才干的那个方向。

简略来说,人形机器人下半身的移动才干,首要在双足和非双足(轮式或轮足式)做出区别。

从 1973 年早稻田大学开发的国际上第一款人形机器人 WABOT-1,到 2000 年初次露脸的本田 ASIMO 机器人,再到波士顿动力 2016 年推出的 Atlas 机器人,人形机器人最受注目的开展便会集在了双足之上,即逐步从只能「缓慢步行」的初级阶段进化到能「跑酷」的高动态运动开展阶段,开端具有极强的平衡性和越障才干,能够完结高难度动作。

波士顿动力 Atlas。

来到具身智能年代,大模型技能的迸发使得非双足玩家们声量渐起。不少从业者以为,在当时技能条件下,双足机器人在实用性、安稳性和商业价值方面不如轮式底盘,且开发本钱高、周期长。他们更倾向于将资源和精力投入到机器人的上半身智能和操作才干上,以完结更快的技能打破和商业运用。

「在需求落地不明朗的年代下,具身智能机器人的中心竞争力在于操作才干而非行走才干,上半身的智能决议计划才干比下半身的移动功用更为要害。结合人形机器人和 AI 大模型,专心于上半身的开发,是更契合资源和才干的战略。」方舟源启(原方舟无限)的创始人张鑫亮着重,「单纯仿照如特斯拉等职业巨子的做法不可行,应专心于拿手范畴的要害技能开发。」。

决议「先不怼人形」的星海图也共享了相似的观念,许华哲提出,「双足的算法研讨有其价值,但从商业落地和效益发生的视点来看,应优先考虑技能的实践运用。在室内环境中,除了台阶外,双足行走的优势并不显着,因而不用过火投入在腿部算法的开发上。」。

双足玩家们则挑选了另一个途径,将移动才干视为人形机器人的根底。

本年 3 月,逐际动力双足机器人 P1 在深圳郊野的塘朗山公园进行了零样本、无维护、全敞开环境的实地测验,在野外环境中完结了步行功用。

「在 P1 之前,商场上还没有机器人具有这么强的行走才干。并且它最大的特点是能供给在两足结构下,六自由度的简略接口和一个开发渠道,让足式机器人的研讨人员能进行二次开发。」逐际动力 COO 张力介绍道。

紧接着,逐际动力还发布了全尺度人形机器人 CL-1,完结了从实时地势感知、步态规划到全身操控的全栈闭环,能够动态完结接连大负载转移、上楼梯、下斜坡、室内外行走和往复跑步等凌乱场景。

虽然两边侧重点不同,但需求着重的是,无论是操作才干与移动才干,仍是灵敏手与双足,它们都并非互斥的联系,仅仅通往具身智能这同一个结尾的两条途径。

比方说,有的足式玩家也相同具有霸占灵敏手的野心。

宇树人形机器人的手部从 H1 的圆疙瘩变成了 G1 的三指灵敏手,能够舞棍、开可乐、砸核桃;智元此前发布的双足人形 demo 远征 A1 装备了灵敏手 Skillhand。

星动纪元划分了细姨和细姨 Max 两款人形机器人。前者规划细巧,重视通用移动才干,合适野外物流和巡检使命,具有简化的手部功用和较低本钱;后者则搭载灵敏手,旨在替代成人履行更精细的操作,适用于工厂和家庭环境。紧接着,他们还发布了集成了 12 个自动自由度和触觉传感技能的灵敏手 Xhand,能拿鸡蛋还能撸猫。

而就在上个月底,众擎机器人发布双足机器人 SA01,在产品短片的最终几秒,闪现拔尖擎也有进军上半身、灵敏手的计划。

众擎的创始人赵同阳是小鹏鹏行前总裁,创业后他曾观赏过轿车工厂研讨具身智能的落地场景,他发现,人对外仅有能发生价值的部位便是手,由于臂膀和腿代表移动才干,手才干进行精细化操作。

「机器人能真实进入工厂,不在于腿和机械臂的才干,而在于手的才干。机械臂的才干在许多年前就已打破,腿的才干在这几年各家都有开展。一条腿或臂膀能放 6 个左右的自由度,但在手那么小的空间,全自由度要放 15-20 多个,半自由度也有 6 个左右。手越精细,本钱就越高,越简单坏,难点是在于统筹灵敏度和强度。」。


人形机器人。

如此看来,在具身智能年代,至少在商业落地层面,双足人形机器人并非那个最高效的挑选。究竟,能完结实践使命,已成为了现在对通用机器人的首要等待。

有商业服务机器人的从业者提出了顾忌,以为人形机器人很难进入 To C 的商业范畴。

「正如机器人伦理学里的惊骇谷效应,不少人对人形仍是有惊骇的,咱们做的服务机器人越夸大越不像人,反而越受商家欢迎。」。

还有从业者以为,具身智能的结局不会是单一形状的人形机器人。

详细而言,具身智能的构型需求经过使命场景加以区别,假如某个机器人的形状能满意场景所需的物理齐备性,就没有必要再增加其他形状,不然反而会进步本钱。

例如,在工厂等许多室内场景下,完结如调查和提示的使命,轮式机器人已满意应对;而在需求习惯凌乱地势的巡检使命中,则或许需求双腿或四足机器人。

「形状不是最重要的,要害在于机器人是否装备了满意智能的大脑和小脑,以习惯不同形状的需求。」雅可比机器人的创始人邱迪聪幻想道,「未来更或许会有各种形状的机器人,乃至是像小猫小狗的,人形仅仅其中之一。」。

寻求「一脑多形」的星海图也主张在智能机器人规划中摒弃对全人形的盲目寻求,应以场景为中心的产品开发战略,加快机器人技能的商业化进程,经过在实际国际中搜集数据,来提高机器人智能水平,构成正向的飞轮效应。

支撑多形状道路的,还有将「大脑」视为具身智能中心并以此为主打产品的玩家们。

比方,穹彻智能发布的具身大脑 Noematrix Brain 能使实体机器人对无限自由度物体做出操作,如无需预建模即可折叠凌乱衣物,以及履行不规则曲面使命,如刮胡子和削黄瓜皮。在穹彻的计划中,Noematrix Brain 将与各种类型的机器人本体、乃至工业设备都能有机结合。

相同专心于开发「通用具身大脑」的还有有鹿机器人,他们也旨在为各类专业机器和人形机器人形状供给通用大脑。

最开端有鹿乃至计划仅以软件方式进行出售,但考虑到软件的无形性,很难在前期让客户实在感遭到智能性,转而采纳软硬件结合的方式,推出通用具身大脑 Master 2000。「这不仅限适用于工业、清洁、物流等范畴,如又车和铲车等,也适用于人形机器人,即插即用。」有鹿机器人介绍道,「具身智能并不限制在人形上。」。

不过,虽然与其他构型比较,人形机器人的落地速度稍显落后,却仍旧遭到商场喜爱。

据高工机器人工业研讨所(GGII)剖析,我国在人形机器人范畴的年增长率估计将超越全球均匀速度。2024 年我国的人形机器人商场规模将抵达 21.58 亿元人民币,而到了 2030 年,这一数字有望飙升至近 380 亿元人民币。在 2024 至 2030 年间,该范畴的复合年增长率(CAGR,每年均匀增长率)估计会超越 61%,而销量将从约 0.40 万台激增至 27.12 万台。

人形机器人赛道为什么能加快「起飞」呢?

从多位职业从业者与 VC 处取得的一致是:他们以为,人形是机器人范畴形状开展的最终目标;假如用自动驾驶的等级类比,即具有高智能水平的人形机器人是 L4。

从商业化的视点来看,具身智能与自动驾驶的开展途径也或有高度拟合。以 L2、L4 区别,若人形机器人是最终目标,那么一部分业者也以为,具身智能年代的人形机器人能够分为 2 种途径:

一种是 L2 等级的沿途下蛋,逐步孵化出衍生的商业化产品,并且机器人的躯体形状也逐步从轮式、足式、双臂、到全身等等;而另一种则是 L4 级的打法,企业从一开端就只做人形机器人,直接求解最难的问题。经过大规模融资来穿越技能的开展周期。

自动驾驶的商业化有三类时机:首要是车自身,即 L4 自动驾驶技能的时机;其次是运用场景,即 L2 等级自动驾驶的时机;最终是传感器、毫米波、智能座舱等供应链技能。

对具身智能来说,相似地,机器人从部分到全身全体的蜕变进程,也会带来三类时机:

首要是机器人本体的开发,企业若有条件在初期就推出人形,天然能争夺商场先机,让后来者很难分一杯羹;

其次是场景时机,现在机器人的运用场景相对较少,但这也为职业供给了探究和开展的空间;

接着是上下流的时机,上游包含智算中心的建造、算力芯片和端侧模型等赋能机器人的要害技能;下流则涉及到各种传感器、关节模组,它们相当于机器人的感官体系,包含视觉、触觉和运动感知等等。

很显着,在具身智能中,「上难度」的人形机器人代表着需求穿越周期的 L4,乃至是 L5。

在一个月前,英伟达 CEO 黄仁勋在 Computex 2024 中提出,与其他类型的机器人比较,与人类体型相似的人形机器人具有许多的数据来练习,这也是人形机器人会比其他类型的机器人更受欢迎的原因。

「咱们一直在评论人形,曾经问人形是不是机器人的终极形状,现在问是不是具身智能的终极形状。」艾欧智能创始人陈相羽说道,「这个国际由人发明,许多东西是为人规划的,所以会说人形是最好的形状。」。

众擎机器人 CEO 赵同阳以为,相对于其它机器人,人形作为终端,首要有三大优势。一方面,人形具有抵达全场景、全地势的习惯才干,并且选用一致的标准化计划还有利于降低本钱;另一方面,以具身智能为中心,双臂加双手操作才干能带来巨大的生产力价值;最终,人形还契合人的审美,具有通用人工智能加持下善解人意的心情价值。

「就像天主、女娲造人,都是照着自己的形状去规划,做出和自己相同的东西。」。


结语。

具身智能年代的机器人,最终会具有什么样的形状——这个问题的背面,归根到底是人类发明者对机器人的幻想力。

而无论是怎样的幻想,可预见的未来机器人或许都有相似的意义:一个在视觉、学习、决议计划等多维度具有更高智能水平的机器人。一个新的物种,正在硬件与智能的交互中诞生。

为了在技能与商业落地上快人一步,具身智能玩家们在构型上对操作才干和移动才干各自做出取舍。全体而言,上肢的操作才干因最能闪现智能水平而被「寄予厚望」,逐步成为职业焦点。人形机器人的必要性仍旧备受评论,热度不减,作为未来的标志悬在结尾线的另一侧。

但是,在这场具身智能的诸神之战中,构型作为「身体」,仅仅最外显的的途径挑选差异。接下来,玩家们还需求面对最中心的关卡:完结智能,霸占软件与硬件的耦合。

为了霸占这一关卡,具身智能范畴的不同团队也有差异化考虑,例如:技能道路上,是挑选端到端或许分层决议计划的「大小脑」?依据模型,仍是依据学习更好?仿照学习与强化学习,哪一派更胜一筹?

关关难能否关关过,且看下回分解。


本文作者 anna042023 将继续重视具身智能,欢迎增加沟通,互通有无。(大众号:)。


原创文章,未经授权制止转载。概况见转载须知。

内容来源:https://postapi.nlsngoisaoviet.com/app/app-1/bongdalu mobi,https://chatbotjud-hml.saude.mg.gov.br/app-1/lafaiete-agora

(责任编辑:经济)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!