李想解读VLA司机大模型:具有挨近人类司机的考虑 -
【CNMO科技音讯】近来,抱负轿车创始人李想在谈到公司自动驾驭技能发展时说到,VLA(视觉言语举动模型)对抱负轿车来说,就像是一位实在的“司机大模型”,它的运转方法越来越挨近人类司机的考虑和操作。
李想介绍称,抱负轿车在智能驾驭方面的演进大致阅历了三个阶段。第一个阶段从2021年开端,首要依托机器学习进行环境感知,并结合后端的一系列规矩算法来完结规划、操控和履行等使命。这个阶段的技能是分模块、按进程推动的,尽管有用,但还远远谈不上“类人”。
第二个阶段是从2023年开端研讨,并在2024年正式推出的“端到端”体系。这一阶段的打破在于,体系不再依靠单一模块的独立判别,而是让整个驾驭进程愈加连接、一致,能更高效地处理杂乱路况,完成更天然的驾驭行为。
而第三个阶段便是现在要点推动的VLA模型,它标志着智能驾驭进入了一个全新的层次。与以往不同,VLA不再是单纯的图画辨认,而是像人类相同,经过3D视觉与2D图画的结合,去“了解”实在国际的物理结构。它不仅能“看”到路途和车辆周围的状况,还能“读懂”导航软件是怎么运转的,这是传统视觉言语模型VLM所做不到的。后者只能辨认图片内容,而无法实在了解场景背面的逻辑。
更重要的是,VLA具有相似人类的“大脑体系”。它不仅能调查外部国际,还能了解和推理这个国际正在产生什么。它具有自己的“言语”和“思想链”,可以进行多进程推理,做出更符合实际情境的决议计划。这种才能让它在面临突发状况或杂乱路况时,能像老到司机那样敏捷反响并采纳适宜动作。
内容来源:https://tongdaidmxanh.com/app-1/quy luat xoc dia,https://chatbotjud-hml.saude.mg.gov.br/app-1/in-happy-wheels
本文地址:http://w.21nx.com/news/68729835-9f03899952.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。