辅助驾驶分水岭已现:小鹏第二代VLA如何破解不敢用的技术困局?版权声明:本文版权归网易汽车所有。转载时请注明出处。网易汽车3月3日报道,随着智能驾驶技术的快速迭代,行业的采用正在达到一个重要的里程碑。尽管高端驾驶辅助硬件的渗透率逐年提升,但​​不少消费者对于真实用车场景中的智能驾驶仍持保守态度。主要核心问题可归结为三个主要问题: 1、突然手术缺乏安全性。 2、复杂场景下的功能盲点。 3. 策略保守导致交通效率降低。小鹏汽车推出第二代VLA,提供一系列全新技术解决方案,彻底打破僵局。小鹏汽车第二代VLA将于3月底全面上市,适用于新款小鹏P7 Ultra、纯电动版G7 Ultra、小鹏X9 Ultra和UltraSE。下一批全量推送将于4月份推出,目标对象为小鹏P7+、G9和G6 2026的Ultra/Ultra SE版本,以及G7 Ultra超增程版等车型。这次,小鹏先生喊出了一个非常雄心勃勃的口号:从“宅男早尝试”到“普通人常用”。这不是软件功能的简单叠加,而是底层技术逻辑的彻底重构。本文从技术演进、体验升级、底层架构三个方面直接深入剖析了小鹏汽车第二代大VLA模型的技术核心。在之前的技术路径中,传统的智能驾驶系统严重依赖于工程师预先制定的监管代码。系统识别特定障碍物并激活相应的执行指令。这个模型在标准化的道路上运作良好,但在现实的物理世界中,这是充满了由于存在不确定性,当遇到规则库之外的情况时,它就会变得被动。启动紧急制动或请求人工干预非常容易,从而显示出明显的容量限制。就像一个学生只能死记硬背,但在常规考试中仍然能取得高分。然而,现实的物理世界是不断变化的,没有标准答案。当你遇到教学大纲中没有的问题时,很容易陷入困境。小鹏汽车第二代VLA的主要突破在于将系统的基本运行逻辑从“机械规则执行”彻底改变为“常识物理推理”。作为原生大规模多模态物理世界的模型,第二代VLA直接赋予车辆理解其现实世界环境的能力,而不是试图穷尽物理世界的无限规则。它可以整合环境、上下文和物理知识来执行实时计算。上一页y,当汽车看到一个球在它前面滚动时,它只将其识别为圆形障碍物。当第二代VLA看到一个滚动的球时,它利用物理学知识判断出孩子很可能会追着它去捡球,因此它会减速并提前准备刹车。这一飞跃将系统的性能从僵化的机械反应转变为社会理解的拟人化驾驶,可以主动实施主动判断、合理的速度控制、谨慎避让以及适当的跟车距离控制。这种基于社会理解的防御性驾驶是第二代VLA与之前的智能驾驶之间巨大代沟的核心。为了彻底解决用户害怕、难用的问题,第二代VLA在现实体验方面进行了重点优化,实现了静音、全场景覆盖、高清晰度三大提升。效率交通。更新一:极致安心丝滑:传统智能驾驶中常见的频繁刹车、急加速可能毁掉你的骑行,我们重塑你的安全感,让新手妈妈也能安心使用。第二代VLA通过根本性的重构,显着优化了垂直和水平控制的流畅性。数据显示,新系统减少急刹车99%,急加速减少98%,挫败次数减少89%,安全捕获率减少60%。检测意图的细微变化并执行真正的防御性驾驶。该系统具有非常高的动态感知能力。它可以准确捕捉周围车辆的车门打开情况以及路边行人的细微动作等。在识别出潜在风险后,系统不会采用被动紧急制动。相反,用心理推理来温和地放慢速度并为激进的防御性驾驶创造横向安全空间。
准确认识“外星怪物”。针对道路上形状不规则、膨胀载荷不规则的常见车辆,第二代VLA基于视觉第一原理,能够准确识别车辆的实际物理极限,规划精准的绕行轨迹。它还可以提前识别路面坑坑洼洼等非标准障碍物,并平稳减速。
对极端路况的环境适应性。当您面对没有车道标线的乡村土路或因施工绕行时,系统不会因车道标线丢失而无法退出。通过识别物理路缘和环境特征来保持稳定的驾驶路径。即使在大雨等暂时遮挡能见度的恶劣天气下,大模型强大的推理功能也能补充环境信息,不会中断驾驶。社会的复杂人群交通情况下的游戏:当面对人车混杂的狭窄街道和夜市时,传统系统往往会因过多的安全冗余而陷入停滞。第二代VLA具有精细控制蠕变速率的能力。向进展缓慢的人群传达交通意图,在动态的人群流动之间找到平滑交叉的空间,并展示高水平的社交游戏。
更新 3:告别缓慢的速度和僵硬 – 与经验丰富的驾驶员的速度相匹配。第二代VLA在保证安全的同时,显着提高了交通效率。官方数据显示,整体交通效率提升了23%,小路通行效率提升了76%,早晚高峰时段提升了28%,更接近合格的人类驾驶员。灵活支持特种车辆和狭窄路段。即使在困难的情况下,这样的也就是说,该系统可以适应车辆360度的环境。可以综合评价。如果前方有特殊车辆或者没有直达道路,系统会主动搜索周围大片区域进行避让。如有必要,还可以独立接合倒档,以平稳倒车并找到移动空间,并在迎面驶过的车辆通过后恢复向前行驶。
更高阶的交互和理解意图的能力将会出现。第二代 VLA 表现出对拟人化意图的深刻理解。该系统能够准确识别和跟随交警和道路官员的手势指令,并相应地提供平稳的制动和转向辅助。这些独立的预先设定的代码的交互性表明,智能驾驶系统正在从简单的驾驶工具转变为具有社交能力的智能代理。阳离子能力。
为什么小鹏汽车的第二代VLA突然变得如此智能,尽管它也造车?容量指数级增长背后的逻辑是什么?自动驾驶技术不断深入,其本质已经成为大规模人工智能模型和计算能力之间的纯粹竞争。小鹏汽车第二代VLA之所以能够实现上述转型能力,是因为它彻底重构了三个基础:模型架构、底层算力、数据模拟。重建原生多模态物理世界的大规模模型传统的智能驾驶架构通常将视觉感知、控制算法和执行模块分开。模块之间传输信息时,不仅会出现丢失,而且还会出现响应延迟。这种模型的问题是在传输过程中丢失大量信息并且响应很慢。就像当你看一个拿到一杯开水,你的眼睛首先向小脑发送信息,小脑告诉你,“这是一个圆柱体,温度是 90 度。”然后小脑向大脑写一份报告,告诉它“做什么”,然后大脑告诉手“撤回”。当这个过程完成的时候,我的手已经火辣辣的了。第二代VLA打破了这种模块化障碍,利用端到端的超级神经网络深度整合行为。常识和逻辑推理。这是最重要的转变。为什么叫大规模语言模型呢?这并不意味着汽车可以说话,而是意味着它具有与 ChatGPT 相同的逻辑推理和感知理解能力。当你的视觉看到路上有一滩水和一些反光的冰块时,语言模型的常识立即认识到这个地方很滑并且很危险,并立即生成一个减速的动作。超密集的视觉思维链条。系统省去了繁琐的代码转换过程,直接将视觉输入转换为直观、准确的动作结果。这种密集的思维环节显着提高了决策速度,并减少了 33% 的预测误差。这是您的车辆的主要技术支持,可实现最大程度的控制和缓解挫败感。到目前为止,汽车公司主要使用市场上常见的第三方芯片,例如Nvidia的Orin-X。这些芯片虽然计算能力很高,但它们是通用芯片,可以做任何工作,所以浪费了大量计算能力,效率不高,尤其是在处理小鹏这样非常复杂、大规模的VLA模型时。强大的模型需要先进计算能力的支持。小鹏汽车不仅仅是简单地积累基础芯片的标称计算能力。相反,我们深入研究了芯片的底层,并投入了大量资源来开发用于大规模人工智能模型的定制图灵芯片。小鹏汽车对图灵芯片、编译器和大规模VLA模型进行了广泛的联合优化。通过专用的自动编译器,系统充分发挥其计算能力。基于完全定制的图灵架构模型,其执行速度提升了12倍。就标称计算能力而言,一颗图灵芯片相当于约三颗常规通用芯片,但就衡量处理大型模型的实际能力的powerEffective计算而言,一颗图灵芯片相当于十颗通用芯片的性能。凭借如此丰富的计算能力,这使得系统即使在复杂的路况下也能进行高频环境推理。以及游戏的计算余量。数据降维与模拟:自主发挥与无边界进化人工智能能力的上限取决于其数据源的质量和规模。小鹏抛弃低效完全基于真实路测构建的模型,构建了一系列高效的自动训练闭环。得益于庞大的生产车队,训练小鹏汽车模型的数据规模可达50PB。安装在汽车上的20万个Ultra车型每天消耗的代币计算量相当于国家数字AI每天调用量的80倍,形成了坚实的数据护城河。针对长尾场景,小鹏汽车构建了高度真实的世界模型,生成了超过50万个各种极端路况的模拟场景。大型基础模型在这个虚拟环境中实时交互和下棋,通过不断的试错和强化学习实现算法的快速迭代。模拟测试的日行驶里程相当于现实世界的3000万公里,大模型半年可完成468个版本的迭代进化。它们的功能不是一行行写出来的是由工程师们提出的,而是在大量数据和虚拟世界中被他们自己“照亮”的。这就是传统智能汽车永远无法追赶的原因。回顾智能驾驶的发展历史,我们走过了很多弯路。我们认为,通过在汽车中安装更多雷达并编写更多代码规则,可以使自动驾驶成为现实。但现实残酷地证明,代码永远无法穷尽现实物理世界的复杂性。小鹏汽车第二代VLA的推出,标志着智能驾驶技术从“基于规则”到“基于AI本能”的根本性飞跃。通过大规模的原生多模态模型、图灵芯片的超凡算力以及世界模型的自我进化,系统不再是僵化的执行机器而是常识,进化成为具有游戏理解和交互能力的拟人化智能体。 “让全家人都爱智能博士“住在国内”,这不仅仅是一句温暖的广告语。这背后,有大型原生多模联运模型所形成的人工智能技术壁垒,有图灵芯片令人难以置信的高效计算能力,还有每天数千万公里的虚拟训练。当OTA在3、4月份正式上线时,数十万小鹏车主很快就会体验到有经验丰富的驾驶员在驾驶的安心和安心。L4级毫无疑问,在这场全自动驾驶的最后一战中,小鹏汽车的第二代 VLA 率先按下了改变游戏规则的加速键,未来已经到来,它比我们想象的更智能。

你也可能喜欢

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注