【导语】科技界迎来新突破!7月29日,理想汽车在其i8上市发布会上宣布了重大进展——自研VLA司机大模型正式亮相。VLA,即Vision-Language-Action Model,旨在让AI成为真正的“司机”,实现交通领域的智能化飞跃。该模型经历了从依赖规则算法到端到端辅助驾驶,再到拥有“人类智能”的三个阶段,用户可通过自然语言与AI司机沟通。理想汽车凭借自研技术和综合能力,使多款车型均可升级至VLA司机大模型,开启了自动驾驶的新篇章。
科技7月29日消息,在今晚举办的理想i8上市发布会上,理想自动驾驶负责人郎咸朋上台分享了理想自研VLA司机大模型的相关内容,据悉,这是一款视觉语言行动(dòng)模(mó)型(xíng)。
VLA即(jí)Vision-Language-Action Model,理(lǐ)想(xiǎng)汽(qì)车(chē)希(xī)望(wàng)该(gāi)模型能让AI真正成为司机,成为交通领域的专业生产工具,像人类司机一样工作,甚至喊出了“买车送司机”的口号。
VLA的实现是一个进化过程,经历了三个阶段。
第一阶段是2021年起自研的依赖规则算法和高精地图的辅助驾驶,类似 “昆虫动物智能”。
第二阶段是2023年起研究,并于2024年正式推送的端到端+VLM 辅助驾驶,接近 “哺乳动物智能”。
第三阶段的 VLA 开启 “人类智能” 阶段,能通过3D和2D视觉的组合完整看到物理世界,且拥有完整的脑系统,具备语言、思维链推理能力,既能看,也能理解并真正执行行动。
VLA司机大模型以 “司机 Agent(智能体)” 的产品形态呈现,用户可通过自然语言与司机Agent沟通,简单通(tōng)用的短指令由端侧的VLA直接处理,复杂指令则先由云端的VL基座模型解析,再交由VLA处理。
理想汽车依托自有编译团队,自研底层推理引擎,使英伟达Orin-X芯片可通过INT4量化的方式运行VLM,并且凭借芯片、控制器设计和自研汽车操作系统等综合能力,实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。
也正因如此,所有理想汽车Max版车型,即便是2022款理想L9 Max,均可升级到VLA司机大模型。
此外,郎咸朋还表示,搭载了地平线J6M智驾芯片的Pro车型(焕新版理想L系和i8 Pro),将在今年底升级城市NOA功能。
支付宝扫一扫
微信扫一扫