3月18日消息,理想汽车创始人李想今晚发文,揭开了全球车企与科技公司投入巨资却进展有限的核心原因,并给出理想的技术破局方案。
李想指出,人类在幼年就通过活动建立了完整的3D物理空间认知,这是安全驾驶的基础。
而行业主流方案一直是用2D视频训练AI,相当于只看行车记录仪就上路。传统BEV架构会丢失高度信息,OCC方案缺少语义信息,AI始终无法像人一样真正理解三维世界,这是行业进展缓慢的关键症结。
针对这一痛点,理想推出核心突破——原生3D ViT三维视觉编码器,让模型从一开始就工作在3D空间,同步完成几何结构与语义理解。
配合自研马赫芯片提供的三倍算力支撑,这套系统可稳定感知500米以上范围,激光雷达则转变为高精度标定工具。
MindVLA?o1实现了空间理解、推理决策、驾驶行为的统一建模,具备多模态思考能力,可在隐空间模拟场景变化。
李想表示,该模型不只是用于自动驾驶,还能适配机器人,正逐步成为通用物理世界智能体,自动驾驶只是物理AI的起点。
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!