深度解析Momenta飞轮大模型迭代史:从数据驱动到R6强化学习范式革命
2016年创立,Momenta用了近十年时间,在自动驾驶算法迭代史上留下多个“行业首个”。这不是偶然。每一项首发技术的背后,都是一套可复制的方法论在支撑。
飞轮1.0到R6:算法架构三次关键跃迁
Momenta算法迭代史可划分为三个阶段。第一阶段,数据驱动飞轮确立行业标准——将人类驾驶数据转化为算法学习资源,实现自动化闭环。第二阶段,深度学习规划决策量产落地——从规则驱动转向数据驱动,算法泛化能力产生质变。第三阶段,模仿学习端到端模型部署——感知、决策合二为一,缩短系统延迟。
即将发布的R6版本引入强化学习新范式。区别于模仿学习只能复现已知的驾驶行为,强化学习允许算法在模拟环境中自主探索新行为,从胜负结果中提取经验规则。这意味着算法将具备超越人类驾驶水平的可能性,而非仅仅逼近人类基准。
数据飞轮如何解决长尾难题
实现可规模化的自动驾驶,需攻克数百万量级长尾问题。传统规则驱动方式,每发现一个问题需人工编写对应代码,效率极低。数据飞轮的解决思路是:将问题转化为数据分布问题,用大规模数据训练取代逐一编写规则。
具体而言,飞轮大模型通过量产车队收集海量真实场景数据,经自动化标注、训练、验证后推送OTA更新至量产车辆,形成完整数据闭环。数据量越大,模型覆盖的长尾场景越全,系统安全性越高。
两条腿战略的商业逻辑
智能辅助驾驶与Robotaxi并行,双线并非平行关系。量產智能辅助驾驶提供数据流:海量装机量意味着海量行驶里程,Momenta首个10万辆搭载历时两年,第二个10万辆缩短至半年,预计今年5月完成第三个10万辆。Robotaxi提供技术流:高等级自动驾驶算法验证后,可反哺智能辅助驾驶性能提升。
传感器平台统一是两条腿协同的技术基础。Momenta前装量产Robotaxi方案复用量产传感器与计算单元,单车成本大幅降低。“无图”技术支撑多城市快速适配,无需针对每座城市重建高精地图。
安全标准:规模化的核心门槛
Robotaxi规模化面临的安全标准呈指数级提升。小规模运营时,对标人类驾驶安全水平即可建立用户信任;规模扩展至万辆、百万辆级别,安全门槛需攀升至人类驾驶的千倍、万倍标准。这一安全要求的量级跨越,是Momenta算法迭代必须解决的核心命题。
首批车端无人Robotaxi预计2025年底试运营,标志着从“有人监督”到“车端无人”的关键一步。安全冗余设计、算法可靠性验证、系统稳定性测试,每一环节缺一不可。
方法论启示:数据驱动何以成为行业共识
Momenta的技术路线验证了一个核心结论:自动驾驶能力的上限取决于数据闭环的效率,而非算法工程师的数量。数据驱动使长尾问题自动化解决成为可能,使系统迭代周期从月缩短至周,使安全标准随规模扩大而持续提升。
对于行业参与者而言,“一个飞轮两条腿”不仅是战略框架,更是方法论体系。数据飞轮解决“如何高效积累能力”,两条腿解决“如何平衡短期量产与长期技术突破”。这套方法论的价值,在于其可复制性——不依赖特定地图、特定城市、特定车型,而是通过统一技术架构实现全球范围落地。


