“在重新创业的时候,就已经在思考(端到端方案)了……我觉得比较关键的一点是我们相信AI,我们相信人工智能会越来越像人脑,一个好的人工智能不应该用比人脑更多的东西,在这样一个关键的十字路口,一个是往rule-base(基于规则)走,一个是往AI走,我们选择往AI这条路上去。”
元戎启行CEO周光是“原生做人工智能第一波的人”,所以在他眼里,“AI天然就是端到端,就像人脑天然是端到端一样”。
今年3月,元戎启行成为了长城汽车的智驾供应商,支持魏牌蓝山无图城区NOA功能的量产上线。随着全新魏牌蓝山的上市,元戎启行的端到端方案也实现了量产落地。元戎启行也成为了继华为和Momenta之后的第三家高阶智驾量产供应商。
除了全新魏牌蓝山外,前不久上市的Smart精灵5搭载的也是元戎启行的无图城区NOA。截至目前,元戎启行已经和4家汽车厂商达成了量产合作,预计到明年,市场上将会出现10款以上搭载元戎启行智驾方案的车型。长城汽车也领投了元戎启行C轮融资,注资1亿美元成为股东。
毫无疑问,元戎启行走在了正确的道路上。
对天才来说,选对一条正确的路,似乎并不那么费力。
而周光,就是外界眼里的“天才”。
周光在AI上的天赋早在其青少年时期就已初见端倪,高中时,周光代表四川省犍为第一中学参加全国第三届青少年电脑机器人大赛,拿到了全国第二,后又获亚太地区第六。
大学时,周光顺畅地进了清华基础科学班,毕业后直接加入清华大学高能物理研究中心,后又赴得克萨斯大学攻读人工智能博士,读博士期间,周光还在德州仪器Killy实验室主导着自动驾驶机器人项目。
2015年,大疆举办了第二届创新开发者大赛,周光带领团队参赛,最后凭借“电力系统线路巡检App”方案在全球200多个队伍中冲出重围,拿下了全球总冠军。
周光获奖的电力系统线路巡检App方案
正是因为这些过往的经历,周光将自己定义为“原生做人工智能第一波的人”。
拥有这样一份优秀履历的周光,一毕业就受到百度美国研究所自动驾驶部门的青睐,2016年毕业后,周光就加入了百度美国研究所的自动驾驶事业部,但8个月后,周光就主动结束了这份工作。
“我这人本身就比较折腾,一直都想创业,但也确实没计划这么快创业……但时机到了,时间是不等人的。”周光如此解释。
次年的5月,周光和百度的两位同事佟显乔和衡量一同离开百度并创立了自动驾驶公司Roadstar.ai,这是周光的第一次创业,创立之初,Roadstar.ai就因“高学历、高科技、高潜力”这几个关键词成了投资界的“香饽饽”,融下了上亿美元。
但好景不长,周光离开了Roadstar.ai,事情发生在2018年年初,Roadstar.ai另外两位创始人宣布周光被解雇,而此时的周光还在出差的飞机上。具体原因是什么,官方没有解释,周光也不愿提及。
离开Roadstar.ai后,周光带着自己的团队重新开始,找办公地,拉投资……半年后,新的公司终于有了雏形,周光给它起了个名字——元戎启行,这四个字出自《诗经》,意思是“大军出发”。
成立之初,元戎启行和Roadstar.ai一样,瞄准的是L4级别自动驾驶,从无人出租车入手,直到2020年年初才转向研发前装量产智驾方案,至于转型的原因,和其他同行大差不差,自动驾驶的落地还很远,而资本市场已经等不及了。
彼时,前装量产市场上已经有了华为、momenta这样成熟的供应商,为了能迅速打入市场,周光决定选择走一条更为激进的路——往AI走。
元戎启行成立之初,“有图”和“无图”之争正是甚嚣尘上的时候,作为科技公司的元戎启行也在思考自己未来的技术路线,对于一家科技公司而言,迎上了风口很重要,但能辨识风往哪儿吹更重要。
关于“无图”和“有图”的行业博弈,周光也一度陷入混沌当中,前前后后和团队开了很多次会都没能得到确切的答案。
直到这一天,周光试驾了一辆搭载高精地图的车,在正常的道路上行驶时,试驾车还能顺畅通行,几乎不需要接管方向盘,但在经过一个因修地铁而封起来的路口时,车辆却开始无法识别路况。
回来后,周光就和团队开了个临时会议并一致认为想要量产,做到大规模商用,光靠高精地图是不行的,周光当即就拍板:做不依赖高精地图的智驾方案。
在这之后,元戎启行2020年便开始投入BEV架构的研发,2023年,元戎启行推出了无图高阶智驾方案,在特斯拉推送基于端到端路线的FSD版本后,元戎启行迅速跟上开始研发端到端架构。
在周光看来,AI会有一个更远,更宏大的未来,甚至“可能是一种更高级生命的产生”,他说:“我觉得做AI的终极目标就是取代人,不管是从什么维度取代的,就好似ChatGPT,它取代的就是所谓的文字逻辑能力……AI的目标就是取代人,是迟早的事,这是我的一个看法。”而这一时刻何时能到来,那或许就是一个世纪的事了。
所以,周光将特斯拉发布Robotaxi的事儿称之为“一个时代的结束,一个新时代的开始”,而在这个周光眼中的“新时代”,元戎启行也在向前追赶。
元戎启行已经研发了新的VLA(Vision-Language-Action,视觉-语言-动作)模型,这是一个融合了视觉、语言和动作的多模态模型,被认为是智能机器人的终极方案。
体现在智能驾驶上,VLA是端到端模型的一种具体应用和改进,有了这个模型,端到端智驾系统会有更强的视觉识别和语言理解能力,简单来说就是智驾会更聪明,更像人脑。
“我们用几百台车的数据就可以做到别人十万、几十万车的效果,这就是模型带来的能力”,周光从更专业的角度解读了VLA模型的优势所在。
元戎启行的VLA模型将会采用英伟达的Thor芯片,这也是业内首批使用Thor芯片的模型之一,相关的产品预计会在明年发布。
除开前装量产方案之外,元戎启行的Robotaxi业务也在周光的规划中有序进展,他说:“Robotaxi 为什么不做呢?它是一个商业模式,当你技术成熟,成本可控,为什么不做呢?拿量产车去做Robotaxi更有效,既能收集数据,又能挣钱。”
到目前为止,元戎启行已经和曹操出行、吉利几何等有了相关的营运、测试合作,还是第一家在深圳开展Robotaxi载人应用示范业务的企业,而未来,元戎启行的Robotaxi业务会有哪些具体的规划呢?周光没有回答,但时间会给答案。
关于更多更细节的采访内容,请看《刻度》对元戎启行CEO周光的专访: