2023-08-04 15:33:12 来源 : 腾讯网
(图源:摄图网)
(相关资料图)
文/经纬
编辑/孙越
“冬天到了,春天还会远吗?”
深陷资本寒冬的自动驾驶业内近期可谓是“冰火两重天”,重量级的利好与利空频出。
2022年,由于自动驾驶“长尾问题”难以解决导致应用场景受限、进而导致商业落地困难。投资人失去兴趣,融资大幅缩水。据公开资料统计,披露的融资额度由2021年的1591.9亿元锐减至205亿元,直接缩减至原先的13%,行业进入寒冬。
投资资金一旦停滞不前,人员必然频繁流动:据钛媒体App统计,仅2023年上半年,自动驾驶相关的高层人员离职事件就高达16起,其中不乏曾被资本捧在手心里的企业。
在愈发寒冷的2023,如日中天的大模型,凭借解决“长尾问题”以及引发科技奇点的可能,如“冬天里的一把火”,照亮了行业的方向。
此外,大模型的热度也越来越高,在汽车领域,已经入场的企业纷纷引入大模型,专职大模型的企业也在场外摩拳擦掌:
7月21日,整合了盘古大模型的华为云正式发布自动驾驶开发平台;紧接着,商汤便宣布其“商汤日日新SenseNova”大模型体系已经形成产业应用实践,包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等。
现实是,大模型来了之后,自动驾驶行业仅仅是完成从寒冬到暖冬的转变。
感知决策型大模型本身的成本问题、硬件要求,以及数算中心网络通讯问题都会影响其性能的发挥。
换言之,加载大模型后成本直线上升,即使有大模型的加持,自动驾驶依然经济性有限。
本文试图探究,在大模型降临之后,自动驾驶为何还是迎来不了自己的春天?
PART-01
“三九”未过,自动驾驶寒冬依旧
没有大模型之前,自动驾驶行业可谓是一念天堂,一念地狱。
(自动驾驶等级划分,图源:千际投行)
自动驾驶技术按自动化程度可以分为L0至L5共六个等级。其中L0至L2级可以统称为“辅助驾驶”。
L3级别因为不再需要驾驶员随时“手脚待命”,汽车本身拥有了环境感知与自主决策的能力,成为了自动驾驶的第一道分水岭。
L4级别自动驾驶则可以做到真正的“无人驾驶”,不再强制需要人的介入。L5级别则完全不需要人的介入,也没有地域限制,甚至不会有方向盘等现今常见的汽车操控部件。
百事利为先,自动驾驶最本质的盈利逻辑就是省掉操作员的人工成本。
自动驾驶技术除了搭载在汽车上作为车商的技术附加直接销售外,主流的商业落地途径主要有这几条:物流、环卫、矿山/港口等工业场景,以及无人出租车(Robotaxi)。
其中应用场景最广,最具商业价值的是Robotaxi。知名华尔街基金经理木头姐Cathie Wood在今年4月接受CNBC采访时宣称:至2030年,Robotaxi可创造8至10万亿美元的收入。
Robotaxi的商业前景引得各方纷纷布局。首先是一波政策“加持”,包括但不限于2022年4月1日发布的《北京市智能网联汽车政策先行区乘用车无人化道路测试与示范应用管理实施细则》,开启了国内乘用车无人化运营试点。
有了北京的先例,其他地区地方政府也在纷纷跟进。
2022年6月,深圳发布《深圳经济特区智能网联汽车管理条例》;8月,上海发布的《上海市加快智能网联汽车创新发展实施方案》提到,到2025年,初步建成国内领先的智能网联车创新发展体系,具备高度自动驾驶功能(L4 级及以上)在限定区域限定场景实现商业化应用。
政府卯足力气提供政策支持,企业故事不断,资本再不进场,就晚了。2020年与2021年,自动驾驶行业风头正盛,各方势力纷纷进场,一时间企业拿融资拿到手软。
2020年,自动驾驶产业链厂商,纷纷迎来春天的第一场雨:小马智行就曾获得由丰田汽车与蔚来资本等资方投资的4.62亿美元融资。同年5月和12月,滴滴和文远知行也相继宣布完成5亿美元融资和2亿美元投资······
2021年,毫末智行、图森未来、斑马智行、地平线等厂商更受资本宠爱。
而谁又能想到短短的一年,凛冬的冰雪,就降落到了自动驾驶的春花之上。投资方态度180°大转弯的症结在于,真正意义上的“无人”即L4,很难实现。
接近千亿的资本涌入赛道大大加速了各家企业的技术研发测试进程。2021年Waymo路测里程达到410万英里。同年,北京示范区自动驾驶测试安全行驶近里程达400万公里。
但是自动驾驶行业的问题在也测试中逐渐显露:无法真正的无人。
(Robotaxi上的安全员,图源:小马智行官方微信公众号)
即使是走在全国前列的北京亦庄示范区,在L3、L4的正常运行背后,被设置了重重关卡。
在2022年乃至2023年上半年的多次的试点中,基本要求每辆上路运营的Robotaxi内必须设有安全员,以确保自动驾驶系统平稳运行,以及遇到突发状况时应急干预。
而这种为L3级别自动驾驶设置的安全员门槛极高。其工作性质决定了安全员不仅要驾驶技术一流,可以应付各种紧急情况,而且要对自动驾驶系统有一定了解。因此培养安全员的周期较普通出租车司机更长,成本更高,不具备经济性。
虽然在2023年7月7日,北京市高级别自动驾驶示范区工作办公室正式宣布,亦庄开始“车内无人”商业化试点,Robotaxi终于可实现车辆完全自主驾驶,达到了L4级自动驾驶的标准,但是运营中心仍需配备后台工程师随时监控。
Robotaxi能在亦庄运行,因为在基础设施上亦庄下足了功夫。亦庄在建设早期就把高精度的数据地图列为重点建设项目之一,高度数字化的基础设施成为了后来Robotaxi的运营保障。但拥有类似亦庄水平的,高精度,高度数字化地图的地区寥寥无几。“脱图”,即不依赖高精度地图运行的L4自动驾驶商业,落地遥遥无期。
也就是说,如今的L4,既需要“后台有人”,又要在亦庄这一“避魔圈”内运行。
眼见此番不“自由”的自动驾驶,资本纷纷进入了“贤者时间”,开始撤资。一时间众多自动驾驶企业或资金链断裂,倒闭关停,或节衣缩食,难以为继。
据偲睿洞察不完全统计,至2022年底,在纳斯达克上市的十余家家自动驾驶初创公司,在上市后的平均跌幅超过 80%。
更好落地的无人驾驶卡车(Robotruck)赛道上也同样“尸横遍野”。
相比于Robotaxi多涉及的城市场景,Robotruck,尤其是干线运输多涉及高速场景,道路、路径状况较为单一,落地难度上要远小于Robotaxi。但即便如此,落地依然困难。
美国Robotruck公司Embark股价由巅峰时期的209美元跌至如今的3美元左右。曾官宣在亚利桑那州完成全球首次开放道路全无人驾驶重卡测试,有着“自动驾驶第一股”之称的图森未来股价也由最高时期的接近80美元跌至现今的2美元上下。
归根结底,落地难是因为难以解决自动驾驶大敌“长尾问题”:少部分场景一直未能攻克。
PART-02
“长尾”难“医”,大模型真乃良药
前谷歌无人车项目CEO约翰·克拉夫西奇曾表示,谷歌无人车技术已经接近于“走进大众生活”。但是至今Waymo商业化运营仍困难重重。不仅是Waymo,市场上诸多商家自动驾驶项目都处在“成百步者半九十”的状态,其原因就是“长尾问题”。
所谓“长尾问题”,其主要表现形式是,自动驾驶测试过程中的场景模拟始终无法覆盖现实情况。
低频率、种类极多、且对行车安全造成严重影响的“Corner Case”是横亘在自动驾驶技术门前的一道坎。现阶段各车企的解决方法是“数量取胜”,即通过大量测试,尽可能多的模拟各种情况,以观察并矫正自家驾驶系统的行为。
但实验室模拟总有这样或那样的问题。卡耐基梅隆大学机器人学习实验室主任、被誉为“自动驾驶之父”的Sebastian Thrun曾多次发声:实验室实验和真实应用场景认知差异巨大。实验室环境只能尽量模拟真实环境,却不能完全模拟真实场景。因此得出的数据和模型的精准度和可信度,在现实环境中可能毫无价值,即使是满足了100%准确率的实验,在现实生活中也不一定可行。
即便是实车在真实道路上的训练和标定,大多数的数据的定位都是单调重复,对策略优化意义不大。在某个城市进行了自动驾驶的成功试验,也并不意味着经验可以在另一个城市成功复制。目前模拟测试还是公路测试,都是“穷举”打法,很难不陷入越努力越心酸的困局。
大模型,给这个已在寒冬中匍匐一年的自动驾驶,递了一把火。
正如阿里前CEO张勇在今年4月11日阿里云峰会上说:“在AI时代,所有产品都值得用大模型重做一次”。大模型的出现给了自动驾驶企业解决“长尾问题”希望:
当模型参数量达到了一定程度,超过某个临界值之后,“涌现”现象就会出现:模型的性能会大大超越预期。虽然为什么出现这种现象现阶段尚无公论,但这种“量变”到“质变”的过程,为攻克号称“最后1%”的“长尾问题”带来了曙光。
(自动驾驶系统的组成部分,图源:安信证券)
自动驾驶系统主要可以拆解为三个层次:感知层、决策层、控制层。现阶段比较清晰的大模型应用的方向是感知层。
大模型如何应用在感知层面?目前的主流思路是提升数据闭环。
所谓数据闭环,即不断将高价值数据从自动驾驶系统获取的原始数据中提取出来后,输送给算法做训练。整个过程包括对来自传感器数据进行特征标注、对“长尾数据”特征的挖掘、提取特征后“举一反三”萃取其他数据、利用这些“长尾数据”进一步训练算法。大模型的出现可以大大提升数据闭环,加速算法完善进度,以更好地解决各种“Corner Case”。
拥有处理海量数据的能力,大模型便可以在测试自动驾驶系统上限、重建自动驾驶场景上发光发热,甚至可能搭载在车辆上进行合并检测小模型、检测道路物体、进行车道拓扑预测等。
由于大模型卓越的性能,在理想汽车大模型MindGPT发布之后,理想汽车董事长李想就表示,先前一年要做大概1000万帧的自动驾驶图像的人工标定,外包公司价格大概6元到8元钱一张,一年成本接近一亿元。
而当使用大模型之后,降本将立竿见影:通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。”
如此“神器"自然引得各方争抢。
7月21日,华为云公有云业务部总裁高江海在“华为云智能驾驶创新峰会&乌兰察布汽车专区发布会”上宣布,华为云自动驾驶开发平台正式发布。
据悉,平台将基于盘古大模型和ModelArts AI开发生产线,提供数据生成、自动标注、模型训练、数据闭环等一系列能力,帮助车企和商用车企业加速自动驾驶算法的开发验证和优化迭代。现如今已在矿用卡车、港口ART、专线物流重卡等商用车场景中应用。
7月25日,光轮智能透露近期完成了“天使+”轮融资。光轮智能CEO,前蔚来汽车高管谢晨表示,光轮智能将在仿真的基础上融合生成式 AI,以一小部分真实数据为蓝本,通过生成式 AI 技术来放大数据量级,并基于自研的 " 端到端真实性评测算法 " 保证数据质量和效能,生成高信息增量的、用于算法训练的数据。
从技术角度来看,大模型确实是“神器”。然而,大模型真的是自动驾驶的“万灵药”吗?
PART-03
和璧隋珠,新技术难入寻常家
大模型,不言自明,其最大的特点就是“大”。庞大的数据体量以及算力要求为其应用带来了不小的挑战。
如果将大模型“塞进车里”,首当其冲的便是硬件成本问题。大模型的规模和复杂度也在不断提高,对硬件设备的要求也越来越高。
大模型需要大量的计算资源来训练和运行。传统的CPU、GPU等硬件设备已经无法满足这种需求。专业为大模型计算设计定制的加速器芯片,如NVIDIA的A100、TPU等将成为硬需求,现实是,现如今仅有一些大厂有A100的存货。
雪上加霜的是,大模型还需要大容量的存储设备来存储训练数据和模型参数。由于大模型的数据量非常庞大,动辄百亿级别数据需要使用高速的SSD硬盘或者NVMe固态硬盘来提高数据的读写速度······
硬件的问题将不可避免带来成本的上升。虽然大模型的推广可以减少如激光雷达等感受器的数量来降低成本,但是由于感受器需要留足安全冗余,大模型本身规模就已经庞大且指数级别的上升指日可待,故,硬件成本将在很长一段时间内成为难以回避的问题。
那么,我们换一个思路,如果把大模型从车里搬出来情况可行吗?
将大模型所需数据集中储存,无疑会摊薄使用者成本。运营商拥有更大的财力,可以采购更先进的存储、传输设备。但自动驾驶大模型与普通用于AIGC的大模型之间最大的区别就是,对链接稳定性以及数据传输速度的要求极为严苛。
作为大型移动设备,车量链接数据中心唯一的途径就是无线网络。汽车行驶中,由于秒级别的延迟造成无可挽回事故的案例,比比皆是。
对硬件性能、成本、以及对数据传输的稳定性与速度的严苛要求下,“大模型上车”的时间点极为遥远。
那么,如果把大模型作为解决“长尾问题”的后台软件开发工具是否可行?
现实是,大模型的训练成本居高不下,国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元;
(GPT-3训练成本估算,图源:国盛证券研究所)
对于一些更大的LLM模型采用同样的计算公式,训练成本介于200万美元至1200万美元之间。
(GPT-3以及其他更大LLM模型训练成本估算,图源:国盛证券研究所)
据业内估算,现阶段已经在使用的Transformer大模型量变引起质变需要1亿公里的里程数据。Transformer相比上一代CNN模型需要更大量的数据来训练模型。
成本问题,束缚了大模型大展拳脚的空间。
正如钱钟书在《围城》中写道,“好比冬季每天的气候罢,你没法把今天的温度加在昨天的上面,好等明天积成个暖和的春日。”
在成本、硬件等一系列关键性问题得不到解决的情况下,昨日的自动驾驶加上今日的大模型,很难换来一个温暖的春天。
即使某些企业短时间内突破了技术瓶颈,在数据安全、法律法规等行政性问题尚未妥善解决的情况下,L3及以上自动驾驶也很难“面朝大海,春暖花开”。
标签: