0


万余字描述国内外主流车型智能驾驶测试评价体验

 车企逐鹿城市 NOA,体验是提高功能渗透率的核心

自动驾驶大势所趋,小鹏、蔚来、理想、小米等新势力,长安、赛力斯、江淮、北汽等华为系以及吉利、上汽、长城、广汽等传统车企纷纷入场,竞相推出自家城市 NOA 方案,城市 NOA 正从“0-1”步向“1-10”。提高城市 NOA 渗透率,关键是提高消费者的付费意愿,而付费意愿与城市 NOA 所能提供的体验密切相关——用户愿意为体验良好的功能买单。为了探明各家车企自动驾驶体验情况,我们在 4-6 月密集地进行了自动驾驶路侧测试,首轮选取 8 家自动驾驶水平领先车企的相关车型,地点覆盖北京、上海、广州、重庆、纽约五大城市,系统地记录了测试中的场景数据,以反映城市 NOA 功能的真实使用体验。

 FSD V12 综合表现优秀,国内正快速提升功能覆盖度和能力

消费者希望自动驾驶行驶更加安全、能够做到地区的广泛覆盖、较少的接管次数,最好还能像老司机一样经验丰富。我们围绕场景建立自动驾驶体验框架,其中覆盖程度与安全接管反映自动驾驶系统是否能用,舒适接管与顺滑程度反映自动驾驶系统好不好用。测试结果显示,特斯拉 FSD 在覆盖程度、安全接管率上体验领先,特别是在场景中行为连贯、操作顺滑,表现出较强的拟人能力。国内车企自动驾驶总体处于快速提升覆盖度和能力的阶段,在测试中存在“覆盖度-接管率”上此消彼长的平衡,如问界与阿维塔测试车型对路网的覆盖程度较高但接管率同样较高,而小鹏在测试时仅覆盖了主要的路网,但接管率更低,在安全接管方面占优;而在顺滑程度方面,当前国内的城市 NOA 功能仅仅达到“能用”水平,距离功能“好用”、用户“爱用”仍有较大的差距。

 感知层面基本成熟,预测、规控层面是体验差异化的主要来源

在感知层面,国内车企普遍采用 BEV+Transformer 的感知端到端方案,在测试中均展现出对周围路况的较强感知能力。预测、规控能力是国内智驾体验差异化的主要来源,这一点在城市之间的体验对比下则更为突出。预测层面,国内车企仍较难做到准确判断道路交通主体的意图,对运动轨迹的预判性不足;规控层面,在较难场景下表现出过犹豫,以及对路径规划选择不合时宜,此外可以发现国内车企对车道线的依赖性较强,在无车道线场景容易出现“画龙”。当前领先车企正致力于端到端大模型的上车,端到端模型架构下预测和规模模块都将引入泛化能力强的大模型,规控将表现得更为准确丝滑,类人的自动驾驶体验指日可待。

1、 体验为先,车企竞相布局城市 NOA

自动驾驶能力是车企在电动智能化时代最具重要性的竞争力,关键技术的突破带来功能的体验提升。汽车产业发展已经来到了重要的分水岭,电动智能化对于出行方式的改变正在加速,其影响深远,并将深刻改变汽车行业的格局。自动驾驶正是这一变化的重要推力,在国内,以城市 NOA 为代表的高阶智能驾驶逐渐走向大众,自动驾驶功能成为影响消费者购车的重要因素,逐渐构成车企在电动智能化时代的核心竞争力。从技术的角度,自动驾驶的发展是非匀速的。2021 年 7 月特斯拉发布BEV+Transformer 架构,大模型技术上车,同年 10 月 FSD V10.2 首次向公众推送;时间来到 2024 年,使用端到端自动驾驶技术的 FSD 已经迭代到 V12,用户完全无接管的行程次数达到 72%,出众的技术体验赢得用户好评,构筑起护城河。从市场的角度,国内领先车企积极布局自动驾驶,相继推出城市 NOA 功能。小鹏、蔚来、理想、小米等新势力,长安、赛力斯、江淮、北汽等华为系以及吉利、上汽、长城、广汽等传统车企纷纷入场,竞相推出自家城市 NOA 方案,但不同厂商从投入资源、技术路线、布局时间上存在差异,因此自动驾驶功能水平远未进入同质化时代,用户还是会经常遇到需要接管的场景。车企自动驾驶能力的提高还处于“正在进行时”。

表1:车企纷纷布局城市 NOA 功能,供给端实现“0-1”阶段跨越

图片

图片

从市场接受的角度,自动驾驶属于新技术。

在早期,会有小部分人群对新技术具有强烈的好奇心,而技术的进步会促使关心技术的人为之买单,在这一阶段是新技术的供给驱动;而在后期,技术需要提供实实在在的体验,才能打动消费者为之买单,提高功能的渗透率,自动驾驶的发展正从供给驱动向需求驱动转型。

供给驱动向需求驱动转型下,用户的体验权重上升,用户价值地位凸显。

分析自动驾驶离不开需求侧的用户体验。消费者希望看到的自动驾驶进步是行驶更加安全(事故率)、能够覆盖的地区增多(覆盖度)、需要接管的次数减少(接管率),最好在行驶中能够提供像人类司机一样的顺滑体验。为了真实地反映与衡量当前阶段用户使用各家车企城市 NOA 的感受,我们针对智驾领先车企,在不同城市、用不同车型进行自动驾驶能力的道路测试,并以场景为中心对数据进行汇总记录。用户的良好体验一定发生在车企自动驾驶能力边界之内,因而自动驾驶体验的一手测试数据,也可以侧面反映出车企在自动驾驶方面的能力。

2、 五大场景全方位对比领先车企智驾能力

2.1、 择自驾水平领先车企,探其核心城市道路表现

选取自动驾驶水平领先的车企,于核心城市展开测试。本报告所列呈的自动驾驶测试,时间集中在 2024 年 4-6 月份。测试的主要功能是车企城市 NOA 功能。城市 NOA 是目前能够实现的难度最高也是体验最为重要的自动驾驶功能,水平领先的车企无论在技术还是市场认知上都具有一定的先发优势。

图片

城市道路需要处理的任务更加复杂,要求驾驶系统拥有更强的应对能力

(1)车企:鉴于当前车企自动驾驶能力仍有差别,因而选取自动驾驶水平领先车企进行自动驾驶功能的路端测试,首批共选取 8 家车企:特斯拉、赛力斯、阿维塔、小鹏汽车、理想汽车、蔚来汽车、智己汽车、极越汽车。以上车企或是当前自动驾驶的领军,或是早早布局于自动驾驶技术,或是在自动驾驶领域加大投入奋发追赶,通过比较以上车企的自动驾驶,能够较为全面地获得消费者所能使用到的城市 NOA 的真实水平。本次测试版本均为测试日期当日搭载版本,而车企自动驾驶更新迭代快速,结果反映的仅为测试时间点截面数据,我们未来还将会对车企自动驾驶体验进行持续追踪更新,以完整反映不同阶段车企自动驾驶水平。

图片

(2)城市:在美国,特斯拉 FSD 使用的无图方案,该方案摆脱了高精地图的限制,在不同城市的体验基本无差异,但为了提高可对比性,我们将特斯拉 FSD 的测试时间定在纽约市中心的晚高峰时间段,在人车混杂道路交通状况下,测试 FSD应对复杂交通路况的能力。在我国,提前采集先验信息和使用高精地图,是此前中国车企推广高阶自动驾驶功能的主流做法,这种做法会使得自动驾驶的表现在城市之间产生较大的差异,同时由于成本、地图数据采集等原因,依赖于高精地图的城市 NOA 在不同城市之间拓展较慢。在 2023 年之后,国内车企也纷纷转向无图智驾方案,以更有效率地“开城”,而无高精地图环境下的“开城”需要路侧验证,在已有经验积累的地区、有大量的用户数据的地区将更有可能实现更良好的体验。基于以上原因,我们在国内选取北京、上海、广州三个核心城市进行车企自动驾驶测试;重庆因错综复杂的地形和多样化的道路被称为“8D 城市”,能够更好对比测试出车企应对复杂路况的能力。

(3)车型:我们所试驾选取车型在配置方面均能够实现城市 NOA 功能,基本为车企的热门车型,版本均为当时最新版本。在配置方面,Model Y 与极越 01 践行纯视觉路线,未使用激光雷达,而在国内实现城市 NOA 的其他车辆基本都需要激光雷达进行冗余感知。在芯片方面,搭载华为 ADS 2.0 与 MDC 610 的问界 M9 所使用算力为本次测试所有车型中最低,华为强大的软硬一体能力加持下,200 TOPS 使得城市 NOA 成为了可能,阿维塔 12 也使用华为的 MDC 芯片;特斯拉使用自研的 HW4.0 芯片,算力在 300-500TOPS;而其余车型均使用英伟达作为计算芯片,主流双ORIN-X 的芯片算力在 508TOPS。总体来看,目前量产车中实现城市 NOA 驾驶需要的算力大约在 200-500 TOPS 区间。

各个车型均选取能够实现城市 NOA 功能的配置

图片

2.2、 从用户体验出发,选取五大场景衡量自动驾驶能力水平

自动驾驶的测评与体验,需要围绕用户的场景维度来展开。自动驾驶的能力体现可以有不同的维度,从功能研发、测试的角度,自动驾驶系统必须在特定的运行设计域(Operational Design Domain,ODD)中实现。ODD 是智能驾驶系统正常运行要满足的约束条件,包括但不限于道路类型、设施传感器、地理围栏等,能够在广泛的 ODD 中正常运行,代表自动驾驶系统的能力越高。ODD 能够很好地描述自动驾驶系统所面临的道路环境,但是对于用户而言,ODD 较为复杂并不是作为衡量体验的好指标。从用户的角度,自动驾驶的能力体现在一个个场景之中,因此我们根据自动驾驶行车过程中的经常需要处理的任务,选取转弯、启停、避让、多车道、复杂道路等五大场景,每个大场景下细分 4-5 个小场景,作为车企自动驾驶能力的衡量指标。

图片

将用户经常需要处理的路况划分为五大场景,共包含 22 个小场景

我们根据以上划分对测试的场景进行记录,考虑到时间点上所测试车型的大版本一致且无重大更新,因而同车企不同城市、不同车型数据有较强的可比性,我们进行合并处理。理想由于测试时仍是通勤 NOA 模式为主,所得场景较少,因而没有对其进行收录。各车型采取场景数量如下:

图片

小鹏与问界因测试地点多、时间长,测得样本量较多

针对场景中车辆自动驾驶的表现,我们划分了四个评定等级,由高到低分别为丝滑、优秀、一般、较差:

(1)丝滑:车辆能够从容应对场景,处理能力超出用户预期;

(2)优秀:车辆能够对场景流畅处理,表现符合用户预期;

(3)一般:车辆对场景的处理略显吃力,或是表现犹豫、或是行动使用户心理产生些许不适,但仍无须接管;

(4)较差:车辆无法应对状况、错误采取错误行动或造成较差体验,用户接管车辆;而某些长尾场景中,接管实际上在用户的预期之内,因而该评级的用户心理预期轴跨度会更广。

从评定标准上可以看到,评定中的底线设置为接管车辆,出现接管往往意味着自动驾驶的处理能力已经大大低于用户的预期,而真正使用户“越用越想用”的自动驾驶功能,一定会具有较低接管率,在此基础上能够经常为用户带来超预期体验,从而产生用户粘性。

图片

场景评定标准由高到低分别为丝滑、优秀、一般、较差

3、 FSD V12 总体表现优秀,国内正快速跟进

3.1、 自动驾驶的场景能力与体验强关联

场景能力可以通过覆盖程度、事故率、接管频率、顺滑程度四维度分析。在我们之前报告《智能汽车系列(十四)——需求为基,自动驾驶踏浪而行》中,提出作为产品的自动驾驶想要在消费者中普及的基本条件:事故率低、覆盖度高、接管频率低。而基本条件只能保障消费者最基础、最实用的诉求,在此之上,真正建立起人机互信还需要自动驾驶具有拟人化能力。因而,在自动驾驶体验分析框架中,应当包括四个维度:覆盖程度、安全接管率、舒适接管率、顺滑程度:

(1)覆盖程度是车辆自动驾驶系统能够使用的地理范围;

(2)安全接管是保证车辆安全行驶的接管,如不接管极有可能发生交通事故或交通违章行为;

3)舒适接管是在行驶状况较为安全的情况下,车辆行为与用户驾驶习惯产生

较大差异情况下的接管;

(4)顺滑程度是自动驾驶运行的过程中,驾驶是否平稳、行驶是否线性流畅、对场景的处理是否足够老练。覆盖程度与安全接管两个维度反映自动驾驶能不能用的问题,背后反映的是自动驾驶系统的硬性边界,代表系统稳定处理该类场景的能力。舒适接管与顺滑程度两个维度反映自动驾驶好不好用的问题,在自动驾驶系统能力之外,还包含着系统的行为对用户的影响,因而具有一定的主观性。

通过对四维度的分析,能够较为全面地展现车企的自动驾驶体验。为了找到各家车企自动驾驶系统的能力边界,我们在测试时对自动驾驶系统抱有较大的宽容性与耐心,只在可能发生危险情况时进行接管,因而测得接管状况均为安全性接管,我们会在之后的测试中对舒适性接管进行跟踪。

图片

场景能力可以通过覆盖程度、安全接管率、舒适接管率、顺滑程度四维度分析

3.2、 总体分析:特斯拉综合领先,国内车企存在“覆盖-接管”权衡

总体来看,在我们首轮自动驾驶测试中,特斯拉在覆盖程度、安全接管率以及顺滑程度上均做到了较为优秀的水平。其他国内车企自动驾驶在场景能力的各个方面中各有千秋,总体处于快速提升覆盖度和能力的阶段。国内车企自动驾驶在测试中存在“覆盖度-接管率”上此消彼长的权衡关系。如问界与阿维塔测试车型对路网的覆盖程度较高,而小鹏在测试时仅覆盖了主要的路网,但平均接管里程高于问界与阿维塔,在安全接管方面占优。而在顺滑程度方面,当前国内的城市 NOA 功能仅仅达到“能用”水平,而距离功能“好用”、用户“爱用”仍有较大的差距。

3.2.1、 覆盖程度:国内车企总体处于快速提升覆盖度阶段

车企城市 NOA 进展不一,国内车企正激烈角逐无图模式。城市 NOA 功能正成为车企在智能化时代下的逐鹿之地,在过去一年里,国内各家领先车企均采取了城市 NOA 功能的落地推展计划,使用户能够在更多的地区和路段使用城市 NOA 功能成为车企自动驾驶实力的展现:

(1)特斯拉 FSD V12.3.4 采用的无图模式,在北美“几乎可以行驶到任何地方”,覆盖各类交通场景。

(2)阿维塔 12 和问界 M9 均采用华为 ADS 2.0 自动驾驶系统,并先后于 2 月、3 月全量升级为不依赖高精地图的城区 NCA 功能,实现“全国都能开”。

3)蔚来采用不开城只开路的打法,按路验证/优化/开通/运营,截至 7 月 17

日,蔚来城区可用里程达 354 万公里,覆盖 726 城。

(4)极越 01 PPA 智驾已经累计覆盖 300 城,开城背后是覆盖全国 360 万公里的百度 LD 车道级地图,能够支撑极越城市 PPA 达到传统高精地图水平,并将在 2024年内实现“有百度地图的地方就可以使用 PPA 智驾”。

(5)小鹏在 2024 年 1 月宣布 243 城市落地 XNGP,覆盖大部分主干道,而在 7月,小鹏 XNGP 智驾 XOS 5.2.0 公测版本已开启推送,能够实现“全国都好用”、“有路就能开”。

(6)智己在 2024 年 4 月在上海等四城市开启“无图城市 NOA”公测,并于 7月 8 日宣布在这四个城市正式落地,同时开放 65 个城市的公测,计划年内开放全国。

自动驾驶系统城市覆盖数量背后,还应关注城市内路网的覆盖程度。在技术、成本、数据、时间甚至政策等因素影响下,开城往往不是某个城市“全域开放”,而是“白名单式”开放:只对城市里部分白名单道路开放,或只招募部分满足一定门槛的白名单用户开放,如此将会遇到自动驾驶系统仍未覆盖的路段和场景(如掉头、环岛等复杂场景),城市 NOA 功能将会自动降级为 LCC 或退出要求接管。与此相对的还有“黑名单式”开放:除了部分特定场景无法开(如保密区域等),其余全国所有路都能开,且对全量用户开放。对于绝大部分用户来说,城市内路网的覆盖程度是直接关系到体验的核心,如果路网覆盖不完全则会频繁触发接管,用户无法在城市道路中高频使用自动驾驶,造成较差体验。

使用“可用场景数量/里程”反映城市内路网的覆盖程度。由于难以计算出场景的具体里程数据,因而无法直接对路网覆盖程度进行直接的度量,我们使用“可用场景数量/里程”这一指标间接反映车企城市 NOA 的路网覆盖程度:单位里程中城市 NOA 可用的场景数量越多,往往代表着城市 NOA 对道路的覆盖程度越好。但同时路况的复杂度、场景耗时等因素也会影响这个指标,同时个别车企的智驾覆盖程度也有一定的条件,因而这一指标只能间接反映自动驾驶的路网覆盖程度。

阿维塔、问界覆盖程度较高,蔚来、智己覆盖程度有待加强。从我们的测试数据看,特斯拉 FSD 的“可用场景数量/里程”最高,在测试时间点特斯拉在纽约市基本属于全覆盖,甚至在环岛等场景也没有提示接管。问界与阿维塔的 ADS 2.0 综合来看覆盖程度位于前列,基本做到了“有路就能开”,但在环岛和内部道路不可用。

极越与百度深度合作,百度 LD 地图为极越提供了良好的路况覆盖,覆盖程度较好,但其覆盖程度同样也受限于地图的分布。小鹏在无限 XNGP 的版本之前仍不能做到“有路就能开”,策略是核心城市覆盖当地小鹏车主需求较多的主要路段,地级市或县级市优先开放用户常用的核心路段。蔚来的开路模式从数据来看相对较低,原因可能在于测试车辆的蔚来智驾安全分权限不够,按照蔚来的规定,只有分数高于 70分才能够全量城区验证道路可用,如果分数低于 70 分,则只有城区主干验证道路可用。智己在上海测试时仍是公测版,在 7 月 8 日才在上海等四城市正式落地。

图片

特斯拉可用范围最高,国内阿维塔、问界覆盖程度较高

3.2.2、 安全接管率:特斯拉平均接管里程排名靠前,国内车企分化

平均接管里程反映自动驾驶系统的安全性和用户体验,但受路况复杂度影响。平均接管里程衡量自动驾驶系统在两次接管之间的平均行驶里程数量,衡量自动驾驶是否达到了人类驾驶员的安全水平,一般认为平均接管里程越高,自动驾驶的安全性越高。值得注意的是,由于车辆请求接管原因和环境不同,并不是每一公里的路测都是等价的,比如城市道路环境中由于路况较高速道路更加复杂,因而可能会更加频繁地要求接管。

在我们的测试中,特斯拉平均接管里程最高,国内车企出现分化。从我们的测试数据看,特斯拉 FSD 的平均接管里程是所有测试车企自动驾驶系统中最高的,在实际表现中,FSD V12.3.4 基本能够在大部分路况中自如处理,仅在不常见的长尾场景中进行了接管。小鹏平均接管里程为国内最高,意味着其城市 XNGP 的安全性和稳定性较为领先,一方面,部分接管为路段无法使用而导致的接管,另一方面,小鹏在较难的场景会主动提示接管。联系前面提到的小鹏路网覆盖度较低,可以推测其为保证城市 XNGP 的安全性和体验的稳定性,暂时主动放弃了路网的覆盖度。问界与阿维塔的平均接管里程要低于小鹏,一方面,城市 NCA 在一些较为复杂的路段没有主动提示接管,这使其路网覆盖度是国内最广的,在某些较难处理场景也有所表现,另一方面这种较为激进的风格也造成部分主动接管。极越、智己与蔚来总体低于华为系的表现,但限于测试里程较短,测得接管次数总体也较少:极越得益于百度地图为其提供的 LD 地图支持,平均接管里程为三者中最高;而蔚来按照道路开城的做法导致一些小路的覆盖不尽人意,而在测试路段中我们会优先挑选小路测试,平均接管里程为三者中最低。

3.2.3、 顺滑程度:当前国内智驾距离类人化仍有一定距离

以场景优秀率衡量自动驾驶系统顺滑程度。车辆顺滑程度,可以体现在自动驾驶状态中的车辆驾驶是否平稳、行驶是否线性流畅、对场景的处理是否足够老练,核心是为了衡量车辆的拟人程度。我们使用场景优秀率衡量自动驾驶的顺滑程度,“优秀”场景为与用户心理预期基本一致的场景,“丝滑”场景为系统操作超出用户预期的场景,因而优秀及丝滑场景的数量占总场景的比例可以较好反映车辆拟人化的能力。

在我们的测试中,特斯拉场景优秀率较高,体现较强的拟人能力。从测试数据来看,特斯拉的场景优秀率更高,在具体场景中表现为车辆加减速并无强烈顿挫感;启停反映速度快,与平行车辆几乎同步等等,特别是在一些困难场景中,如地上并无明确车道线,甚至驾驶员也不确定该路口是否可以左拐的路口,车辆自行正确完成无保护左转操作。国内各家车企的场景处理顺滑程度基本处于 50%区间,这意味着当前车企的自动驾驶系统有将近一半的场景还无法达到用户满意的水平,当前的城市 NOA 驾驶使用户从“能用”到“好用”仍有较大的差距。蔚来测试表现较差是由于在测试路段中优先挑选小路测试,与安全接管率较低原因相同。

图片

特斯拉场景优秀率更高,国内车企顺滑程度表现基本处于同一水平

3.3、 场景分析:感知普遍较强,预测和规控是差异化体验主要来源

深入场景中,发现车企自动驾驶能力边界。对于用户来说,体验往往具有迁移性,即在一个场景中感受到自动驾驶系统的明显边界,在此后类似的场景中便会格外注意,对自动驾驶系统的信任也少一分,因而我们在本节将对车企自动驾驶的场景细分进行分析,以发现车企自动驾驶(限测试时版本)能力的边界。场景数量分布方面,我们共搜集到 544 个场景,其中转弯、启停、避让、多车道、复杂道路场景分别为 160/61/136/158/29 个,占比分别为 29.4%/11.2%/25.0%/29.0%/5.3%。

图片

           544 个场景分布于五大场景         测试中转弯、多车道、避让场景占比较多

3.3.1、 转弯场景:转弯仍是较难场景,国内外车企均不能完美处理

转弯场景复杂,能力要求高,特别是无保护左转场景是自动驾驶遇到的最难场景之一。转弯场景对车辆感知、轨迹预测、路径规划的要求较高,但也有难易之分。如右转需要引导汽车进入右转车道,在许多十字路口,司机甚至可以在红灯的情况下右转,因此这对自动驾驶汽车来说十分简单。而左转场景中无论是路口复杂的车流、蠢蠢欲动的行人、各种各样的标线与交通标志,都对自动驾驶车辆的环境感知与预测都提出了极高的挑战。特别是无保护左转场景,不仅需要跨越多条车道,还需要与对向车辆等道路主体进行博弈,是自动驾驶场景中最复杂的场景之一,也成为衡量车企技术水平的重要指标。在测试样本的分布中,问界、小鹏、阿维塔、特斯拉、蔚来的场景数量较多,而智己与极越的场景数量较少。我们继续使用安全接管率与顺滑程度来衡量车企的水平,但由于里程数据没有细分到每个场景中,因而采用场景总数作为安全接管率的分母。

特斯拉处理能力强,但仍存在极限场景接管。特斯拉 FSD V12.3.4 能够流畅处理绝大部分转弯场景,甚至在无法分辨左转车道的待转路口仍能够顺利跨道左转,展示了强大的路径规划能力。但特斯拉也存在极限接管场景,表现为车辆欲右转时,前方规划好的道路上有违规停车,车辆寻找机会绕行超车等待时间过长,发生接管,在应对不常见的长尾场景时,FSD V12.3.4 在规划方面仍不够果断且目前在行车过程中仍然不具备倒车的能力。

问界与阿维塔转弯场景接管率相近,测试场景不同导致表现细微不同。在场景方面,阿维塔和问界均有在车道线状况复杂或无车道线的路口错过右转车道的场景,在路径规划上对车道线仍有一定依赖。问界和阿维塔总体技术解决方案类似,转弯场景表现仍有细微的差异,可能主要来自于测试的路况不同。在我们的测试中,阿维塔主要在上海地区进行测试,所表现让行的动机较重,比如在某个无保护右转场景,后方来车让行,然而车辆右转仍较为缓慢,需要介入接管。而问界在北上广渝四城进行测试,不同路况所测试出来的功能边界会更广,总体来看,问界的规控则相对大胆一些,总体体验比较激进,但也导致了问界场景转弯场景优秀率不如阿维塔的情况出现。

小鹏转弯场景能力不同城市表现差异明显,期待后续更新。小鹏处理转弯场景相对稳重,特别是在上海测试的路段中,在路口进行左右转弯的大部分场景都会提示接管,但是在北京无提示接管强制退出场景,可用场景较多。在可用路段的转弯场景处理体验良好,但是同样存在接管的情况出现。同时,我们测试时小鹏在北京的路网覆盖度也明显高于上海。其他车企的转弯能力方面,蔚来转弯多受到场景路段限制,会提示接管;智己与极越在转弯场景中表现较好,智己追求平稳通行,而极越表现总体偏保守,限于测试样本数据较少,无法对三家车企的接管场景进行进一步分析。

图片

转弯场景中,特斯拉处理能力较强,国内华为系处理水平较高

3.3.2、 启停场景:各测试车辆接管率低,表现均较为良好

各测试车辆在启停场景表现均较为良好,但仍有 Corner Case 难以处理。启停场景中,包含行车过程中的红绿灯启停,考验自动驾驶对红绿灯、车道线等交通信号感知识别以及周围车辆轨迹预测的能力,也包含到达导航目的地后车辆如何处理的问题。

在红绿灯启停场景中,均表现优秀,但仍存在误识别的情况。在路口刹停时,各车企基本都会稳步刹停,顿挫感弱,特斯拉甚至会缓慢滑行直到前方车辆启动。在启动时,自动驾驶以安全为优先考量,车辆启动速度均较旁边车辆慢。从数据上看,各家车企在红绿灯识别场景上都具有较低的接管率,各家车企均能够流畅应对红绿灯启停场景,但是特斯拉、问界、小鹏在路口时均有识别红绿灯错误,无法正常行驶引发主动接管的场景,虽然该场景并不常见,但仍反映出车企在感知方面仍有需要加强的地方。

在出发与到达导航设置目的地的场景中,仅有特斯拉能够原地启动、到地停车。

目前仅有特斯拉能够原地拨杆启动,并且在到达目的地后主动靠边停车,解决“最后 100 米”的问题。国内车企的城市 NOA 功能启动条件不一,如华为系在切换导航目的地之后可以自动启动,而其他车企往往需要先退出城市 NOA 功能再启动;但在到达目的地之后,国内车企都会退出或者降级,需要驾驶员接管。

图片

3.3.3、 避让/绕行场景:国内小鹏处理风格偏稳,华为系处理风格更为自信

过长决策时间(犹豫不决)是避让/绕行场景中的常见问题。避让/绕行场景中,自动驾驶系统需要对行驶路线中突然出现的行人、车辆或者障碍物进行有效应对,与转弯场景一样对自动驾驶系统的综合能力要求较高,而场景处理不好则极有可能引发交通事故或者拥堵。处理该类场景在感知层面需要车辆能够及时识别其他交通主体,在预测层面需要对该交通主体的速度、轨迹进行较为精准的判断,而在规划层面则通常需要重新规划自车行驶路线,而道路情况瞬息万变。模块化的规则驱动的自动驾驶可能会经历反复决策从而行驶速度缓慢,体验中的规则感较强,无法做到像老司机一样流畅。

特斯拉能够识别出交通主体意图,场景处理能力强大。特斯拉 FSD V12 可以看懂无红绿灯道路上欲过马路行人的意图并主动停车让行,在侧方车辆不打转向灯换道过来时能够主动让速,同时在路口与行人博弈时也会有选择让行,如对于闯红绿灯行人,在安全的情况下并没有选择让行,真正做到像老司机。但在我们的测试中,也存在绕行犹豫的情况出现,前方车辆双闪,且道路距离过窄无法通行,在试探过程中后方车辆催促导致接管。

华为 ADS 2.0 在场景处理上较为自信。搭载 ADS 2.0 的问界与阿维塔在绝大部分场景中,避让行为相对积极,同时对侧向距离的把控较为精准,场景中风格较为自信。但如果对手更加强势,则容易触发接管,如在行进过程中,阿维塔出现过与公交车抢道,同时在公交车更为强势抢道后,自车被逼停的情况;问界也存在不避让后方非机动车辆的场景。

小鹏避让前后方车辆时相对保守,安全空间较大,而对侧向车辆距离保留较小。

从数据上看,小鹏在避让/绕行场景中的接管率相较华为系更低,原因在于其会主动保留较大的前车距离,在后续行动中有较大的操作空间。但是从北京和上海的 X9的测试中,小鹏对侧后方来车的识别较弱,均出现未及时避让的情形。

图片

3.3.4、 多车道场景:汇流分流场景表现均较为优异,加塞场景仍是难点

多车道场景考察车辆跨车道交互行为,国内车企车道线依赖较强。在多车道场景之外的其他场景也有涉及到多车道的行为,但车道主要是作为这些场景的背景板。此处单列的多车道场景为自动驾驶车辆在两个及以上车道进行操作的场景,主要考察跨车道交互行为,体现车辆道路规划与预测能力的强弱。换道和车道汇流分流场景是多车道场景中的主要场景,在测试中我们发现国内车企自动驾驶算法中规则模块的车道线权重较高,对车辆的场景能力存在一定限制。

在换道场景方面,更为强调路径规划。问界与小鹏均存在道路上无明显障碍物且用户觉得没有必要时,进行多次变道的场景。在上海测试中,小鹏偏好变道靠左行驶,而问界左转靠左、右转靠右车道的逻辑明显,且偏好连续变道(必要性不强);问界会在很远的距离就开始提前变道,但在当时的路况中有时并非最优策略。阿维塔同样存在车道选择犹豫的场景,虽未导致接管,但影响驾驶体验。

在汇流分流场景中,预测模块准确度与切入车流时机较为重要。汇流分流场景又包含上下匝道、车道线合并、主辅路合并分流等场景,要求车辆对车道车流有精准的感知预测,测试场景中特斯拉表现均较为优秀。但从特斯拉的一个测试场景中注意到,后方消防车辆以鸣笛的方式传递需要让道的信号,特斯拉 FSD 暂时不具备听力和分辨消防车的能力,按照美国的交规只能采取人工接管。

除以上场景之外,目前无论是特斯拉还是国内车企在加塞场景方面仍有较大进步空间。在加塞时,自动驾驶系统一方面要保持安全距离,另一方面要择时汇入车流,但中间涉及到博弈等复杂问题,特别是在堵车时变道加塞场景,当前自动驾驶系统基本都是完成加塞预备动作后卡在中间动弹不得,需要人为接管推进。

图片

3.3.5、 复杂道路场景:环岛场景仅特斯拉能处理,国内暂未覆盖

复杂道路场景基本是自动驾驶系统很难处理的道路场景,在我们的测试中,这类场景较少,但是接管率较高。其中环岛场景一直以来都是处理难题,在环岛场景中,自动驾驶车辆需要完成驶入、换道、驶出等操作,再加上常见的不遵守交通规则的非机动车,更增加了复杂性。自动驾驶车辆需要根据驶出环岛的路口选择合适的内侧、中间、外侧车道,驶出环岛时需要提前变换到中间车道后再变换到外侧车道,最后驶出环岛。内侧车道行驶干扰少,但是驶出时需要变换两条车道,对感知、规划增加了更多挑战;外侧车道行驶,驶出环岛成本最低,但是需要面对的无序的干扰较多。在如此复杂的规则下,目前国内车企在面对环岛场景时会提前提示接管,并自动退出自动驾驶功能。而特斯拉 FSD 表现出众,能够应对测试场景中出现的环岛场景。

掉头场景方面,问界 M9 在广州实现了一次掉头操作,在重庆与北京均未成功;智己 L6 在上海也实现了一次自主掉头;小鹏在掉头场景之前会判断能否一把方向盘掉头,否则会提示接管。修路场景方面,道路正在进行维修或施工,多异形障碍物,对感知能力要求较高的同时,也需要车辆及时重新规划路径,在我们的测试中仅有特斯拉、问界、小鹏遇到该类场景,但除特斯拉外的国内车企对修路场景的通过率均较低。

3.4、 城市分析:不同城市中,不同的规控策略带来的体验差异较大

前文提到国内车企对于城市 NOA 功能采取的开城策略,同时不同城市的驾驶风格、驾驶习惯存在差异,道路工况也存在较大差异,相比较下能够更好发现车企自动驾驶的能力。为了比较自动驾驶系统在不同城市之间的表现,我们选取问界与小鹏在北京、上海、广州、重庆四地进行了测试。从场景数量的分布上看,问界在重庆、北京的场景样本数量最多;小鹏在上海、北京的场景样本最多,但是在广州限于测试时间与路况,仅有 11 个场景样本。

在道路工况方面,上海所测试道路车道线较为清晰,且车道较为宽敞,红绿灯并不复杂,相比之下,北京所测试某些道路的车道线较为模糊复杂,某些非机动车道比机动车道还要宽,为自动驾驶系统的运行造成了较大的挑战;重庆方面,不仅车道多为窄路,且交通信号灯较为复杂,尽管车道线状况良好但也会有信号灯识别错误的情况出现;广州测试道路也相对宽敞,具有清晰的车道线与红绿灯提示。在交通参与主体方面,相较重庆、广州而言,北京、上海测试路段遇到的司机显得较为文明礼让,而重庆测试路段遇到的司机相比则更为激进,重庆路况复杂的另一因素在于由于多为窄路,路边停车以及非机动车停放较多,部分场景下车辆规划路线上会遇到长时间的停泊车辆,对自动驾驶系统造成较大的考验。

在覆盖程度上,问界在重庆、广州的覆盖程度较高,在北京、上海的覆盖程度基本相同,小鹏的覆盖程度总体低于问界,在北京的覆盖程度相较上海更高。无论在哪个城市,当从高精地图方案转向无图之后,所能够处理的场景会变少,最直观的就是问界在重庆地区,之前带有高精地图的时候能够实现掉头、甚至能够实现环岛的通行,而在全面转向无图之后,这些场景均需要接管;如小鹏在上海的测试时,有的路段能够实现无保护左右转,有的路段会提示城市 NOA 系统退出要求接管,我们预计上海可能正处于从高精地图向无图转换的进行时,而在一开始就无高精地图的北京则没有发生这种情况。

图片

在不同的城市下,不同的规控策略带来的体验差异较大。重庆道路状况更为复杂,小鹏较为稳健的策略反而会让接管次数更少,原因在于车辆预留距离相对较多,给出较多反应时间。策略激进的问界在道路工况比较复杂的北京背景下总体表现弱于其他城市,而策略相对稳健的小鹏反而在北京的表现相对其他城市更好。

图片

图片

本报告测试时间主要集中在 2024 年 4 月-6 月,其后诸多车企更新和发布了新版本的智驾系统,无论在覆盖区域和能力上都拥有了显著提升。在相当一段时期内,智驾功能水平都将处于动态变化的状态,智驾竞争远未到终点,各大玩家将互相追赶,共同进步。道路场景纷繁复杂、动态变化,限于现有条件,我们在测试时间、测试场景的丰富度仍有较大提升空间,而更多希望形成一套分析方法,以便后续对各大玩家的实力进行可持续跟踪。就本报告结果而言,定性分析大于定量分析,并且只反应测试时点各大玩家的截点状态,我们将进一步持续跟踪各车企能力后续变化。

4、 拟人化为迭代方向,端到端大模型推动体验快速提升

端到端自动驾驶逐渐成为行业共识,目前车企的自动驾驶基本已经实现感知端到端,而能够提供拟人化体验的关键,在于预测与规控端的大模型化,在此基础上进一步实现完全端到端自动驾驶。当前领先车企正致力于将预测、规控层面大模型化,逐步走向端到端:

(1)华为:ADS 3.0 中将要采用的采用 PDP 网络(预测决策规控网络),实现了预决策和规划一张网,使得决策和规划更加类人化,行驶轨迹更接近人类驾驶,通行效率更高,复杂路口通过率超过 96%。

图片

(2)小鹏:何小鹏在 520 AI DAY 发布会上提到,较为稳定的传统量产智驾系统,大约有 10 万条左右各类人工定义的规则,而一个无限接近人类司机的自动驾驶系统,大概等效于 10 亿条规则。小鹏端到端大模型由神经网络 XNet+规控大模型XPlanner+大语言模型 XBrain 三部分组成。其中规划大模型 XPlanner 基于神经网络,可以比作智能驾驶的小脑。通过海量数据对规划大模型 XPlanner 进行训练,能让智驾系统的驾驶策略向着拟人化进化,规划大模型 XPlanner 能够让小鹏汽车的智驾系统在真实道路体验中减少 50%的前后顿挫、60%的违停卡死以及 40%的安全接管。可以看到 XOS 5.2.0 OTA 后小鹏的功能覆盖程度已经有了明显提升。

(3)理想:理想在 2024 智能驾驶夏季发布会上发布了端到端+VLM 双系统智能驾驶模型,其中在系统1端到端模型主要用于快速响应常规驾驶问题,当前OTA 6.0使用的是第二代无图模式,只有感知和规划两个模型,最大的变化是去掉了 NPN,不依赖于先验信息,支撑着现阶段理想无图 NOA 全国都能开的实现。在未来,理想的系统 1 将转向类似特斯拉 One Model 的端到端模型,输入是传感器、输出是行驶轨迹,全部由一个模型实现,中间没有任何规则,实现真正意义上的端到端。

图片

除了以上三家车企,其他车企在端到端架构也进行积极布局,如蔚来在 6 月重组智驾团队,将感知和规控团队合并为大模型团队。在端到端架构下,车企训练迭代有望加速,预测决策规划或将更为准确丝滑,类人的自动驾驶体验指日可待。同时,我们可以看到,在最新推送的小鹏天玑 5.2.0 和理想无图 NOA 公测版本,在端到端大模型上次之后,整体智驾的功能体验和覆盖度相较于我们测试时都得到了大幅的提升。因此,我们建议要保持对最新智驾能力的持续跟踪。

汽车智能化已经成为未来的发展方向,自动驾驶作为汽车智能化的重要方面,不仅是科技赋能汽车的产品升级,人们的出行方式或将因为自动驾驶而深远改变。而且在智能化时代,传统的汽车商业模式也有望迎来变革,软件定义汽车潮流之下,通过出售自动驾驶服务来实现盈利或将成为车企的新选择。当前自动驾驶市场格局呈现出“一超多强”的特点。“一超”:特斯拉。在功能方面,特斯拉在自动驾驶方面具有先发优势,凭借前瞻的算法、庞大且高质量的数据、日益增长的算力,FSD 迅速更新迭代,处于领先地位,引领着行业的发展。在用户方面,FSD 的用户数量与与使用里程节节攀升,表明北美消费者对 FSD 功能的认可,FSD 的发展路径也为国内自动驾驶行业提供了宝贵的参考价值。

“多强”:(1)新势力车企:国内车厂在自动驾驶方面奋起直追,其中以小鹏汽车、理想汽车、蔚来汽车为首的新势力车企纷纷在自动驾驶方面深入布局,小鹏汽车公布其每年对包括智能驾驶的 AI 技术研发投入约 35 亿,现有团队近 3000 人,2024年将要扩展到 4000 人,目前“全国都能开”、“有路就能开”的天玑 5.2.0 已经推送了公测版;理想汽车也表示其智驾研发团队在 2024 年底将扩张到 2000 人,7 月将推送全国范围内试用的无图 NOA 功能;蔚来汽车全域领航辅助 NOP+城区路线全量推送,能够覆盖全国 726 座城市。新势力车企加码布局自动驾驶,在自动驾驶量产方面具有先发优势,培育与抢占用户认知。

(2)华为乾崑系:华为凭借领先产品力强势入局汽车行业,以乾崑、鸿蒙座舱两大品牌为核心,提供零部件模式、HI 模式、鸿蒙智行模式三种合作方式,赋能智能汽车。同时凭借华为强大的影响力良好的消费者口碑,使汽车的智能化得以“破圈”,让自动驾驶为更广泛的用户所接触。自 2019年华为智能汽车解决方案 BU 成立以来,累计研发投入超过 300 亿元,研发人员达7000 人。目前正处于高速增长期,2023 年智能部件发货已超过 300 万套,已上市的战略合作车型达 7 款,发展超过 300 家产业链上下游合作伙伴,2024 年,搭载华为乾崑智能汽车解决方案的合作车型将陆续问世,其中包括东风、长安、广汽、北汽、赛力斯、奇瑞以及江淮等。并且华为已经在深蓝 S07 上搭载了纯视觉的解决方案乾崑 ASD SE,逐步将高阶智驾下放到 20 万以内的车型。

(3)领先自动驾驶供应商:地平线、大疆车载、Momenta 等领先自动驾驶解决方案供应商凭借独特优势赋能车企,为车企自动驾驶的发展提供强大助力。


本文转载自: https://blog.csdn.net/xiaoming0907/article/details/141029226
版权归原作者 小明师兄 所有, 如有侵权,请联系我们删除。

“万余字描述国内外主流车型智能驾驶测试评价体验”的评论:

还没有评论