⼩鹏汽车⾸席科学家郭彦东:交互的关键在于全⽅位和⾃适应“
“AI能⼒”是互联⽹汽车的新标志。
新鲜⾎液注⼊百年汽车制造产业的旗帜,恐怕就是将“⼈⼯智能”这个标签牢牢地焊进产业链的关
键环节。
“基于⾃研,深度学习能⼒和数据闭环,通过OTA让智能汽车越来越聪明,也越来越懂你,从⽽
完成⼈⼯智能在车载环境中的进化之路。”⼩鹏汽车⾸席科学家郭彦东在第六届国际智能⽹联汽
车技术年会(CICV 2019)的演讲中说道。
这与“⼤师兄”何⼩鹏的观点遥相呼应。⼩鹏汽车董事长兼CEO何⼩鹏曾多次表⽰,在从功能汽车
到智能汽车的演变过程中,“AI能⼒”是互联⽹汽车的新标志。
于是,这也成为⼩鹏产品的重要标签。作为公司⾸款上市量产车型,⼩鹏G3⾃2018年12⽉上市
后,即凭借⾃动驾驶辅助能⼒、交互体验、整车OTA能⼒打⼊年轻互联⽹消费者体。⼩鹏官
⽅数据显⽰,⾃2019年1⽉起,“你好⼩P”AI语⾳助⼿唤醒435,370次,多场景全⾃动泊车系统
触发28,860次,ACC⾃适应巡航系统独⽴驾驶⾥程511,840公⾥。
截⽌到2019年4⽉份,⼩鹏G3通过OTA升级,已新增逾40项功能,逾200项功能优化升级。其
中,不仅新增了如遥控泊车、ATC⾃适应弯道巡航、智能导航、哨兵模式、冥想模式、斜列式
车位泊车辅助等多项功能,同时优化了如超级⾃动泊车辅助、ACC⾃适应巡航系统、XPILOT
2.5多场景全⾃动泊车系统、X_ID账号服务、“你好⼩P”AI语⾳助⼿、在线⾳乐服务及充电服务
等。
在⼩鹏团队看来,以上增强智能化属性的操作某种程度上可以让电动车避免残值率过低的天然
窘境。具体⽽⾔,⼩鹏汽车⽬前通过在AI领域的⾃研⼯作,试图寻最合适中国特⾊场景的解
决⽅案,进⽽在量产车型中实现落地。
当下,智能系统仍停留在⾼级辅助功能的尴尬期,驾驶员并未被完全替代,交互体验就成了驾
乘的核⼼技术。
郭彦东在与车云菌交流过程中提到,交互⽅式的关键在于:全⽅位、⾃适应。“好的交互⽅式⼀
定不仅限于按键,还可以通过触屏、声⾳、眼神、表情等等。在不同场景下,针对不同⽤户习
惯,可以动态地提供交互⽅式,伴随感就会增强,冰冷的机械感也会减弱。”
更重要的是,多模态的感知交互⽅式不仅可以提升车辆智能感,⽽是能够提升驾驶安全。郭彦
东以⼩鹏⾃家产品举例来说,其研发的免唤醒策略便是基于视觉感知的精准、实时的实现检测
功能。车内智能摄像头根据视线的某些特定落点位置判断驾驶意图。“⽐如看左右后视镜就表达
了转向的意图,不⼀定要通过转向灯。此外,屏幕按键也可以进⾏⼀些⾃适应的调整,不同情
景下车辆反应和反馈⽅式都不⼀样,这也是交互的另⼀个智能层⾯。”
为了达到最终理想的交互状态,⼩鹏汽车AI产品中⼼内部形成了强紧密合作。据了解,⼩鹏汽
车的互联⽹中⼼、⼈⼯智能产品中⼼和⾃动驾驶中⼼三个部门⼏乎每天都在⼀起⼯作。譬如⼩
鹏⾃动泊车功能,其主打的“全⽅位、伴侣式、沉浸式的体验”是通过语⾳、泊车两个功能实现
的,需要诸多相应功能的紧密结合才能形成⼀个有机的、完整的场景体验。
关于⼩鹏汽车AI产品中⼼的更多细节,车云菌也进⾏了较为详尽的记录:
Q:AI产品中⾃研的⽐例⼤概有多少?
A:⼩鹏汽车AI产品中⼼聚焦⼈脸识别与分析,多模态智能⼈机交互系统,带有健康监测的驾驶员监控,环境感知,智能视觉导航等多项⼈⼯智能技术研发。
除此之外,现阶段⼈⼯智能芯⽚、嵌⼊式设计,车载系统以及车载应⽤系统都不是⾃研的,其上搭载的算法、功能演进是100%⾃研的。
Q:我们为何选择⾃研这条路?
A:第⼀,不管是团队、联合费⽤、周期还是⽣态的培育,⾃研算法⽆疑时间长、投⼊⼤。但是相⽐芯⽚或者电池本⾝的研发,⾃研算法的投⼊相对较⼩,其中⼤部分投⼊还是⼈员、数据以及⼀些研发⼯具和平台的投⼊。
第⼆,任何⼀个技术,都经历了从学术界,到技术供应商,成熟后到整车⼚量产。⼩鹏汽车主要的竞争⼒之⼀就是智能化,如果我们等着tier1技术成熟了再去⽤这个东西,我们就失去了竞争优势。我们就是要通过⾃研,把Tier-1提供不了的成熟产品率先⽤在⾃⼰的车上⾯(在技术上或者是tier2成熟的阶段)。
第三,更有意思的是后续OTA升级的问题。我们的数据都来源于⾃⼰的车辆,我们把⼤量的数据拿回来做智能模型的更新、迭代、升级。G3虽然上市时间不长,但已经进⾏了多次OTA升级,来不停增进智能功能。有⾃⼰的技术研发能⼒才能够做功能的升级和迭代。
选择⾃研的核⼼在于,⼩鹏希望持续为客户提供功能的升级和迭代。市⾯上已有的功能,我们的⽤户能够早⼀点使⽤,⼩鹏才能有更⼤的⽤户基数,有更好的功能运营经验,这可能也是我们能够实现差异化的点。
这个过程中⾃然会涉及到软硬件适配期的问题。实际我们⼯作的很⼤⼀部分时间都⽤于软件和硬件的适配。这也是为什么Tier 2虽然⼿握技术,却仍旧需要通过Tier 1与整车⼚进⾏合作。⼩鹏的计划是希望通过⾃研算法后⾃⼰进⾏算法适配、传感器补⾜、调试成像系统等等,才能顺畅完成落地。
Q:⼩鹏G3在⼈⼯智能技术上有哪些差异化的竞争点?
汽车导航怎么升级
A:就现阶段市售量产车⽽⾔,⼩鹏汽车可以说是在量产车上实现全功能的唯⼀⼀款量产车,包括⼈脸识别、疲劳分神等。虽然⽬前市⾯上⼤概有20%-30%的车都号称有疲劳驾驶功能的,但他们的疲劳驾驶都是通过⽅向盘的扭矩传感器来实现的,⽽⾮通过视觉系统。
后者不仅能够检测驾驶⾏为,还能感知交互⾏为。视觉传感器对你的情绪、健康状况也有感知,这都是⽅向盘扭矩传感器得不到的。所以如果有视觉传感器,对司机状态的把控会更精准,反映也更迅速。
相⽐成熟车⼚,我个⼈认为,有⼀些欧洲的企业动作或做事情⾮常认真,但同时也很强调员⼯的⽣活和⼯作平衡,我们在合作的时候遇到过对⽅企业放暑假的,也遇到过他们10⽉、11⽉开始准备过圣诞节的。
从⼏个维度来看,这些企业不是不重视,其实⼀直把这个当做⼀个⽣命线⼀样的基准来做,但其实有⼏点挑战。⽐如,如果你去外部合作的话,他们要科技公司实际上是⽐较难的。虽然科技公司有很好的⼈脸识别、疲劳、计算机视觉、⽬标监测、车辆跟踪等之类的技术,但他们不⼀定有⾮常强的意愿做硬件的适配和服务,其中的⼯作量和⼯作难度相对都是⽐较⼤的。除此之外,这能否符合他们当前最核⼼的商业模式,有没有意愿把算法适配硬件。基于这些考量,双⽅很难达成紧密的合作,但是Tier-1供应商⽬前还没有能提供特别成熟的技术。
Q:与特斯拉车载技术相⽐,⼩鹏汽车有何异同?
A:我觉得⼤家的侧重点可能不同,我们⽬前认为⼩鹏汽车在车载智能,尤其是司机的驾驶的状态,意图的识别,包括⾝份认证上,都更投⼊,功能也更完善。
Q:现在这款车相⽐于年前的版本多了两个功能:⾏车记录仪摄像头和观察驾驶员的疲劳驾驶摄像头。那么在硬件⽅⾯,⼩鹏如何进⾏OTA升级?
A:硬件⽅⾯的升级需要进⾏提前规划和计划。像包括我们下⼀款车会⽤英伟达和⾼通这种主要的主板芯⽚,在车辆销售的时候,我们会预留⼀部分硬件算⼒,⽤于后续OTA升级。
在我们销售的过程中,很多智能化功能其实是没有完全通过OTA更新进去的,车辆只有硬件,没有软件。但是我们分析销售数据发现,相对于不花钱买硬件,绝⼤部分消费者都喜欢买⼀个硬件完备,但功能尚未齐全的汽车。
Q:下⼀步系统升级会有哪些技术上的更新?
A:我们对内、对外慢慢地淡化L2、L3的概念,因为本⾝它的定义也不是那么清晰。我们更关注⼀个⼀个功能,让驾乘体验更完善。⽐如,我们年底即将上市的⼩鹏P7,搭载的运算芯⽚的算⼒要更强,可靠性、安全性也要更强。所以,我们不仅是增加更多跟交互、跟预警相关的功能,也会增加很多强
安全的功能。在成本⽅⾯,⼩鹏汽车有能⼒把所有成本控制在合理范围内。
Q:您如何看待未来传感器的发展路径?
郭彦东:其实我觉得有⼏个趋势⼤家可能都需要去关注。
第⼀,激光雷达越来越可靠、越来越便宜,因为成本只是其中的⼀个制约因素,技术本⾝的可靠性,能否通过车规级验证,都是我们需要关注的。
第⼆,摄像头的成像范围越来越⼴。以前的摄像头晚上都不能⼯作,摄像头原先是拍了照⽚给⼈看的,现在摄头越来越成为⼀个测量⼯具,它能看到很多⼈本来看不到的地⽅,所以摄像头的可靠性也越来越强。
第三,除了摄像头视觉、激光雷达,其实毫⽶波雷达也做了很多这样的尝试和努⼒。摄像头是被动接收,激光是主动发射的,⽽毫⽶波雷达也是有主动发射的, 77赫兹、79赫兹等等,现在毫⽶波雷达在控制⾃⼰成本和可靠性前提条件下也越来越便宜,⽽且效果越来越好,正逐渐向激光雷达去靠拢,⽐如SAR雷达等等。
所以我们可以看到,不同的传感器都有向好的趋势,最终可能还是⼀个多传感器融合的⽅式,但是有哪些传感器可以⼊围,我觉得现在下结论还为时尚早,⼀⽅⾯需要考虑技术本⾝的局限,另⼀⽅⾯也
在于整个产业的投⼊。
Q:⼩鹏怎么看待分布式计算、以及边缘计算技术?
A:⾸先,你如果想把运算分离在不⼀样的地⽅,你要有⼀个很可靠的、低时延的通信系统,但与此同时,有⼀些功能如果对实验要求低,可靠性要求低,就可以适当地往云端去放,⽐如语⾳。
很多语⾳控制、语⾳交流的数据都是在云端做的,包括⼩鹏在内的主流车⼚都利⽤了这种思路。当你唤醒功能之后,把这些语⾳传到云端处理,包括NL⼤数据,分析后再反馈回来。但视觉感知、包括道路情况的分析⼯作,⽬前是没有办法在云端完成的,主要还是要靠端上的算⼒。
Q:在未来实现车路协同⽅⾯,主机⼚需要做哪些事情?
A:车路⼀体化标准化的组织⾮常重要,⼩鹏⼀直很重视,也很积极地参与这种协议的开发。我认为主机⼚商不应该是被动接受协议的制定,⽽是主动地去参与,跟政府也好、跟这些技术建设⽅也好,⼀起去探讨、研讨什么样的协议是能够从核⼼辅助车辆实现车路⼀体化协同的。
Q:消费者最需要的智能功能是什么?
A:⼀个是安全,⼀个是体验。娱乐可能算体验的⼀部分,但并不是最核⼼的。体验最核⼼的⼀个是交互,⼀个是信息的流畅度。
有⼀项研究发现,如果⽤户在开车的时候跟副驾驶⼈聊天,其实他的驾驶表现是在提升的,但是如果你频繁地使⽤语⾳交互系统,对你的驾程体验是没有帮助的。我们的伴随系统,语⾳系统,能不能够有⼀天像副驾⼀样聪明,跟你的交互、沟通那么顺畅。在⽤户通过语⾳交互的同时,提升驾驶安全,我觉得这个是所有造车⼈的梦想。
车云推荐