车企尽上GPT：乱花渐欲迷人眼，用户体验哪里找？

TechWeb 文/卞海川

把GPT“吹”上车，真的能给用户带来实际价值吗？

众所周知，ChatGPT已经成为全球最快用户破亿的应用，各大科技巨头陆续发布了“类ChatGPT”AI大模型。这其中，AI大模型在智能汽车领域的应用更成为整个汽车行业集体关注的焦点，尤其是国内车企更是趋之若鹜。

车企尽上GPT

据不完全统计，目前仅接入文心一言的车企就包括长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等。除了国内车企，奔驰、微软宣布将在美国奔驰汽车上增加GPT功能。借助OpenAI和微软的技术，奔驰原有车载语音助手将得到升级。

与此同时，国内诸如蔚来汽车、小鹏汽车、理想汽车、奇瑞汽车均申请了GPT相关商标。如蔚来汽车申请“NIOGPT”、小鹏汽车申请“XPGPT”、理想汽车申请“MindGPT”等。尤其是理想，不久前已经发布了自研Mind GPT，并将AI技术引入到车机“理想同学”中。

可以说，国内的车圈也已经进入了大模型的混战阶段，那么问题来了，这些大模型究竟有何本领？与此前车企们吹捧的智能座舱和智能驾驶又有何区别呢？

GPT上车价值在哪？

由于接入百度文心一言的车企较多，所以这里我们就以它为例，看看大模型上车到底带来了什么？

结合媒体及官方信息，我们知道，与智能座舱结合，最直观的体现就是在交互上。例如更聪明能听懂人话，包括那些模糊的指代命令，可以和人对话；能通过搜索分析，给出更贴切的反馈；能够提供个性化、拟人化的服务；甚至在文字、语音、图片之间的转换等。

具体到应用场景，包括超级闲聊、灵感画画、百变人设、AI新车导购等。以超级闲聊为例，就是把车内变成一个交流场景，通过与语音助手对话式交互，规划行程、答疑解惑、闲聊，就像人与人交流一样自然。

同时，基于大模型本地化技术，小度车载语音 SDK 支持流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应，这些都让细节的体验升级。特别是真多路同时对话能力，最大支持 8 路同时交互精确处理，覆盖整个座舱内外，可以实现多路同时、快速、连续对话的极限挑战，就算坐在驾驶位、副驾驶位和后排的一家人同时开口，语音助手也能满足每一个人的诉求。

再看理想的Mind GPT ，声称和“理想同学”结合后，支持声纹识别、内容识别、方言识别、出行规划，AI 绘画、AI 计算等功能。

不知道业内看到这些作何感想？在我们看来，除了某些应用场景（例如超级闲聊、多路对话能力、）影响驾车安全，且并非刚需，其他所谓的场景基本上也是此前智能语音的升级，至于到了用户体验上能有多大的提升，还需时间的检验。

其实不止是百度文心一言，目前上车的大模型在智能驾驶座舱方面（基本都是原有语音理解和交互的提升）都是大同小异，很难形成差异化的竞争力和用户体验。

思必驰汽车事业部产品总监葛付江对TechWeb表示，ChatGPT目前是以文本交互机器人的形式呈现的，适用多种文本处理任务，常用于智能问答和对话、文本创作等领域；车载语音以对话交互为主，多用于进行例如“导航去XXX？打开音乐”有明确指令的行动，“语音助手”用高度拟人化的语音输出来回应车主诉求。车载语音交互用于解放驾驶员双手，聚焦其注意力带来更安全、便利的驾驶体验。未来车内有了ChatGPT技术的应用，不仅是完成固定指令的任务型对话，车、人能进行更高效、更直接、高灵活度的出行、知识和闲聊交流。

可以看到，目前GPT上车的价值主要还是局限在智能座舱的语义识别，可是目前国内车企的智能语音助手相对成熟，GPT赋能下的智能座舱很难在带给用户更大提升。况且，一个新的技术或者产品能否最终落地得到规模的应用，除了技术因素外，还会受到其所处产业或者市场的产业链、市场竞争强弱、市场空间等诸多因素密切相关。

具体到车载智能语音系统，虽然ChatGPT在“智能”上表现出色，但其在整个产业链条中比较偏后段，需要依赖很长的前端链条，比如信号处理、语音识别、文字输出之后才会用到它，前端链条上的因素对后端流程都会产生影响，例如信号处理会影响语音识别，语音识别如果出错就会影响NLP的判断，链条上每个模块都需要提高可靠性，才能保证最后出来的整体结果可靠。

也就是说，ChatGPT在“智能”能力的输出上，并非完全取决于自身的能力，其产业链上任何一个环节都会对其造成正或负的影响。

综上所述，无论是从体验提升还是其它因素制约来考虑，GPT在智能座舱层面“加持”有限。

除了上述智能座舱外，值得注意的是，智能驾驶是最早被提出的AI应用场景之一，而自动驾驶需要大量的数据处理和分析，同时自动驾驶的应用也需要长期仿真测试以及道路测试，而AI大模型的加速发展将缩短自动驾驶开发进程，进一步推动产业成熟。

业内知道，早在2019年，特斯拉就将基于深度神经网络Transformer大模型引入到感知预测中，并在2021年8月的特斯拉AI DAY 上展示了基于Transformer的BEV(鸟瞰视角) 感知方案，这是大模型技术首次被应用到自动驾驶行业，也是FSD实现“重感知，轻地图”纯视觉路线的关键所在。

虽然从极少数的内测到如今面向北美所有购买用户推送，最新驾驶里程接近2亿英里，并被认为是目前最先进的自动驾驶系统之一。但时至今日，其在实际的应用中依然是事故频发，远未达到自动驾驶应有的体验。

领先的特斯拉尚且如此，何况现在才开始利用大模型的其他厂商。

写在最后

车企们争相独立布局语言大模型技术以提升汽车智能化（例如智能座舱、智能驾驶等），的举措无可厚非。但从目前几乎主流车企，尤其是国内车企扎堆推出各GPT后的应用场景和体验看，依然缺乏与此前未采用大模型的差异化，而这也让我们不禁发问，车企们在力推语言大模型的时候，到底只是为“乱花迷人眼”，还是应该本质性地提升用户的体验为先？

车企尽上GPT：乱花渐欲迷人眼，用户体验哪里找？

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复