TechWeb 文/卞海川
把GPT“吹”上车,真的能给用户带来实际价值吗?
众所周知,ChatGPT已经成为全球最快用户破亿的应用,各大科技巨头陆续发布了“类ChatGPT”AI大模型。这其中,AI大模型在智能汽车领域的应用更成为整个汽车行业集体关注的焦点,尤其是国内车企更是趋之若鹜。
车企尽上GPT
据不完全统计,目前仅接入文心一言的车企就包括长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等。除了国内车企,奔驰、微软宣布将在美国奔驰汽车上增加GPT功能。借助OpenAI和微软的技术,奔驰原有车载语音助手将得到升级。
与此同时,国内诸如蔚来汽车、小鹏汽车、理想汽车、奇瑞汽车均申请了GPT相关商标。如蔚来汽车申请“NIOGPT”、小鹏汽车申请“XPGPT”、理想汽车申请“MindGPT”等。 尤其是理想,不久前已经发布了自研Mind GPT,并将AI技术引入到车机“理想同学”中。
可以说,国内的车圈也已经进入了大模型的混战阶段,那么问题来了,这些大模型究竟有何本领?与此前车企们吹捧的智能座舱和智能驾驶又有何区别呢?
GPT上车 价值在哪?
由于接入百度文心一言的车企较多,所以这里我们就以它为例,看看大模型上车到底带来了什么?
结合媒体及官方信息,我们知道,与智能座舱结合,最直观的体现就是在交互上。例如更聪明能听懂人话,包括那些模糊的指代命令,可以和人对话;能通过搜索分析,给出更贴切的反馈;能够提供个性化、拟人化的服务;甚至在文字、语音、图片之间的转换等。
具体到应用场景,包括超级闲聊、灵感画画、百变人设、AI新车导购等。以超级闲聊为例,就是把车内变成一个交流场景,通过与语音助手对话式交互,规划行程、答疑解惑、闲聊,就像人与人交流一样自然。
同时,基于大模型本地化技术,小度车载语音 SDK 支持流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应,这些都让细节的体验升级。特别是真多路同时对话能力,最大支持 8 路同时交互精确处理,覆盖整个座舱内外,可以实现多路同时、快速、连续对话的极限挑战,就算坐在驾驶位、副驾驶位和后排的一家人同时开口,语音助手也能满足每一个人的诉求。
再看理想的Mind GPT ,声称和“理想同学”结合后,支持声纹识别、内容识别、方言识别、出行规划,AI 绘画、AI 计算等功能。
不知道业内看到这些作何感想?在我们看来,除了某些应用场景(例如超级闲聊、多路对话能力、)影响驾车安全,且并非刚需,其他所谓的场景基本上也是此前智能语音的升级,至于到了用户体验上能有多大的提升,还需时间的检验。
其实不止是百度文心一言,目前上车的大模型在智能驾驶座舱方面(基本都是原有语音理解和交互的提升)都是大同小异,很难形成差异化的竞争力和用户体验。
思必驰汽车事业部产品总监葛付江对TechWeb表示,ChatGPT目前是以文本交互机器人的形式呈现的,适用多种文本处理任务,常用于智能问答和对话、文本创作等领域;车载语音以对话交互为主,多用于进行例如“导航去XXX?打开音乐”有明确指令的行动,“语音助手”用高度拟人化的语音输出来回应车主诉求。车载语音交互用于解放驾驶员双手,聚焦其注意力带来更安全、便利的驾驶体验。未来车内有了ChatGPT技术的应用,不仅是完成固定指令的任务型对话,车、人能进行更高效、更直接、高灵活度的出行、知识和闲聊交流。
可以看到,目前GPT上车的价值主要还是局限在智能座舱的语义识别,可是目前国内车企的智能语音助手相对成熟,GPT赋能下的智能座舱很难在带给用户更大提升。况且,一个新的技术或者产品能否最终落地得到规模的应用,除了技术因素外,还会受到其所处产业或者市场的产业链、市场竞争强弱、市场空间等诸多因素密切相关。
具体到车载智能语音系统,虽然ChatGPT在“智能”上表现出色,但其在整个产业链条中比较偏后段,需要依赖很长的前端链条,比如信号处理、语音识别、文字输出之后才会用到它,前端链条上的因素对后端流程都会产生影响,例如信号处理会影响语音识别,语音识别如果出错就会影响NLP的判断,链条上每个模块都需要提高可靠性,才能保证最后出来的整体结果可靠。
也就是说,ChatGPT在“智能”能力的输出上,并非完全取决于自身的能力,其产业链上任何一个环节都会对其造成正或负的影响。
综上所述,无论是从体验提升还是其它因素制约来考虑,GPT在智能座舱层面“加持”有限。
除了上述智能座舱外,值得注意的是,智能驾驶是最早被提出的AI应用场景之一,而自动驾驶需要大量的数据处理和分析,同时自动驾驶的应用也需要长期仿真测试以及道路测试,而AI大模型的加速发展将缩短自动驾驶开发进程,进一步推动产业成熟。
业内知道,早在2019年,特斯拉就将基于深度神经网络Transformer大模型引入到感知预测中,并在2021年8月的特斯拉AI DAY 上展示了基于Transformer的BEV(鸟瞰视角) 感知方案,这是大模型技术首次被应用到自动驾驶行业,也是FSD实现“重感知,轻地图”纯视觉路线的关键所在。
虽然从极少数的内测到如今面向北美所有购买用户推送,最新驾驶里程接近2亿英里,并被认为是目前最先进的自动驾驶系统之一。但时至今日,其在实际的应用中依然是事故频发,远未达到自动驾驶应有的体验。
领先的特斯拉尚且如此,何况现在才开始利用大模型的其他厂商。
写在最后
车企们争相独立布局语言大模型技术以提升汽车智能化(例如智能座舱、智能驾驶等),的举措无可厚非。但从目前几乎主流车企,尤其是国内车企扎堆推出各GPT后的应用场景和体验看,依然缺乏与此前未采用大模型的差异化,而这也让我们不禁发问,车企们在力推语言大模型的时候,到底只是为“乱花迷人眼”,还是应该本质性地提升用户的体验为先?
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )