图片来源@视觉中国
文 | 元宇宙日爆
ChatGPT改造汽车的序幕已经拉开,奔驰率先出手。
(资料图片仅供参考)
不久前,梅赛德斯-奔驰将ChatGPT集成到了车机上,开启了为期三个月的测试,结果显示,它的语音助手不仅可以完成简单地指令,还能进行连续多轮对话,理解能力和响应质量都有较大提升。
理想、创维、蔚来等汽车厂商随即蜂拥而入,用前沿的GPT能力让车机智能化程度更上一层楼。车机也彻底从最初的“收音机”变成了功能丰富的智能终端,加上GPT“大脑”后,又开始从木讷、鸡肋的机器向行车伙伴转变。
而人车交互不是AI上车的尽头,自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图,一旦地图更新跟不上瞬息万变的路况,行车安全将受到威胁。AI大模型的进化升级,让车企们看到了机会。
让AI主动感知和决策,放弃对高精地图的依赖,正在成为一种主流趋势。几天前,理想汽车开启城市NOA(导航辅助驾驶)内测,它将BEV(Bird’s eye view,鸟瞰图)大模型作为主要解决方案,让汽车模仿人类“脑回路”驾车。通过连续学习,城市NOA还能被训练成用户通勤路线上“代驾”。
接棒互联网,AI正在对汽车进行更深层次的改造,四个轮子的大家伙越来越神似变形金刚。
车机+GPT,奔驰先出手
一场由内而外的“变形记”正在席卷汽车圈,从传统燃油动力到新能源,从驾驶工具到智能化产品。多年以来,科技驱使下,汽车不断变幻着外貌和内在,互联网改造汽车后,人工智能又来了。
梅赛德斯-奔驰在这股新浪潮中一马当先,要把ChatGPT移植进车机。
6月16日,奔驰为期3个月的ChatGPT测试计划在美国启动,它与微软合作,通过 Azure OpenAI 服务将ChatGPT集成到车机中。车主可以通过Mercedes me APP选择使用ChatGPT,还有更直观测试方式——直接在车内使用语音命令“Hey Mercedes,我想加入测试计划”,奔驰的MBUX 信息娱乐系统就会将语音助手“Hey Mercedes”自动接入ChatGPT。
过往,Hey Mercedes可以提供体育、天气等信息,并回答有关车辆周围环境的问题,还能控制用户的智能家居,这都是制式化的。ChatGPT加入把问答变灵活了,用户能询问目的地详细信息,获得晚餐建议,可以不断提出问题,连续收到回复。这是ChatGPT的看家本领。
当前,仅在美国地区约90万辆配备MBUX的奔驰汽车可以优先测试ChatGPT,奔驰打算利用这个初始测试期深入了解用户提出的请求,来确定未来开发的优先事项,以及调整不同市场和语言的推出策略。
关于接入ChatGPT这事儿,奔驰给了一个充满感性的声明,“一切目标都围绕着重新定义您与梅赛德斯的关系。”奔驰要让ChatGPT重塑人车交互体验,更形象的类比是,车机从一个木讷的注重功能性的机器“活”起来了,向着车内生活伙伴的角色转变。
奔驰之后,国内的汽车厂商率先跟上。
6月19日,理想汽车推出了自研的认知大模型“Mind GPT”,这个大模型由理想的空间算法团队研发。据说大模型训练的开始日期早在ChatGPT发布之前,Mind GPT基于数10 TB的原始训练数据,使用了1.3万亿个Token进行基座模型训练,能识别声纹和语音内容,还能听懂方言,同时能为车主提供出行规划,甚至具备AI绘画和AI计算等功能。
理想透露,Mind GPT发布后,理想汽车将新增LUI(用户语言界面)交互方式,“比如你想吃个火锅,只需要呼叫理想同学,车机界面就会生成火锅的图片供你选择,随后自动算好出行路线。”
创维汽车也在近日宣布,旗下两款车型创维EV6Ⅱ及创维HT-iⅡ在智能车机上集成了ChatGPT,此外,长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了GPT相关商标。
GPT上车成为一股潮流。奥纬咨询董事合伙人张君毅认为,GPT技术的接入能够提升车的人机交互能力和综合环境问题的互动能力。今后车企在同一价位段的硬件方面的品牌差异会越来越小,当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时,卷智能就成了必然选择。
给智能座舱装上“大脑”
ChatGPT上车又是汽车进化史上可书的一笔,最前沿的自然语言处理大模型应用到了人类的出行工具上,更丰富的车内生活体验将会出现。
回望30多年前,车载娱乐功能和车机智能化,尚是一片空白。第一代车机诞生于上世纪80-90年代,当时人们普遍的关注点还是汽车的发动机、底盘和变速箱“三大件”,突然有一些车型不仅能听收音机,还能吞进磁带,自由播放音乐,汽车有了一些第二生活空间的影子。
第二代车机则加入了DVD播放、MP3,娱乐性凸显的同时,汽车又向驾驶体验迈了一步,加入了车载导航。此时,解决“路盲”问题成为一个主流趋势。许多老司机一定记得,在没有车联网的时代,凯立德车载导航成了高端车型的标配,它使用GPS卫星定位和存在车机里的地图包数据,实现相对准确的导航精度。
但除了导航和听歌、收音之外,当时的人们并不对车机抱有太多期待,车机也往往不是决定购车与否的主要因素。
进入21世纪,电子数码技术不断发展,手机的形态先变了。循着这个进化思路,车机上出现大屏,智能化成为新卖点。基于linux、WinCE、安卓等系统的车机陆续被汽车厂商采用,而后汽车不仅可以免费实时导航,还具备全景可视系统、汽车驾驶辅助系统,比如360度影像等。
当汽车连了网,一切由变得更不一样。在线观影、路书、语音控制、预约保养、远程诊断等功能被加入车机,中控台的屏幕越来越大,功能越来越多,一些厂商直接在驾驶室装上了比平板电脑还大的显示屏,甚至厂商们近来卷起了“全面屏”,就连副驾和后排都要装上屏幕。
终于,“第三块屏”的概念越来越显眼,主机厂们希望,车机能够成为继电脑和手机之后,影响人类生活的第三代智能终端。用富含科技感的车机占领用户心智,拓展更多的商业模式,成为现在的车企们攻坚的方向。
现在,“车机”这一原始概念逐渐被“智能座舱”所替代。蔚来甚至造出了“第二起居室”的新词,不仅车机越来越智能化,车企们开始卷内饰用料、音响系统、灯光系统,蔚来还发布了一款AR眼镜,支持随车巨幕观影;理想L9甚至配备了一个后排冰箱,让汽车成了可移动的房子。
但无论是车机还是智能座舱,语音对话一直都是发展相对滞后的功能,考虑到驾驶安全性,语音操控又十分必要。
过去近十年来,几乎所有车企和大量的AI创业公司,在自然语言处理领域投入颇多,希望优化车内的语音交互体验。许多车机都能回答简单的预设命令,比如调高温度、预报天气等,升级和创新围绕拓宽自然语言口令展开,比如当用户说“有点热”后,车机可以打开空调制冷或调低温度。
但想让车机听懂更多“人话”,比如用各种方言规划路线、甚至找餐馆,可能还真不如车主自己用手机地图和大众点评来得有效,更丰富的语音式人车交互陷入瓶颈,直到ChatGPT出现。
自然语言大模型产品(ChatGPT、文心一言、通义千问等)直接开放给C端使用,使智能座舱的开发者们看到了曙光。强大的理解能力和逻辑推理能力,有望让车机成为行车助手,暗藏商业可能。
比如,车主可以告诉语音助手,“帮我找出目的地附近有团购优惠、评分超过4.5的火锅店,一会有5个人用餐,给我预定一下位置,再看一下哪里停车方便。”放在以前,车机绝对无法一次性理解如此多的信息,但对ChatGPT来说,这只是它的基操,只要实时数据源足够多,需求被满足的可能性能够无限大。
GPT的加入并不只是让对话更流畅了,而是让车机具有了“大脑”,不仅能回答问题,还能理解需求并生成答复。至于智商有多高、反应有多快,取决于汽车厂商对上车大模型的训练能力,以及敢不敢“氪”金上更牛的硬件(芯片)。
AI如何让自动驾驶“脑回路”更像人?
车内生活的丰富,让汽车逐渐成长为一个充满温情的载体,它不再是枯燥、冰冷的代步工具,转而成为一个舒适的生活空间。
而AI主导的汽车进化还不止于GPT上车,它对自动驾驶的技术推动更加意义重大。
传统的自动驾驶研究方法是通过采集大规模的驾驶数据、测试更长的驾驶里程来覆盖所有可能的驾驶场景,以确保发生突发状况时汽车有预先设定的应对方案。但突发状况的复杂程度往往难以预料,一旦系统中没有应对某种特殊突发状况的预案,驾驶安全就将受到极大的威胁。
这也是为什么当前的辅助驾驶系统,必须要求驾驶员手扶方向盘以应对实时突发情况。而AI的学习能力将有可能改变这个现状。
不久前,清华大学研究团队提出了自动驾驶“可信持续进化”技术,该技术是基于动态评估AI的可信赖程度进行学习训练,保证自动驾驶汽车在遇到陌生新场景时,其驾驶能力可从基础性的主动避让开始持续提升,在确保安全前提下达到更好的驾驶表现。
简单理解,利用AI,自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景,进行持续进化,随着驾驶里程与数据量的累积,性能得到持续提升。
理想汽车正将AI大模型用到自动驾驶领域。6月17日,理想宣布开启城市NOA(导航辅助驾驶)内测,并将在下半年向用户开放通勤NOA功能。与常规解决方案不同的是,理想采用了BEV(Bird’s eye view,鸟瞰图)大模型,来实时感知和理解环境中的道路结构信息,让汽车更能模仿人类驾驶员的操作习惯。
以往多数汽车上的辅助驾驶系统,大多是采用高精地图方案,相当于实时把路况投喂给自动驾驶系统,让其做出决策。但在复杂的城市道路中,总会有高精地图无法覆盖和无法及时更新的区域,这成为了该方案的一大缺点。而采用BEV大模型后,相当于AI主动感知实时路况,自主决策驾驶操作。
当然,BEV也有缺点,例如在一些跨度较大的路口,通行车辆较多,传感器视野容易被遮挡,导致车端实时感知的结果会丢失局部的信息。为了弥补这一不足,理想据称搭配了神经先验网络(NeuralPriorNet,简称NPN)和端到端的信号灯意图网络,前者的作用相当于每当车走过自动驾驶车队走过的路口,都有图像参考;后者则是学习大量人类司机在路口对于信号灯变化的反应,帮助自动驾驶系统理解交通信号。
根据实际的测试反馈,理想城市NOA还不能够完全实现自动驾驶,它存在转弯不够及时和不擅长超车的问题,此外,面对一些特殊障碍物,算法无法做出决策,必须进行人工接管。
不过,相比于传统的训练方式,大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力,这意味着自动驾驶能力会逐渐提升。典型的案例是,理想汽车推出了通勤NOA功能,在开启该功能之前,车主需要先设定通勤路线,通过日常通勤时的自动化训练积累NPN特征,大约1至3周时间后,AI可以成长为通勤路段的“代驾”。
这个过程体现了AI大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况,再进行辅助驾驶,“脑回路”更像人类了。
用AI大模型研发自动驾驶鼻祖不是理想,而是特斯拉。早在2021年,特斯拉就曾推出基于Transformer架构的BEV感知方案,随后华为、百度等企业也在“BEV+Transformer”上展开布局,目前,特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类“城市NOA”功能。
大模型的持续进化,很可能让车企们找到了自动驾驶技术的突破方向,摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在“辅助驾驶”阶段,未来,你很有可能会将你的交给AI接管。
上一篇:环球今亮点!涡轮增压一般寿命多久 涡轮增压器的寿命有多长)
下一篇:最后一页
截至2022年7月19日,Choice数据显示,市场之上已有270只(只统计主代码,下同)基金公布2022年二季度报告。其中,丘栋荣、陆彬、施成等知名基
7月15日,国家统计局公布6月70个大中城市商品住宅销售价格变动情况,以及1-6月份全国房地产开发投资销售情况,均为体现房地产行业上半年运
深交所向恒大高新发关注函,2022年7月7日至19日,公司股票价格涨幅101 01%,期间两次触及股价异常波动标准,深交所对此表示关注,要求说明
福耀玻璃(03606)发布公告,2022年7月15日,该公司在全国银行间市场公开发行2022年度第六期超短期融资券(简称22福耀玻璃SCP006),超短期融资
中科蓝讯(688332 SH)发布公告,该公司首次向社会公开发行人民币普通股3000万股,每股发行价格为人民币91 66元,募集资金总额为27 5亿元,募
X 关闭
X 关闭
作为国脉科技(002093)的实控人之一,陈国鹰欲再推旗下企业慧翰微电子股份有限公司(以下简称慧翰股份)上市,该公司此前科创板IPO曾走到注册[+更多]
7月18日,上海证券交易所(以下简称上交所)在官网发布关于对威龙葡萄酒股份有限公司及有关责任人予以监管警示的决定称,经查明,威龙葡萄酒[+更多]
信托系公募基金的团队阵营正在缩减。7月18日,来自全国产权行业信息化综合服务平台发布的信息显示,中融信托以底价约15 04亿元的价格公开挂[+更多]
7月18日,福石控股(证券代码:300071)控股股东杭州福石资产管理有限公司向台州金控资产管理有限公司质押股份1700万股,用于自身资金需求。[+更多]