每晚七点,一名汽车领域、拥有几十万粉丝的主播,都会在直播软件上接受连麦提问。
有人问三元锂电池和磷酸铁锂电池哪个好?
有人问电车能不能买,电池是不是不经用?
……
一次连麦提问持续不到一分钟,但麦序上整整排了上千位对汽车有疑问的观众。
午夜十二点一到,主播直接关闭了直播软件,下播休息。留下麦位上还在排队的几百位观众面面相觑——他们已经举着手机,排了一个多小时的队,却没能解决自己的疑问。
类似的情况比比皆是:问旅游的、问母婴的、问兼职的、问教育的……
所有提问共同制造了一个十分矛盾的叠加态:社区里的意见领袖越来越多,但被解决的问题却越来越少。
这事儿的最大的原因之一在于,大部分有价值的信息,都是需要在网络上,进行高强度检索和筛选的。而不同领域的信息,检索渠道通常都不同。普通人不但很难判断意见领袖们的专业度,也几乎不可能随时随地的自由提问。
更常见的情况是,一些看似日常,但实则不易回答的博物学问题,往往出自还在上幼儿园的“好奇宝宝”之口,孩子随口一问,父母哑口无言,或者无暇应接孩子层出不穷的问题。
这是为什么最近很多人开始尝试利用AI来解决自己的问题。
笔者最近观察到,很多博主对华为小艺进行测评。
有人问,问界M5和M7车型对比,小艺会直接罗列一张横向对比的表格,非常直观;有人问非上海户口,在上海能办香港签注吗?小艺会准确回答,列举办理流程、注意事项,并罗列信息来源,排在前面的都是本地宝这种可信的参考来源。
还有之前奥运会期间,很多人去问小艺比赛谁会胜出,小艺神预测居然全部猜中了。
作为一个智慧助手,小艺似乎正成为了一个新物种——用户可以随时提问各类稀奇古怪的问题,而小艺的回答非常专业、实用、可靠。
01
“专业助理”的升级之路
大模型与语音助手的深度结合,使传统语音助手的听、说、思考能力都直接翻倍,能完成十分口语化的对话,并习惯于旁征博引。
小艺在2023年8月HDC上就官宣接入盘古大模型,可以理解模糊意图和复杂命令,走在了行业前头。
随着大模型预训练的算法、数据和工程化方法,都越来越完善,且在很大程度上解决了“大模型幻觉”的问题。
早期的大模型产品,很有天赋,数学、地理、文学,好像什么都懂,但也很难依赖,偶尔会胡说八道,产生某种“这是事实”的幻觉。
幻觉产生的原因,是训练大模型的数据本身存在错误,叫做噪声数据。
行业内普遍的解决方案,是分两步走,一步是从源头开始,尽量采用可信来源的训练数据;一步是在大模型推理的过程中,检索相关文档,利用外部知识,减少幻觉。
其实数据合作一直是大模型公司的“软肋”——大模型训练所需要的训练数据是海量的,参数规模动辄达到万亿级。华为目前已和多个权威机构达成了数据上的合作,并会在回答中按可信度列举参考来源。
比如,对小艺提问“二里头夏都遗址博物馆介绍一下”,小艺会展示博物馆的位置、介绍、馆藏文物、开放情况等,而且回答的第一条参考来源是中国大百科全书。
如果对小艺提问“上海近5年的GDP发展趋势”,小艺不仅会引用国家统计局的数据,还能给出图文并茂的趋势图,更加方便用户阅读理解。
这看起来已经是个完全值得信赖的“专业助理”角色了,尤其是来自统计局的数据,令人咋舌——上网自己找报告,再制作表格,还不如直接问问小艺。
小艺甚至在问答体验上,更进一步,围绕生态合作,实现使用体验上的连续服务。你可以问问小艺,甄嬛传里翠果掌嘴是在第几集,而小艺除了加粗并准确回答问题,还会推送甄嬛传的播放链接。
华为曾发布过一个服务叫做“HarmonyOS意图框架”,这种对用户意图的理解和连续服务,就是这个意图框架的效果演示。
可以说,在小艺身上,华为过去十年在AI领域的积累展露无遗。背靠盘古大模型的华为小艺,其问答能力还远没有被媒体博主们测试出边界,相信医学、气象等专业领域,小艺未来都能给出专业回答。
02
不止于“听”与“说”
要媲美真人专家,光靠“能听”“会说”也不够,还必须好用。
目前市场上的中高端机型,几乎100%配备语音助手,但根据Strategy Analytics的数据,其使用频率仅为每周3-4次。事实上,除开车内等实在不方便动手的少数场景,语音交互的用户接受度,一直存在大问题。
所以对于现在的所谓“智慧助手”而言,能力强只是一方面,它还必须要在易用度上做出调整。
小艺的做法是,除开长按电源键呼出、语音唤醒,还给小艺增加了识屏、圈选、拖拽等多种操作模式,小艺也从幕后到台前,与系统AI导航条融合,常驻屏幕底部,这不仅让用户使用更方便,无处不在也让用户增加了使用频次。
设计这么多操作方式,不显得花里胡哨吗?
还真不是,关键在于,用户本就不应该去迁就智慧助手的交互模型,而是智慧助手应该匹配用户的操作习惯。
以小艺的使用场景为例,外出旅游时如果看到漂亮的景点或建筑物,很好奇,但不知它的名字和历史,则可以拍照后,让小艺进行解答。
而圈选操作的存在,让这种功能体验变得更加日常和自然。比如你在火车上看电影或浏览资讯的时候,某个演员不认识,圈出来问小艺该演员是谁;看到社交媒体上的穿搭推荐,圈选出来问问小艺搜同款;路过一条文化古街,拍照后想了解照片中某个古建筑的由来,也完全可以圈选出想了解的建筑,小艺会精准识别你选中的部分,给出专业回答。
当然,如果你是在阅读英文材料或者英文网页,直接双指按压屏幕进入识别界面,全屏翻译更为方便。
相信很多人用手机处理工作,需要处理文档,此时可以用小艺拖拽的功能,把文档拖入小艺,进行摘要,还能对文档内容进行问答,更好的理解内容。
如果你在手机上接到聚会邀请,小艺可以识别其中的地点信息,进而传输给问界的车机系统,实现从手机到汽车的跨终端任务执行。
这种便捷的操作设计,除了设计之初的“人文关怀”——对用户需求的细节洞察。小艺能做到这一点,其根源还是在鸿蒙系统本身。
2024年10月22日,“原生鸿蒙之夜暨华为全场景新品发布会”上,华为正式发布原生鸿蒙操作系统HarmonyOS NEXT,开启更多机型公测。
所谓纯血鸿蒙,主要是两个概念:完全自研自主,与安卓彻底分割,继而诞生了一个非常有想象空间的推论:华为自此对鸿蒙系统及其使用体验,有完整的、不受任何制约的体验优化和定制能力。
而得益于纯血鸿蒙,小艺理论上可以在任何界面被唤醒,进行服务,直接打破了通过APP、网页访问大模型的僵硬服务模式。
这是一种AI能力的系统级下沉,从赋能各个子系统,形成原生智能的底座,大量的日常应用、控件、服务,在此牵引下完成智能化升级,比如:备忘录智能摘要/润色/排版、图库AI消除/AI扩图,等等。
可以说,拥有全栈自研操作系统打底、鸿蒙原生智能框架的小艺已经下一个level了。小艺的上限在哪,很难想象。
03
写在最后
必须要说明的是,小艺的上述表现,并非是根据特定测试而制作的精美PPT。
从根源来看,长期的人才储备,自研的HarmonyOS,鸿蒙生态、AI大模型技术全面融入终端系统,少了哪一个,小艺都会“发育不良”,但华为恰好都有。
用当下时髦的词儿来说,这就是华为的“势能”,所以小艺在技术领先性上的优势,只会越来越明显。
鸿蒙智能座舱、智能手机、平板、智能手表等华为终端设备搭载着小艺,为消费者带来更加强大的智慧体验。
而使用这些设备的年轻人,也正在养成“随时随地问问小艺”的新习惯。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )