极客网·企业级IT 1月21日 根据多家调研机构的预测,未来几年,全球多模态AI市场的年增长率将超过35%,而谷歌正在积极布局,以期在这一蓬勃发展的市场中占据领先地位。
谷歌云计算部门最近宣称,将文本、图像、视频、音频和其他非结构化数据与生成式人工智能(GenAI)处理相结合的多模态AI,将成为2025年五大人工智能趋势之一。
BigQuery湖仓一体引领谷歌多模态AI战略
谷歌负责数据、分析和人工智能战略的产品主管Yasmeen Ahmad表示,BigQuery数据仓库是谷歌多模态AI战略的核心支柱,公司正致力于将其重塑为能够整合并分析多样化数据类型的湖仓一体(Data Llakehouse)。
她进一步解释说:“在‘湖仓一体’这一概念提出之前,BigQuery实质上扮演了最初的湖仓一体角色。我们构建了这个关系引擎,旨在满足企业客户对于各类结构化分析的全部需求。”
Ahmad还表示,根据谷歌的估计,90%的企业数据是非结构化的数据。通过将图像和语音识别等技术与结构化数据相结合,用于检索增强生成训练,企业能够从以往无法使用的数据中获取见解。
餐饮连锁巨头Wendy's Co.正是利用这一技术的企业之一。该公司正测试一款融合了BigQuery、谷歌的Vision AI以及Gemini技术的创新应用,旨在通过分析“免下车服务”通道的视频录像来精准识别运营瓶颈。通过将视频图像数据与人员配置、排班安排等运营数据相结合,该应用能够优化人员配置,提升服务效率。Ahmad强调说:“这并不是简单的视频分析,而是将视频数据与运营数据整合到同一平台实现全面洞察。”
美国快递巨头UPS构建了一个仪表盘,能够实时分析卡车上的传感器数据,并向司机发送精确指令,从而优化实时配送路线,提升物流效率。
电信运营商Bell Canada也在积极探索AI的应用潜力,他们正利用AI技术生成的联络中心通话记录来训练“助理教练”,为客服人员提供更加精准、及时的反馈,以提升服务质量。
多模态AI助力零售商精准营销与内部应用加速
多模态AI技术能够汇集来自呼叫中心、社交媒体评论以及移动应用反馈等多渠道的客户情绪信息,并将这些信息提供给GenAI引擎,从而为零售商揭示出针对特定营销活动的新的细分市场。Ahmad强调:“多模态数据与AI的结合实现了以前无法实现的个性化和可扩展性。”
Gemini平台可以直接在BigQuery的数据基础上运行,从而消除了数据传输的过程,这显著加快了应用开发的速度。Ahmad表示,如今,众多组织仅需数周时间就能成功推出试点项目。
大多数早期的应用主要局限于组织内部使用,这主要是因为他们在GenAI应用于客户服务时往往持谨慎态度,然而在企业外部却蕴藏着更多的机遇。
Ahmad指出:“尽管客户长期以来已经累积了大量数据,但这些数据往往未能得到充分利用。通过借助BigQuery强大的多模式数据基础,以及与Vision AI和Gemini的集成,组织现在能够更轻松地达成既定目标。”
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。