8月8日消息,近日,快手高级副总裁、研发线负责人于冰表示,AI大模型作为当下最重要的革命性技术,进入爆发期,有望开启AGI时代,而多模态内容生成与理解是其核心能力。
于冰认为,当前,多模态AI大模型因其在文本、代码、图像和视频等多种内容上突出的生成与理解能力,有望为视频生产、理解、分发、消费等全链路打开新的技术视角,突破传统音视频编码的技术天花板,突破基于用户行为的搜广推算法的传统思路,将视频内容创作从PGC、UGC带动进入AIGC时代,创造AI大模型驱动的视频内容创作工具,激发创作者的创意空间,高效率、低成本地生产高质量的视频内容。
而短视频、直播作为最典型的多模态媒介,快手也抓住平台基因,在AI大模型领域重度投入,全方位探索技术突破。于冰介绍,目前,快手在AI大模型的布局体系分为三个层级:基于具备高性能、高并发、高算力的“大基建”,构建快手多模态的AI“大模型”,进而在搜广推、内容创作、用户增长、研发效能等领域内打造“大应用”。
他提到,在多模态 AI大模型的加持下, AI技术和工具可全方位地赋能影视创作者,助其在创作、拍摄、后期等各阶段激发创意、提升效率和内容质量,影视制作的周期也能大幅提高,过去花费数年拍摄的大片有望数月完成。
快手自2011年成立至今,回顾过往经历,于冰表示,业务发展会经历入局、成长、成熟等多个阶段,在业务发展的不同阶段,快手所采取的研发策略也各有侧重。创新成长期更注重持续投入,探索新产品、新周期;而成熟阶段则需聚焦优化效率,兼顾体验,既保证产品体验的竞争力,又保证业务的稳健成长。
于冰以快手音视频业务为例,目前该业务已步入成熟期,研发策略重点也转移至提升效率、优化成本,追求单位成本下算力、存储和网络使用效率的提升。快手基于自研视频质量评估KVQ、视频增强修复KEP和KRP、视频压缩编码算法KVC等一系列核心技术,形成数据驱动的视频处理闭环,在兼顾体验的同时极致压缩视频。
2022年,快手技术toB业务StreamLake推出了首款自研智能视频处理芯片SL200,该芯片集成了快手领先的视频编解码、图像处理、AI推理、内容自适应编码等关键技术,具备高质量、高密度、智能化的特点。目前,SL200芯片已全面应用于快手的直播和短视频业务,实现成熟技术通过StreamLake对产业赋能。
而在数字人领域,于冰介绍,快手全链路自研了光场扫描重建、超写实人像建模、智能绑定、动作捕捉与驱动、物理仿真等数字人核心技术,推出「快手虚拟演播助手(KVS)」和「快手智播」两大解决方案。未来,结合智能编曲、图像/视频生成、LLM等AI能力,快手数字人技术将继续在文旅、教育、游戏、直播电商等领域广泛应用,助力客户打造高品质低成本的3D和2D数字人。(一橙)
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 哪吒新能源汽车制造公司10亿股权被冻结?公司回应
- 蔚来今日迎来成立十周年 已建成2700座换电站
- 余承东官宣Mate70新功能“AI隔空传送”
- 四部门:深入整治“信息茧房”问题,严禁利用算法实施大数据“杀熟”
- TechWeb一周热点汇总:华为Mate 70定档11月26日,字节跳动上调年终激励
- 张朝阳对话基普乔格:跑步像经营一家企业,每个细节要做到极致
- 英伟达CEO黄仁勋香港科技大学最新演讲:机器人时代即将到来
- 蔚来法务部回应收购谣言:公安机关已立案调查
- 阅文集团与大英图书馆达成三年合作,10部网文入藏大英图书馆
- 又10部网文入藏大英图书馆,《诡秘之主》《全职高手》《庆余年》在列
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。