陶大程院士:大模型的上空漂浮着一朵“乌云”

7月6日消息 昨天,中国信息通信研究院承办的WAIC 2024“迈向AGI:大模型焕新与产业赋能”论坛,于上海徐汇西岸拉开帷幕!本次论坛深度聚焦大模型产业应用落地、端侧智能、大模型安全与治理等前沿热点话题,携手全球AI领域顶级学者、行业领袖展开顶尖思维碰撞,共探大模型驱动新质生产力发展的新潜能,为行业呈现一场精彩纷呈的科技盛宴。

澳大利亚科学院院士、南洋理工大学杰出教授陶大程院士应邀作了题为“大模型的道术”的主旨演讲。

陶大程表示,从ChatGPT成功以来,大模型发展十分迅速,一定程度上可以看作是人和自然的博弈。随着超级大模型的诞生,人工智能的发展已经进入了平台期,走在十字路口的中央,产业界更应该思考大模型的道和术。“何为道?就是大模型的工作机制,何为术?就是大模型的实现和实践的具体路径。理解道,我们将会清楚大模型的工作机制和工作边界。在理解道的基础上,我们才有机会能够更好发挥术。正所谓,有道无术,术上可求,有术无道,止于术。”

陶大程指出,历经了80年的实践,神经网络终于在大模型时代证明了自己。在他看来,神经网络的发展动力主要来自于算力和数据的不断增长,特别是最近10来年,深度学习充分展示了它在发展进程中的实际价值,目前深度学习的发展已经进入了由大模型所驱动的超级深度学习时代。

陶大程认为,大模型的激动时刻莫过于它的涌现能力,但我们对什么是涌现能力还不够清晰。“一定程度上,当前大模型已经可以对产生的结果,做出相对比较合理的解释,只是我们还不能够完全信任这些解释。因为我们对大模型的基本工作原理还不够清晰,而这正是大模型的道。幻象总是在发生,但我们不知道什么时候发生,也不知道为什么发生。今天,大模型的上空也漂浮着一朵乌云,这朵乌云实际上让我们惴惴不安。”

陶大程指出,大模型的研究工程化和使用目前都面临诸多的挑战。比如,我们尚不清楚大模型是不是真的会思考?比如在大语言模型方面,复杂表述的困境,跨语言的幻觉甚至是翻译的误差;比如在文生图方面,视觉文本的错误对齐、畸形的手和脚以及多模态混合生成的具像错误等等。同时,我们还面临众多人工智能安全的问题,内生安全包括鲁棒性、隐私保护、公平性以及透明性,衍生安全方面包括了可靠性、偏见、笃性。

陶大程强调,虽然面临诸多挑战,但我们依然要向前,道虽不清,术上还要全力以赴。“大模型作为效率工具,我认为它是一个非常好的选择,可以广泛应用于娱乐、电商、搜索的业务之上,大模型将会对未来的人机交互产生划时代意义的变化和影响,人机交互将有机会实现全感知、沉浸式、无边界以及无障碍。”

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-07-06
陶大程院士:大模型的上空漂浮着一朵“乌云”
陶大程院士:大模型的上空漂浮着一朵“乌云”,C114讯 7月6日消息 昨天,中国信息通信研究院承办的WAIC 2024“迈向AGI:大模型焕新与

长按扫码 阅读全文