中国AI的底牌与前路:王海峰团队十篇论文入选ACL的价值释读

原标题:中国AI的底牌与前路:王海峰团队十篇论文入选ACL的价值释读

今年的自然语言处理领域顶级会议 ACL已经放榜,每每AI顶会放榜之时,也是科技企业们集体关注自身学术研究进度的时候。近年来随着中国科技企业对AI技术的研究日益深入和产学结合的趋势发展,各个AI顶会上科技企业的出没也愈发频繁。从某种程度上来说,一家科技企业被顶会收录论文的数量,也体现了这家科技企业在AI自主创新上能力。

在ACL 2019中有效投稿数量达到2694篇,相比去年增长高达75%。值得关注的是,百度共有十篇论文被收录,覆盖了信息抽取、机器阅读理解、对话系统、视频语义理解、机器翻译等NLP前沿研究方向。对于科技企业来说,这已经属于在国际顶会上能取得的里程碑式的成绩。

提起ACL,不得不让人联想到百度高级副总裁王海峰博士——2010年加入百度的王海峰一直横跨产业和学界两个领域,还在曾在2013年出任ACL首任主席。在这样NLP领域领军人物的带领下,百度在ACL 2019取得的成绩并不意外。

其实现在像王海峰和百度这样科学家与科技企业的组合并不少见,我们或许可以尝试从王海峰个人身上,寻找科学家与科技企业共同产生化学反应所需要的特质,看看AI自主创新是如何在这种化学反应下生长的。

一重反应:从学术远见汲取养分

虽然王海峰在2010年就加入了百度,但大多数科技企业是在AI大潮开始之后开始与科学家们牵手。从2015年开始,从海外的谷歌、Facebook,再到国内的科技巨头,都开始邀请学界科学家加入、建立属于自己的研究院。其中原因在于,AI本身就是一种诞生于实验室,受学术研究所驱动的技术。一家企业是否在学术上具有先进性,几乎决定了这家企业在AI技术方面的创新能力。

同样王海峰为百度带来的,也是学术视角上的远见。

王海峰对于NLP前沿方向的关注,可以追溯到在哈工大就读期间,在博士毕业论文中,王海峰就率先将神经网络方法引入机器翻译中。在随后的工作经历中,王海峰也一直与AI学术界保持着密切的联系,像在百度就职期间,王海峰还出任了ACL亚太分会AACL创始主席、IEEE工业顾问委员会委员等等权威学术组织、会议的职务。

作为科学家,与权威学术组织的密切联系,让王海峰可以帮助百度AI很多次踩中AI发展过程中的高点。举例来讲,在很多人尚不知知识图谱为何物时,百度的知识图谱技术就在王海峰的支持下逐渐成型,并且在今天为百度AI技术体系提供大量底层支持。对于知识图谱这类需要大量投入累积的技术来说,远见之下的率先投入,将为百度带来显著的先发优势。

如果将AI自主创新想象成一颗大树,学术视角的远见就是这颗大树深入土壤的根系,源源不断地从学界汲取着养分,支撑整棵大树的成长。

二重反应:用产业视角推动生长

前文提到,科技企业与科学家的组合已经日渐普及。一些在学界堪称风雨人物的科学家,例如李飞飞、LeCun等等,都有企业任职的经历。可以说对于科技企业来说,获取学术视角并非十分困难。

但我们注意到,王海峰和很多科学家不同的是,他从2010年加入百度距今已经将近十年,比大多数科学家更早接触产业、也拥有更丰富的产业经验。因此王海峰得以将学术视角与产业思维相结合,在他的影响下,因此我们可以看到百度AI创新通常是在产业思维框架下进行创新。

在百度大脑中,这种趋向格外明显。作为向产业生态输出技术的平台,百度大脑将百度在AI上领先性化入技术API和产品之中。例如推出针对人脸闸机、人脸核验等等专项解决方案,以及远场语音开发套件这样的硬件产品与服务。

这类能够直面应用环境的技术平台,可以帮助百度AI更快进入现实场景中进行锤炼并获得反馈,帮助百度那些偏于基础和学术角度的技术创新可以有实际的流向,对企业整体技术生态带来正向驱动,保持AI自主创新的持续性。

同时借助王海峰对产业的深入理解,也能让百度AI对产业需求有着更敏感的感知。例如推出第一款开源中文深度学习平台PaddlePaddle,就是从产业角度意义非凡的创新突破。一个独立自主深度学习平台的存在,可以保证百度AI以及整个中国AI产业在进行技术输出时获得更多保障。从宏观角度来看,同样也给予了AI自主创新更长线的支持。

在大树生长的过程中,虽然学术视角提供了营养,但只有结合产业思维,才让枝丫有了抽条生长的可能性。只有AI创新更具实际意义,创新能力才有了在一家企业里不断生长的可能。

三重反应:人才虹吸下的拓张繁茂

这也是为什么,能够招揽来科学家的科技企业不在少数,而真正能与科学家一同推动AI自主创新的企业却寥寥无几。

而这种在产业和学界都能占据高位的特点,还为王海峰带来了另一项重要特质,那就是对人才的吸引和甄别能力。对于企业来说,能够保持科技创新能力不仅仅需要一位“王海峰”,还有持续的人才补充和更迭。

王海峰的学术能力和在学术组织中的权威性,让他可以有能力帮助百度吸引来更多学界人才;而在产业中累积的经验和思维模式,能够让他发现哪些学界人才的学术能力更加适合百度。我们可以看到,从早期的吴华到近年来的Kenneth Church、浣军等人,这些专家有的本在斯坦福这样的顶级高校任职,有的已经在学术领域闻名遐迩,最终都被百度和王海峰所吸引,为百度AI添砖加瓦。

在人才的不断组建之下,百度AI可以实现规模化的创新。尤其在视觉、语音、语言与智能等等领域中,这些科学家们正源源不断的贡献着力量,学术层面和应用层面皆是如此。

就像在上个月刚刚放榜的国际视觉顶会CVPR上,百度同样获得了17篇论文入选的好成绩。而在自然语言处理首席科学家吴华的带领下,百度大脑已经推出了全新的智能对话引擎,引导对话技术进行工业级落地。

从王海峰个人的学术能力来说,带给百度AI的更多是NLP方面指引。但结合由王海峰协助编织起的人才网络,就能给予百度AI创新全面能力的补充。借助养分与生长能力之上不断扩张繁衍,最终形成一片密林。

跳脱框架、前沿创新:科学家在科技企业中的价值最大化

在这一系列科学家与科技企业的化学反应之下,不难发现百度AI正在自主创新之路上留下一个个稳固的脚印——这次入选ACL的论文主题中就可见一斑。

ACL对于中国科技企业来说并不陌生,此前搜狗、科大讯飞等等企业也曾参与过投稿或ACL组织的竞赛,并获得了一定成绩。例如科大讯飞曾在ACL下属组织主办的第十二届国际语义评测比赛中获得基于常识的机器阅读理解全球第一;字节跳动在去年也曾被收录过针对于中英,德英和英法三个标准数据集上,有关神经网络机器翻译动态解码机制的论文。

但这些科技企业,再对顶会的攻坚上和百度有着一个显著的区别。那就是相比百度,这些企业更倾向于在现有的框架和数据集上进行突破钻研,倾向于在指定的方向上前行。像在某一个竞赛中取得名次,或针对某一标准数据集推出算法改进。而百度则更倾向于跳出现有框架之外,去探索更前沿的陌生领域。

像在这次ACL收录的几篇论文中,百度AI就提出了包括基于注意力正则化的ARNOR框架(Attention Regularization based NOise Reduction)、语言表示与知识表示深度融合的KT-NET模型、多粒度跨模态注意力机制、基于端到端深度强化学习的共指解析方法等,在人机交互、智能客服、视频理解、机器翻译等场景中具有很大的应用价值。

正因为在自主创新上的远见和高度投入,才能让科学家在科技企业中的价值最大化,不断让百度AI踩中技术发展的关键拐点。

结束语

一家科技企业在一次顶会上取得的成就,就如同一场抢滩登陆战,即使打得再“漂亮”也仅仅是个开始。只是这场战役让我们注意到了科学家这一至关重要的元素,以及科学家和科技企业之间所产生的化学反应。

从百度AI和王海峰之间的案例看来,我们可以发现一位科学家的学术能力和产学融合视角,再加上人才号召能力,能够帮助企业在AI的净技术研究、应用打造和场景布局中不断取得自主创新突破。让AI自主创新能力扎根、生长并不断繁殖。王海峰在其中的作用就如同一位炼金者,推动不同元素的碰撞最终迸发能量。

如今在科技产业深受大国博弈影响的背景之下,我们也愈发能够感知到百度这种全链条AI自主创新能力的重要性。此时发布在国际顶会上的论文、开发者手中属于中国的开发平台以及那些源源不断进入应用层面的技术接口,对于百度AI和整个中国AI产业来说,都是在增加手中的底牌,为未来不断加码。

从学界赋能产业,却又不止于产业,或许这就是科学家与科技企业,能够形成的最好的化学反应。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-05-25
中国AI的底牌与前路:王海峰团队十篇论文入选ACL的价值释读
其实现在像王海峰和百度这样科学家与科技企业的组合并不少见,我们或许可以尝试从王海峰个人身上,寻找科学家与科技企业共同产生化学反应所需要的特质,看看AI自主创新是如何在这种化学反应下生长的。

长按扫码 阅读全文