自然语言处理(NLP)是人工智能皇冠上的一颗明珠。
这样的说法在人工智能领域流传许久,现实中发生的却是这样一幕:计算机视觉、语音识别等领域纷纷跑出了多个独角兽,冲刺IPO的消息也时常出现。可作为“皇冠上的明珠”的NLP领域,却难见独角兽的影子,大多数创业者还停留在A轮或B轮融资。
NLP如何走出困局?
在NLP领域深耕十年,被称作“中国NLP灯塔”的百度给出了切实的答案。8月25日举行的百度大脑语言与知识技术峰会上,伴随着一系列语言与知识产品的发布与升级,百度NLP的全景布局和钻研了十几年的核心技术一一亮相。
01 翻越认知智能的高山
把时间调回一个多月前的ACL 2020。
作为NLP领域最负盛名的国际顶会,ACL 2020收到了3429 篇论文投稿,其中被接收的779篇论文中有185 篇来自中国大陆,占比仅次于美国。距离2010年首次有中国科技企业的论文入选ACL,仅仅过去了10年时间。
除了论文数量的逐年增长,中国NLP学者的面孔也陆续在ACL上出现。
2013年,百度CTO王海峰成为ACL历史上首位华人主席;2014 年,同样来自百度的吴华出任 ACL 程序委员会主席;2015年,哈工大教育部语言语音重点实验室主任李生教授获得 ACL 终身成就奖;2016 年,百度的赵世奇当选 ACL 秘书长;2018年,ACL 宣布创建亚太区域分会,王海峰担任创始主席;2020 年,百度组织了 ACL 大会上首场同声传译研讨会……
以百度为代表的中国力量在NLP的世界舞台上不断出彩,本身就是一种话语权的象征,而左右话语权的核心因素正是学术成就。
仅以百度为例,过去十年是百度NLP高速增长的十年,在NLP领域摘得了包括国家科技进步奖在内的20多个奖项,在30多项国际竞赛中夺得冠军,累计发表的学术论文超过300篇,专利申请高达2000多项。
其中最具代表性的无疑就是百度的语义理解技术与平台文心(ERNIE)。
2019年12月,基于ERNIE 2.0改进的模型在权威榜单GLUE上首次突破90大关,超越人类基线3个点,获得全球第一;3个月后的人工智能顶级会议AAAI 2020上,NLP预训练领域入选论文《ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding》被选为Oral展示;2020年的世界人工智能大会上,ERNIE有了中文名字“文心”,并一举斩获最高奖项SAIL奖(Super AI Leader,卓越人工智能引领者)。
学术上的一系列成就,意味着百度已经站在了NLP研究的最前沿,成为中国NLP领域的领军者,并与谷歌、微软一道被视为“全球AI三巨头”。
可对于百度来说,技术的价值绝不只是在象牙塔中“高光”,在NLP的学术领域走进殿堂的同时,也在循序推进应用场景中的落地。
刚刚结束的百度大脑语言与知识技术峰会上,第一个重磅产品就是在NLP核心技术基础上延展开发的文心ERNIE——语义理解技术与平台,针对传统NLP定制常见的成本高、耗时长、可迭代性差等短板,文心集成了优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台化服务,提供了一站式NLP开发与服务。
这或许就是百度给出的答案,想要推动NLP的产业应用,仅仅在学术上站在山巅还不够,需要的是帮助整个行业翻越认知智能的高山,以低门槛、低成本、高效率的平台优势加速NLP的落地。
正如百度CTO王海峰所言,百度“致力于更好的与学术界、产业界携手,推动语言与知识技术发展,进而推动人工智能技术持续进步,为产业持续升级、社会经济高质量发展贡献力量。”
123下一页>(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )