不信不可能:飞桨,划一个时代的初心

原标题:不信不可能:飞桨,划一个时代的初心

AI在哪里?

大部分人可能会想到科幻电影,或者异常先进的实验室。但是河北工业大学教授刘晶却认为AI就在一间间工厂车间里。学习了六年深度学习,花两个月时间跑了一百多家钢铁厂,最终,她把在钢铁熔炼复杂的配料过程中,老师傅们练就的三十年经验,变成了三秒就能给出最优配比的AI模型。

这个模型,每年可以为钢铁企业节省10%的原材料,把配料计算时间节省了90%。而她能做到这一切、把不可能化成可能的基础,是应用了百度的飞桨平台。

这一秒钟,千千万万个这样的故事,正同时上演在中国广袤的大地上。AI不在别处,AI就在这里,在我们的农田、工厂、矿山、办公室,在万家灯火渺渺炊烟中。

AI从天边来到千行万业去,从不可能变成可能,就是一段完整的关于飞桨的故事。

(百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰)

11月5日,“WAVE SUMMIT+”2019深度学习开发者秋季峰会在北京召开,AI开发者再熟悉不过的、被称为AI时代操作系统和百度AI底座的飞桨,又一次迎来了大规模技术升级。

毕竟还有不到两个月2019就要结束,在关注飞桨狂飙突进的速度之外,此时或许有必要回望一下关于飞桨走过的路,未来的方向,以及不变的初心。

在这些故事、逻辑和蕴藏的情感里,我们可以真实地读懂百度AI,读懂深度学习开发者,读懂中国智能时代的黎明。

盛宴:百度AI的彪悍速度

也许我们的读者都还记得,今年4月,百度曾主办了首场深度学习开发者峰会。当时很多读者给我们留言,表示飞桨升级的技术实在太多了,只是读完都感觉脑子有点跟不上。也有读者说,别人家都是一场发布会说一两个技术,百度是一场发布会说一打技术。

到了秋天,我们发现百度显然决定在彪悍之路上一条道走到黑。这次的深度学习开发者峰会上,飞桨一口气发布和重要升级21个产品方向。没错,一打已经不够用了。

峰会现场,不少媒体同行和开发者表示,技术实在太多,边听边记都跟不上速度——而百度居然就生猛地把它们一个个做出来了。

会上,百度深度学习技术平台部总监马艳军博士,介绍了飞桨产业级深度学习开源开放平台全景图,详解了飞桨全新发布的21个产品方向。

其中,十分引入瞩目的是,飞桨全新发布了4大面向应用任务的产业级端到端开发套件。包括NLP领域的ERNIE语义理解,CV方向的PaddleDetection目标检测和PaddleSeg图像分割,推荐方向的ElasticCTR点击率预估,在关键产业应用中,满足低成本和快速集成需求。

而全新发布的端侧推理引擎Paddle Lite 2.0版本,则进一步提升了飞桨在硬件端的易用性和兼容性,具有超高 INT8 量化性能。

此外,飞桨还全新发布了3项深度学习技术工具组件:联邦学习PaddleFL、图神经网络PGL和多任务学习PALM,从而将最先进的技术带到产业实践中。

EasyDL则发布了为算法工程师提供一站式解决方案的EasyDL专业版、PaddleHub 也全新升级,支持迁移学习与飞桨Master模式。

飞桨Master,也是本次峰会的一大亮点。这一模式把算力、数据、算法集成为产业级预训练模型。与大量迁移学习工具平台配合,构成了产业底座,为产业AI开发者奠定了全面基础支撑。

此外,飞桨还进行了动态图全新升级、新增大量算子库、优化API 接口,技术文档更加完善;分布式GPU训练相比其他主流框架实现了20%-100%的速度提升,分布式CPU训练最大吞吐量达到行业6倍以上;官方模型从60+增加到了100+,提供预训练模型超过200个;并且此次新开源了4个国际竞赛冠军模型;同时重磅推出了大量资源、课程、奖励赋能的飞桨生态激励计划。

对于AI开发者来说,盛宴,当如是也。

初心:飞桨的来处与去处

在飞桨令人眼花缭乱的升级,保持超高速进化的背后,或许每个人都会想问这样一个问题:到底是什么支撑了飞桨的奔跑?他们会一直这样跑下去吗?

毕竟这一年里,欧美主流深度学习框架的更新频率并不高,而欧美大型科技公司对AI开发的技术升级也多次被批评过于缓慢。

当降速的欧美AI,碰上了飞速奔跑的中国AI与飞桨,我们当然会兴奋,也自然会充满疑问。百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜,对这个问题的回答是,飞桨的升级动力来自百度AI团队与产业开发者的高效频繁沟通。

今天的飞桨,已经深深扎根于产业环境和开发生态当中。来自各个产业的AI需求、挑战和瓶颈会随时反馈给飞桨,开发者遇到的问题与挑战会随时与百度沟通。在这个开放和高效运转的空间里,百度的AI科学家们与产业开发者形成了一个整体。开发者需要什么,飞桨就去做什么;产业智能化遇到了哪些无法克服的问题,百度就去调兵遣将解决它。

这样的模式,是封闭在小环境中的互联网公司所无法完成的,飞桨的奔跑,来自百度对技术的探索和追寻,同时也来自开发者和产业的真实声音循环反馈。对此,我们的感触也十分清晰,记得今年上半年在百度黄埔学院第一期毕业礼上,我们与开发者讨论飞桨还有哪些问题。如今半年过去,这些问题真的已经被一个个升级所击破。

其实不管是大规模分布式训练、全硬件平台支持、工业级模型库,还是几大领先世界的AI操作系统特性,飞桨的背后,是对一个简单目标的极致化:让AI开发具备更高性能、更低门槛。

这是飞桨的初心,而围绕这个初心的穷思竭虑,变成了飞桨的升级速度和产业广度。

围绕开发易用性和开发性能升级,本次飞桨大规模升级里,有两个关键点可以作为很好的解读点。

一个是Master模式的诞生。所谓Master模式,从逻辑上看就是飞桨基于大量产业实践,总结出产业AI开发者到底需要哪些数据、算法和算力。然后飞桨将其最大公约数变成预训练模型。而对于企业来说,只要在此基础上进行小规模的数据标注,就可以省去复杂模型的研发成本,以及庞大冗长的训练流程,快速把AI能力结合到场景应用。

这是一个高强度面向产业实际应用的模式。它是百度AI技术的高度集成和沉淀,同时也来自飞桨对产业真实应用具体而微的理解,必须保证预训练模型与产业最大效率接轨。百度一位专家,把Master模式比作饭馆做菜时候的那锅老汤——产业应用者只需要享受一勺下去味美绝伦,而不用等待漫长而复杂的熬制过程。

再一个就是上面所说,飞桨端到端开发套件的发布。今天的情况是,众多产业开发者并不具备深厚的AI功底,但需要迫切能解决问题的AI能力。端到端开发套件,就可以让一个只有基础编程能力的技术人员,利用套件工具来解决具备主流应用性的AI问题。比如语义理解是智能语音相关AI问题的核心;视觉分割和图像检测是机器视觉能力最大的应用需求;CTR推荐具备从互联网到实体经济极其广泛的应用覆盖度。飞桨把这些套件提前做好,就可以把相应问题的AI开发门槛降到最低程度,产业可以无缝进入AI时代。

这些技术与产业智慧的碰撞结果,是将飞桨打造成了源于产业实践,与产业共进的深度学习开源开放平台。而未来,飞桨还会继续进化,毕竟核心框架的进化还在进行时、开发者的需求还有无穷无尽、中国产业智能化的大门刚刚开启。

(百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜)

吴甜认为,未来飞桨还会持续发展超大规模分布式计算、异构计算能力,定位于全硬件平台支持、端云边结合。深度学习平台还要继续向前,推进核心框架持续向完美发展;而飞桨的四大领先特性也会持续前进,坚持面向产业级应用,挖掘中国全产业拥抱AI的可能。

飞桨的去处,归根结底是百度AI科学家们看到了这样一个机会:中国拥有最广泛全面的产业链,而飞桨则提供了当今最快的AI基础设施进化速度。

广和快的碰撞,往往是奇迹的原点。

承担:智能时代的中国情怀

很多西方学者都提出过这样一个观点:中国的现代化进程,尤其是近年的经济腾飞,堪称集体主义在人类文明史中完成的奇迹。

中国人的经济智慧,是调集力量克服困难,哪怕承担一部分牺牲,也要把基础做好,把起点做扎实。然后在此基础上建设产业、发展生态,让智慧的中国人有舞台腾飞。从互联网、通讯、高铁、城建莫不如此,这也是中国之所以被称作“基建狂魔”的原因。

AI时代,人类正在悄然抵达第四次工业革命的起点。而过往的三次工业革命,东方更多时候都是看客。这次,中国AI和产业智能化显然不想再旁观和等待了。

那么谁来担当中国AI时代的“基建狂魔”呢?

自2016年正式开源以来,飞桨是中国首个也是目前国内唯一全面开源开放、技术领先、功能完备的产业级深度学习平台。它的功能与特性,已经可以支持超大规模的工业级AI开发,为产业AI担当工业大生产底座。

所以中国人的视野和情怀中,百度与飞桨责无旁贷。

事实上,在经济放缓和行业资金链下行的大背景下,百度发展飞桨是很容易理解的。但如此超高速发展,屡次完成令世界惊讶的升级,确实是逆势而行、万人亦往的。飞桨升级不仅意味着巨大的投资,同时也意味着庞大的顶级人才投入,以及大量与产业开发者的交流沟通工作、巨大的教育和人才培育投入。

但是路总要有人修、石油总要有人找,产业AI基座总要有人去建。百度在此刻,承担了一个令万千开发者、令无声的中国产业生态非常欣慰和骄傲的角色。

乌镇互联网大会上,百度CEO李彦宏首次提出了智能经济。智能经济不会招手而来,它跟石油经济、电力经济一样,要从钻井、电站做起。于是百度的选择是,拿起飞桨,就去划开一个时代好了。

百度CTO王海峰判断,具备了标准化、自动化和模块化的基本特征,正在让深度学习推动AI进入工业化大生产阶段。这个阶段里,百度的AI技术以及对AI开发的理解,沉淀为飞桨这个技术底座。让飞桨变成上接应用、下接芯片指令集的AI操作系统。

这种产业模式,事实上已经发展出了中国AI独有的产业生态原点。谷歌Tensorflow代表的主流欧美框架,并没有集成开发者大量对工具、套件、预训练模型、定制化服务的产业需求,也缺少工业级AI训练开发的支撑特征,以及与产业互动的高强度方案。

这些是飞桨的独创,也是中国AI悄然发展出的一步优势。中国的各行各业,全产业链都可能从中受益。

深度学习和飞桨,正在成为与中国未来鱼水相融的时代之路。

如钢铁,如秋实,如梦幻:飞桨的一年

写到这里,突然有种一梦忽醒的感觉。几年来,我们都在跟踪报道飞桨的快速进化。尤其在今年,飞桨可以说真正冲破了产业级的壁垒,极大程度打开了AI与现实世界的融合。

虽然飞桨是一个个技术与工具构成的,但却很容易从它和它背后的百度人那里,感觉到飞桨的温度、执念和情感。

采访中,我问吴甜和马艳军两位博士,对飞桨一年来变化最大的感受是什么。

吴甜提到了车间。飞桨这座车间里,以前是一些简易的流水线设备,对技工的要求很高。但现在车间里做出了高级车床,谁进来都可以很快开始生产自己想要的零件。而未来,飞桨会变成充满高精尖技术,现代化的,世界最领先的AI车间。

而马艳军提到了房子。他说毛坯房也能住,精装修房屋也能住,但生活品质是不一样的。飞桨这一年就是在把这座房子进行了精装,而且是生态化、环保化的精装。并且盖着盖着房子,还盖出了很多新的东西来。而大家觉得飞桨的升级令人目眩神迷,其实都是开发者的需求——建筑师的初心,是给业主想要的。

(百度深度学习技术平台部总监马艳军)

如果说AI的逻辑是一场统计学的春华,飞桨则在这一年中让它结出了钢铁般坚硬的秋实。金融行业苛刻到恐怖的数据要求可以落地于飞桨;工业流水线上精准到毫秒的时延条件生根于飞桨;企业主渴望AI,却又难以承担的成本难题,被飞桨的技术破解开。

飞桨把现实世界的不可能常识,变成了一切皆有可能的智能幻梦。

飞桨是什么?

是深度学习开发者峰会上,一座难求的热络。

是一位位田野里、工厂里的AI开发者,他们的倔强、不甘,与最终得到无数喝彩时,眼中的泪光闪烁。

是百度科学家,深夜依旧在解答开发者问题时的疲惫和执着。

飞桨是这样一个常识:如果我们跟眼前的困难握手言和,就会跟雄伟的未来擦肩而过。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-11-06
不信不可能:飞桨,划一个时代的初心
11月5日,“WAVE SUMMIT+”2019深度学习开发者秋季峰会在北京召开,AI开发者再熟悉不过的、被称为AI时代操作系统和百度AI底座的飞桨,又一次迎来了大规模技术升级。

长按扫码 阅读全文