AI人才“养成记”:大学生用百度飞桨接稳质检接力棒

十八世纪初,上海,为抵制外国香烟的霸道出口,三星纸烟有限公司成立。这是中国第一家烟草公司,“清末美女牌九”,一套单色32片,封面上没有一句外语。

很快,全国大大小小的烟草公司如雨后春笋般涌现,北方的北洋烟草公司,南方的广东南洋烟草公司……光上海就近四百多家。

大国,人口众多,对烟草的需求自然不低。细观近十年来,我国每年生产卷烟均超过2.3万亿支,2017、2018两年,烟草行业税收均突破万亿,是国民财政总税收的大部头。

称少不了坨,卷烟滤棒于卷烟成型的重要性亦是如此。卷烟产量及销量的提升加剧了对滤棒产量的需求以及对滤棒生产工艺提高的需求,因此,作为关键的原材料,滤棒质量检测成为了卷烟生产线上十分重要的环节。

然而事实是,卷烟滤棒的生产问题重重。首先,72%的工厂仍停留在人工检测阶段,成本高,速度慢,视觉检测方法精度自然也不高,以至于远达不到生产要求。其次,现有方法仅能进行正次品检测,各类次品量仍需要人工去统计,耗时费力,更别说成本多大了。

(图:人工视觉检测滤棒)

1.接力棒

早前,湖南大学机器人视觉感知与控制技术国家工程实验室与长沙海贝智能科技有限公司就有针对滤棒质量检测的校企合作项目,但项目第一代使用的仍是传统视觉检测方法。随着国家烟草专卖局提出建立数字化、智能化、精益化的现代工厂的要求,生产方也发现了第一代项目存在着的弊端和局限,方向变得清晰——质量检测走向“智能化”势在必行。

湖南大学大学生张屹峰和他的年轻团队接过了这一棒。

大家都在埋头准备毕业论文,为秋招奔波之时,张屹峰和杨婷婷两人的忙碌还停留在实验室里——5月参加“中国高校计算机大赛人工智能创意赛”以来,他们就没闲下来过。2019“中国高校计算机大赛人工智能创意赛” (简称:C4-AI大赛)由教育部三大教指委、全国高等学校计算机教育研究会主办,百度公司、浙江大学、德清县人民政府联合承办,通过“AI+X”开放式命题,鼓励学生跨界思维,去发现AI在各个行业、领域的应用场景,用创意开发去解决实际问题。这一竞赛方式也与张屹峰团队的想法不谋而合,他们不仅期望通过这次比赛在知识上有所收获,结识些志同道合朋友,更重要的是对行业做些力所能及的改变。

(图:张屹峰和杨婷婷同学)

因为同在一届,又同属一位导师门下,张屹峰和杨婷婷平时的研究课题以及工程项目都一起完成,可以说是老搭档了,加上平日里就带着他们做项目的博士学长冯明涛,“湖大机器视觉”团队组建完毕。

作为队长,张屹峰在团队中负责整个项目框架的设计以及核心算法的实现,安排项目中各项工作;队员杨婷婷负责软件的开发和测试,冯明涛主要负责给出一些深度学习算法上的建议。遇到硬件的选取装配以及在生产线测试,他们则一起行动。

几个年轻人立志打破对卷烟滤棒的传统视觉检测方法:“我们想通过使用‘人工智能’算法来进行改造升级。”

根据参赛者自身兴趣及技术基础能力差异,C4-AI大赛将队伍分为赋能组与创新组两个组别,分别提供EasyDL 定制化训练服务平台及飞桨开源深度学习平台。湖大机器视觉团队选用了EasyDL去建立空管滤棒端面智能化检测系统,将缺陷检测任务转换成多分类任务,并采用EasyDL定制化训练出高精度、速度快的分类网络模型。

(图:湖南大学“基于EasyDL的空管滤棒端面智能化检测系统”项目)

“首先是因为赋能组和创新组的侧重不同,赋能组注重项目的落地应用,而创新组注重算法的创新。我们这个项目已经在落地测试,更适合参加赋能组的比赛。并且EasyDL只需要数据集即可开始训练,更适合应用到追求算法简单、高效开发的工业生产中。”

EasyDL是基于百度飞桨的定制化AI训练和服务平台,面向各行业有定制AI需求的企业及开发者,提供从数据管理与标注、模型训练、服务部署的一站式AI开发全流程支持,它能让零算法基础的用户,也可以基于自身业务需求和数据,快速训练专属的定制化AI模型。而这正是湖大机器视觉团队所需要的。

2.AI解燃眉之急

“把不同种滤棒集成在一个模型里面更加智能化,更方便用户使用。不然模型分开选择的话,有点不‘人工智能’。”

“不同种类滤棒集成在一个模型有点不现实,这样的模型准确率会降低很多,还有处理速度也会慢很多,我们的项目是要投入生产线使用的,要先考虑实用性、可行性,再考虑功能的优化。”

“为什么模型准确率一定会降低,速度会变慢,我不信。你都没做,怎么说一定不行?”

“效果肯定会变差很多,我拿两种不同滤棒的数据集整合在一起训练,然后测试模型我们一起看吧。”

在项目的设计阶段,这样的对话是团队的日常。好在尽管有分歧有争论,但总能有意想不到的发现。

最难的问题还是与数据集相关。模型训练初期准确率很低,只有70%左右,离生产方的要求还有一定距离。“数据集不是由同一人标注的,因此标准不一样,而且我们的数据集量只有三千多,模型的泛化能力也就一般。”他们花了一周时间反复确定三千多张样本的标注,将数据集量扩充到了一万两千多张,之后训练出来的模型准确率提高了十几个点,为后续标注新的滤棒数据集打下了良好基础。

(图:空管滤棒端面缺陷种类示例)

南方夏日的酷暑一点儿不留情,而三位同学必须奔波于实验室和滤棒生产工厂之间考察。

张屹峰和杨婷婷都是湖南常德人,为了完善项目,他们常常需要辗转交通、四处奔波。测试期间,他们利用暑假时间“驻守”在江苏南通的滤棒厂。两人每天7点左右起床从酒店出发,8点之前到工厂,一待就是一整天,这样的节奏持续了有一个多月。“生产车间是没有凳子的,如果想要坐下来休息,只能在地上垫个东西将就将就。”加上有些老旧的滤棒成型机噪音不小,有时听身边人说话都费劲,需要戴耳塞保护耳朵。

还有一个关键问题——工厂的工控机不能联网。所幸的是,EasyDL支持用离线SDK来部署模型功能在生产设备终端。

可这还没完。在实验室测试的时候他们就已经将EasyDL提供的两个按设备激活的序列号使用了,因此,在工厂测试时就没有新的授权序列号可用。

万般焦急下,他们试着向EasyDL控制台提交了申请额外序列号的工单,本以为结果遥遥无期,谁想当天就收到了电话回复。“EasyDL方确认用途之后马上就给我们提供了新的序列号。”湖大机器视觉团队的一大隐患解决了,“为百度工作人员的效率点赞!”

3.智能化的光

得知生产线上测试的功能和性能指标都通过,并能够投入生产线使用的当晚,张屹峰和伙伴们去吃了顿海底捞。“还是不打折的那种!”终于可以松口气了,这是他们最有成就感的时刻。

卷烟生产工厂需要滤棒生产工厂提供的每箱滤棒的正次品率至少要94%以上,而空管滤棒端面智能化检测系统实现了无需人工干预的高质量生产,相对于传统视觉检测算法,检测速度提高了30%,正次品准确率由94%左右提高到了最高98%。

“一是提高了缺陷检测的速度和准确率,二是我们实现了在线的次品多分类,避免了大量生产原材料的浪费。”这是一次巨大的飞跃。

如今,他们的项目收获专利5篇,软件著作6篇,并且在全国各地与多个滤棒生产公司有合作,拥有滤棒检测、胶线检测、段长检测、爆珠检测等落地项目。本次比赛的系统也已经在湖南、江苏等滤棒生产公司的一线生产线上开始测试。

回溯整个项目过程,张屹峰不讳言,选择EasyDL平台确实给他们省了不少心力。“我们项目本身就要写软件以及建立数据库,还要装配硬件,EasyDL帮我们进行了模型训练的代码编写及实验结果分析。另外EasyDL的AutoDL技术自动搜索适合训练数据的网络结构,也为我们省去了选取网络的工作,并且EasyDL训练出的模型准确率极高。再者EasyDL支持使用C#调用模型,我们可以在编写软件的时候直接调用训练好的网络模型,十分方便。”

这次团队使用的是EasyDL经典版优化模型,他们表示今后会再继续学习和使用提供网络模型选择、超参数修改等功能的EasyDL专业版。“因为我们研究方向是计算机视觉及机器视觉,后续需要用到人工智能(深度学习、机器学习)的时候很多。”

通过C4-AI大赛初露头角的湖大机器视觉团队只是百度AI赋能社会的其中一份子,越来越多的热血少年们将百度AI技术能力应用于各行各业。百度提供了飞桨深度学习平台及其EasyDL定制化训练服务平台进行创意性开发,降低了AI技术门槛,让选手更高效、更灵活地实现深度学习应用。

比如,中南大学的“AI知肤宝”项目,基于临床图像和病史数据,构建了皮肤疾病全病种分类系统,通过小程序提供在线服务,解决了医疗资源不平均、看病难等问题;大连理工大学的作品 “指舞”,创新性地将现有的触摸识别人机交互方式,拓展到跟踪手指在桌子上滑动产生的声音信号并进行识别,大大提高了智能家居的操控范围......除此之外,学生们的作品还涉及了新零售、智慧农业、智能游戏、环境保护、特助公益、公共安全等多个领域,更具生活气息。

(图:2019“中国高校计算机大赛人工智能创意赛”选手现场演示各种“硬核”设备)

据了解,目前EasyDL平台已应用于近30个行业,包括零售、安防、互联网内容审核、医疗、法律、会计、餐饮、购物等等。可见,EasyDL正在为各个行业的智能化升级不断添加助力。

AI工业大生产已经来临,适用且易用的深度学习平台对于需求与行业背景各异的企业和开发者而言,意味着可以事半功倍地实现AI技术应用落地,实现降本增效。百度飞桨作为中国首个也是目前国内唯一开源开放、功能完备的产业级深度学习平台,已经累计服务150多万开发者,定制化训练平台上企业用户超过6.5万,发布了16.9万个模型,而百度飞桨的定制化训练和服务平台 EasyDL,则全方位满足了不同行业、不同应用场景、不同 AI 算法基础的企业和开发者的业务需求。

除了技术利器,AI人才在人工智能变革中无疑是至关重要的。而国内AI人才的供求比例为1:10,缺口超过500万,AI高端人才供不应求。在百度看来,AI人才应该是始终立足于产业智能化转型中的现实需求,坚持理论与实践相结合的人才培养模式,致力于培养出能够从理论出发指导实践,又能从实践中反哺理论的AI人才。

百度通过与科技部、教育部等政府指导部门,高校、研究所等学界,以及行业龙头企业等产业界展开合作,产学研用一体化构建资源体系和协同育人合作生态。百度推动发布国内AI领域第一个专业技术人才培养标准,为AI人才培养厘定标准,并发布了两大企业级认证标准,助力企业AI人才的培养。基于人才培养标准,百度设立云智学院,促进ABC领域的产教融合,建设课程体系、实训室及人才培养基地,推出面向高校一线教师的深度学习师资培训,面向不同层级的企业从业人员分别推出零基础深度学习集训营、PaddleCamp未来深度学习工程师集训营、AI快车道-企业深度学习实战营、黄埔学院-首席AI架构师培养计划等举措,为企业从业人员提供更专业的学习平台,帮助企业培养AI技术人才,从而整体推进AI人才的培养。同时,举办包括C4-AI大赛在内的各类AI竞赛,以赛促学。

如今,百度已经培养了全国300余所高校、超过1000名一线AI专业教师,累计赋能超1000家企业开发者,走出上百位首席AI架构师。仅2019年,百度举办超过30场AI赛事,150+场线下活动,覆盖超过1亿人次产业链人群。

一支支“百度AI生力军”正在诞生。

【完】

智能相对论(id:aixdlun)

•AI新媒体;

•今日头条青云计划获奖者TOP10;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能驾驶、AI+医疗、机器人、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2020-01-04
AI人才“养成记”:大学生用百度飞桨接稳质检接力棒
这一竞赛方式也与张屹峰团队的想法不谋而合,他们不仅期望通过这次比赛在知识上有所收获,结识些志同道合朋友,更重要的是对行业做些力所能及的改变。

长按扫码 阅读全文