跟随 MindSpore ,一起迈入 AI 时代

“未来十年是 AI 的黄金十年”,业已成为各界共识。无论是硅谷巨头还是国内的华为、腾讯、阿里,都把 AI 视作开启下一个时代的钥匙。

作为最为核心的 AI 技术之一,深度学习成为各企业进军 AI 领域的突破口。 在经历了Caffe、Theano代表的浅层框架时代以及Tensorflow、PyTorch代表的通用框架时代,深度学习框架的发展,迎来了以 MindSpore 为代表的全场景 AI 计算框架的新时代。

MindSpore 是华为推出的深度学习框架,具备统一的模型训练、推理和导出等接口,支持端、边、云等不同场景下的灵活部署。自2020 年 3 月正式开源以来,MindSpore 已经培育了一个十分活跃的技术社区,软件总下载量超130万,Star 数量超1.6万,PR数超5.16万。

风口之上,如何将 AI 技术落地,才是关键。AI 落地,就是要摆脱概念化,就必须找到合适的场景。2021 年 9 月起,MindSpore 社区开展了“MindSpore 开源活动”,设计了很多基于实际场景需求的任务。

比如,在做图像识别时,载入图片之后,往往需要对图片进行预处理,以保证图像符合预训练模型的需求,其中一项就是把图像数据由 (H,W,C)的矩阵转换为(C,H,W)。MindSpore 现有的转换算子,只能输入三通道数的图片,Gitee @unseenme 仅用了几天时间就实现了多通道图像输入。这很有必要。在常规图像处理以外的领域,如医学图像处理,其包含图像的通道数可能达到了1000,因为医疗图像中每一层可以看成是一个切片,整张图片包含很多的切片。

自“MindSpore 开源活动”启动以来,已经提交了数十个 PR,其中近一半已经被合并。

其中一个 PR 与脑瘤识别有关。数据集是 2800 多张脑影像图片,分为 no_tumor(无肿瘤)、glioma_tumor(胶质瘤)、meningioma_tumor(脑膜瘤)、pituitary_tumor(垂体瘤)四类训练集。由于图片数量较少,且各类脑瘤对于非专业的医学人士而言难以分辨,因此任务难度很高。不过,Gitee @liyu_sup 基于卷积神经网络以及深度残差网络,很快就建立了脑瘤识别的 baseline 模型,并且将代码贡献给了 MindSpore 社区。

事实上,随着深度学习的快速发展,越来越多的研究者都在尝试将深度学习技术引入到肿瘤检测项目中。基于人工提取特征的检测算法,不仅需要专业领域的知识 ,而且耗时费力,并且最后还不一定能提取高质量特征,而利用深度学习建立模型则完美解决了这些问题。

MindSpore 合并的 PR,大部分能够应用在实际的场景中,最大化地将个人智慧产生社会影响力,真正实现技术的落地。

在 AI 落地行业时,最大的挑战是如何降低开发门槛,并提供泛化能力,解决小样本、跨模态等关键技术。

因此,MindSpore 在不遗余力地引导更多开发者关注、学习 AI 技术。MindSpore 提供了详细的教程,包括训练、推理和端侧设备使用三部分,开发者可以根据自身情况选择不同阶段进行学习。教程设置由易到难,步步深入,从深度学习的发展历史,到MindSpore 的安装及使用,到深度学习算法、自然语言处理、图像识别等多种AI实战,再到MindSpore 的原理及创新算法均有涉及,甚至还会补充深度学习、机器学习基础知识。

千里之行,始于足下。学习最有效的方式,就是与实践相结合。这也是“MindSpore 开源活动”出现的原因。简单来说,就是开发者先学习官方视频课程,然后动手实践任务,任务完成后经由技术人员指导审核通过即可。

MindSpore 社区设置了初、中、高三个难度级别任务,包括文档资料、语法规范、技术文章、框架 bug、API 补齐、模型开发、模型迁移、论文复现、算子开发、应用案例等 10 种任务类型。对开源新手来说,可以先做一些简单的任务,比如在代码中为函数添加注释,将中文说明文档翻译成英文。

完成任务后,可获得相应积分,凭借积分可兑换价值300元-4500元的奖品,并获得开发者证书。此外,优秀开发者更有机会成为 MindSpore 开源社区 SIG 组组长,参与到 MindSpore 核心技术演进的讨论。

“MindSpore 开源活动”将 MindSpore 学习过程与 MindSpore 开源实践结合起来,一步步引导开发者进入深度学习领域,迅速扩展和锻炼技术图谱。此外,以开源的方式贡献代码,不是属于某个人的,也不是某个公司的,而是属于所有人的。

除了技术落地之外,人才稀缺也一直是 AI 技术进一步发展的掣肘。我国AI产业在短期内实现高速增长同时,人才需求面临巨大缺口,而且 AI 人才的培养明显滞后。虽然越来越多高校已经开设了深度学习、机器视觉等AI相关专业,但招生规模仍然较小,毕业生数量远远无法满足企业需求。

人工智能产业人才发展报告(2019-2020年版)》指出,人工智能领域仍然存在人才储备不足且培养机制不完善等问题,人才供需比严重不平衡,预计当前我国人工智能产业内有效人才缺口达30万。

正是看到这一点,华为早在 2018 年就宣布了沃土 AI开发者使能计划。其中,面向高校和科研机构,计划投入10亿元人民币用于AI人才培养;在开发者方面,计划三年培养100万开发者。

此次的“MindSpore 开源活动”,也是官方人才培养计划的一部分。也许,所谓的开源活动,不过是 MindSpore 抛出的一块饵,希望能吸引更多的开发者参与进来,一起开创一个 AI 时代。

加入 MindSpore 开源社区,迈向更广阔领域。欢迎开发者到Gitee官方网站MindSpore 开源社区参与活动。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )