明略科技机器学习平台的功能亮点与落地实践

近日,由国内专业咨询机构百林哲匠心打造的软件行业技术领域顶级盛会——2020 CSDI Summit中国软件研发管理行业技术峰会,成功举办。本届大会,以“上云+转型,探索未来:产业智能,部署技术新边界”为主题,吸引了来自微软、Google、阿里、华为等国内外知名科技企业的行业领袖和一线研发技术专家,共同探讨大数据和AI技术浪潮下的软件研发趋势,明略科技高级总监刘喆受邀分享机器学习平台的建设与落地实践。

据悉,明略科技的机器学习平台,基于内部数据科学家的需求而孵化,经过小版本不断迭代升级,逐渐完善整个平台的搭建,最终实现不同部门的数据科学家用统一的平台进行模型的开发、发布、使用和分享。同时,成功整合了内部的计算、存储资源,互通共享。目前,明略科技机器学习平台正服务于金融、汽车、美妆、快消等多个领域的标杆性客户。

从内部客户到外部客户,离不开对用户的需求洞察。刘喆指出,数据科学家和模型使用者,对机器学习平台诉求不同。就数据科学家而言,专注做算法产出模型是核心需求,开发环境准备以及数据接入、模型上线等工程化工作尽量平台自动化完成。而模型使用者,需要的是模型量多,多版本易切换,模型评分和推荐机制,有API服务,性能高,访问速度快。

基于此,明略科技的机器学习平台,把写代码作为系统的核心,兼容notebook方式,增强了各种定制化的功能,支持R语言、Python、Spark,甚至Spark集群。预先准备了多种开发环境,包括Torch、TensorFlow,GPU、CPU、分布式、Spark,开箱即用。针对数据清洗,数据对齐和数据标准化工作,提供了多种工具。可实现一键上线,生成SDK或者API形式。考虑到不同的行业存在不同的场景,平台还能发布Docker image,Yaml文件,把整体开发环境打包使用。自动化方面,平台专门提供调度系统HummingBird,可以每一步在notebook自己写,也可以调用外部组件,进行组合。

此外,平台提供模型生命周期的统一管理,确保模型服务的标准化,以及模型的稳定、高效、高可用性。具体而言,通过Model Market,统一管理各个渠道的模型汇总。不同部门的每个模型有多个不同版本,会告诉用户每个版本有哪些功能提升,并按标签分类,依据模型调用次数进行排名,并且用户和系统均可对模型进行评分。同时,通过自主研发的Model Serving,提供标准化模型服务,包括SDK、API形式。例如,一个100兆的模型,输入100多个维度,时延不超过5毫秒,以此为基准线,实现多实力、高可用,无断点。

在具体的实践中,国内某大型银行应用明略科技机器学习平台进行用户升等和信用卡的AI推荐。通过运用Notebook、Model Serving、统一存储、模型训练和特征分组等功能,甄别什么样的用户愿意升级成什么等级的卡别,判断什么样的用户更有意向调整信用额度,不会逾期,以及给用户每笔消费做短信提醒的贴尾推荐等,实现AI能力对业务的赋能和价值挖掘。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )