「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分。通过对 AI 生态顶级大咖、创业者、行业 KOL 的访谈,反映其对于行业的思考、未来趋势的判断、技术的实践,以及成长的经历。
本文为 「AI 技术生态论」系列访谈的第十四期,解剖深耕大数据和人工智能基础软件应用领域的星环科技,洞悉大数据+人工智能的产业生态。
随着数据信息“爆炸”时代的来临,大数据技术解决海量数据“怎么存”的问题后,人们开始思考数据“怎么用”的问题,如何让数据产生更大的价值更好地服务人们的生活?
AI,是让数据产生价值的关键技术。但人工智能落地的趋势,是算法、数据和算力的紧密结合。如何能有效地结合这三方面的技术打造适合的AI落地产品?
深耕大数据和人工智能领域的星环信息科技(上海)有限公司(下文简称“星环科技”),通过打造易用高效的一站式人工智能平台——Sophon AI来解决上述三方面问题,从而加速人工智能的落地。
Sophon AI平台是如何助力企业在AI时代业务创新与变更?对此,在本期「AI技术生态论」栏目中,CSDN(ID:CSDNnews)专访AI产品首席产品官,杨一帆,来一探究竟。
大数据+AI的强强联合
目前星环科技Sophon大团队由近百位工程师组成,有条不紊地进行数据挖掘、传统机器学习、计算机视觉、自然语言处理、知识图谱等领域的研究、产品研发以及实施落地。目前星环科技应用已覆盖涉及到金融、安防、电力、交通、教育等数十个行业和领域。
谈及星环科技为何会打造这样一款一站式的人工智能平台时,杨一帆表示,这是实现星环科技使命“把自主研发的领先创新技术赋能全世界各行各业,促进社会可持续发展,通过科技让人类的生活更美好”的必由之路。星环科技大数据平台有多年丰富的项目经验和高强的技术支撑,而大数据向人工智能产品线的延申,是星环科技将前沿技术赋能更多行业的必然走向。
Sophon AI平台提供算法、数据和算力三者的解决方案:
星环科技人工智能平台Sophon架构图
1、平台提供交互式和代码编程环境,普通用户和高阶开发者都能用自己擅长的方式参与开发,集成超过两百种高性能分布式算法,并可扩展,此为“算法”层面的保证;
2、平台支持星环科技的大数据平台、开源大数据平台和传统关系型数据库等数据来源,还支持包括流数据、对象存储在内的多种数据格式,此为“数据”层面的保证;
3、采用分布式架构,支持高可用,运维和扩容便捷,能提供强大的算力支撑,此为“算力”层面的保证。
打造一站式AI平台的挑战
Sophon AI拥有视频分析、知识图谱、边缘模块、云端等模块,涵盖IoT、AI、大数据等技术,在打造这样一站式的人工智能平台时,杨一帆坦言,在这其中,技术团队面临不少挑战,其中最大的挑战应为企业级的人工智能平台需要提供完整的生态链以及丰富的应用。
因为基础平台属于“硬功夫”,平台本身的功能、性能需要极其扎实;上层应用属于“软功夫”,讲究针对具体行业形成针对性的开发,对特定企业用户形成耦合效应。应用的开发需要团队做快速的反应支撑。这里的“硬功夫”和“软功夫”都需要技术团队做出精准的判断。
技术团队在探索的过程中,对于平台,团队在几年前就选择了微服务化路线,并针对数据采集、模型训练、应用部署采用不同的服务框架,对场景做了先进的适配。针对业务落地场景选择贴合实际的选型,如考虑到具体客户的成本、资源,以及人工智能模型精度的协调和权衡,在平台层面做出一定支撑,并沉淀出一套可行的方法论,并在实际业务中发挥了极大作用。
偷偷倾倒污水?AI来“捉人”!
在CSDN 《2019-2020 中国开发者调查报告》中,64%的企业尚未实现智能化(其中14%的企业无信息化)。对此,Sophon AI不断通过技术来助力企业业务智能化、变更迭代:
杨一帆举了个南方某市的水务系统的例子:经常有人违规往下水道倒入油水、泔水,污染城市水务。但众所周知,下水道系统的管理信息化程度较低,只能靠人力制止小部分违规倾倒的个人,效率十分低下。
星环科技的AI团队对“违规倾倒污水”这一行为进行了视频采样,针对性地训练出计算机视觉识别模型,取得令人满意的准确率。
“违规倾倒污水”是一种抽象描述,问题的解决首先需要细致的场景分析和量化表示;其次,由于水务系统对AI的投入经费有限,不可能无限扩充服务器资源或扩充监控设备带宽。
违规倾倒污水预警系统后台
技术团队基于AI分析,成功量化这一行为并指标化;同时选择了轻量化的边缘计算设备,仅需部署经济、小巧的边缘计算盒子,即可识别偷倒行为。该系统可以在边缘端识别可疑行为,截取证据图片,记录详细的时间、地点等信息并向云端发送告警。此外,通过云边一体的平台,工作人员足不出户便可完成现场模型的增删改,无需投入额外成本。
大数据 3.0 “ABC”公式
星环科技有个大数据3.0发展的“ABC”公式很有趣:A(人工智能)+B(大数据)+C(云计算)=大数据3.0。
对此,杨一帆解释道,2018年,星环科技首次提出大数据3.0的概念。因为他们相信从技术趋势的维度看,大数据、云计算和人工智能将走向深度融合,容器编排系统、大数据分析和深度学习能够融合在一起,大数据从技术上将迈入3.0阶段。并且在3.0阶段,大数据技术基本上普及化,可以随手获得,绝大部分的人都能够非常便捷地获取大数据分析能力。
大数据3.0时代具备五大特征:
1、融合的数据平台,从数据湖,到数据仓库、数据集市,都不再需要混合架构,由此解决了兼容性差、运维难度高、数据安全无法保障等问题。
2、融合的大数据分析生产力工具(如SQL、R、Python等工具语言,或如Sophon Base所见即所得的托拉拽式建模平台),即可以进行大部分场景的大数据分析,开发成本大幅度降低。
3、BI与AI进行融合。
4、AI进行数据分析需要借助BI的可视化功能,BI也在嵌入AI特征,进行智能分析。
5、大数据、人工智能、云计算的深度融合。应用、数据、服务相互促进,并融合成为生态。
星环科技的技术和产品战略也正是顺从大数据3.0阶段的这些特征,与技术的深度融合:星环科技Transwarp Data Hub(TDH)数据平台,可以处理从GB到PB的应用场景。
5G时代,加速数据+算法+算力三者合一
2019年,5G正式步入商用时代。杨一帆表示,随着5G的发展,数据+算法+算力三者合一的理念会被更充分地放大。数据采集的智能化(计算前置)、海量异构数据的存储(大数据)、跨域计算等话题都将成为热点。
“5G将催生出物联网行业真正的爆发,边缘端设备在有用5G通信能力后迎来极大的发展,云边一体的需求将呈现爆发式增长。”杨一帆说。类似于Sophon Edge云边一体平台将赋能更多的应用落地。
此外,由于各种类型设备的接入,数据采集的多源化问题将突增,异构数据间的知识网络建立会成为一个通用的需求,知识图谱类应用会有很大的想象空间,对此,Sophon KG也做了提前的布局。
下一步
2019年5月,星环科技推出“全链路AI”战略,截止目前,人工智能平台Sophon用户已达到数百家,覆盖数十个行业和领域,其中在银行、券商、交通等领域获得较好反馈。在教育领域,星环科技与北大、南大等高等院校形成合作,依托Sophon平台进行人工智能课程教学,并开设了多个联合实验室。Sophon在去年布局国外市场,与新加坡国立大学、新加坡理工学院、AI Singapore等机构有不同形式的合作。
未来星环科技将积极探索新型市场,发力认知领域、联邦计算等领域,打造杀手级应用。如在认知领域包含了对自然语言处理和认知图谱领域、语义化的图像识别(如行为识别)以及(深度)图神经网络的各种产品化工作;而联邦计算则用于解决隐私计算、跨域计算、数据孤岛等问题。
在生态方面,星环科技是业界首个使用容器编排技术实现大数据和AI服务弹性化的公司,这使得星环科技的平台产品借助容器技术可以无缝链接私有云、混合云和和边缘计算,为三者提供统一的计算平台,全面实现AI、云和大数据的融合,产品线涵盖ABC,在技术生态上有良好的支撑。AI的应用需要从数据收集、流传、存处理等多个环节的配合,每个环节的数据质量都影响着最终的应用,这个链条上涉及到如传感器、摄像头等众多的领域的伙伴,星环科技和合作伙伴一起,未来将会加强技术生态建设,同时培育更多熟悉Sophon开发的人工智能工程师。
“人工智能是生产力的创造者和社会基础供应者”
在今年疫情爆发之际,AI+大数据技术成为抗疫中重要的一员,出现如AI测温等实用落地应用。星环科技也参与了钟南山院士团队的疫情预测工作,基于AI+大数据的判断,钟院士对国内的疫情发展做出了较为准确的推演,实际生活中的封城、停工、隔离等各项政策,确保了大家较好地控制住了疫情。
杨一帆表示,AI+大数据在理解了业务的前提下,会产生极大的经济价值,甚至是关乎生命的价值。这次疫情,让大家看到,好的平台和产品加上充分的业务理解会产生无限的价值,深入到业务中才能把技术的价值最大化,相信未来,AI+大数据的技术将会进一步和业务融合,在更多的行业和场景下产生价值。
在未来3-5年,他会有更多领域AI和大数据的应用会迎来爆发期,比如金融领域、工业领域、管理领域等,如解决数据孤岛和多源数据融合问题的知识图谱和跨域/隐私计算;比如解决工业和实际生产环境的企业级云边一体方案;解决海量数据和算力不够的矛盾;解决建模难于快速打通业务最后一公里的完整企业级应用生态,都是可以大有作为的方向,都是非常大的机遇。
最后,他总结道:“从国家战略高度上人工智能日渐被重视,且被列入新基建7大产业之一,人工智能的需求将会全面铺开,从专业领域应用的单一项目变成了基础性赋能,人工智能已经变成了生产力的创造者和社会基础供应者,成为社会供给侧的基础平台,赋能社会的方方面面,人工智能也会帮助更多的领域完成新基建的建设。”
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。