数据服务流程化对AI有多重要?今天我们从行业领先企业龙猫数据(北京安捷智合科技有限公司)的做法出发,来探索下数据服务行业的自动化、流程化对AI意味着什么。
行业现状:需求旺盛,生产力闲置
从1956年人工智能学科被正式提出,到 2016年3月,谷歌AlphaGo 4:1 战胜围棋世界冠军李世石,开启人工智能的新纪元,AI产业在经历了60多年酝酿后终于顺势而起,达到了目前的爆发期,与强劲的发展势头和旺盛的行业需求相对应的,是巨大的数据缺口。目前AI的发展主要是基于大数据、大计算模式,需要海量数据去“喂养”。人工智能应用的数据越多,获得的结果就越准确。
人工智能的发展需要大量人力提供不同基础数据,对非结构的数据进行加工,以用于机器学习。借势而起的众多公司采用互联网思维,使用网站和app采集数据,但面对巨量的数据需求、超短的任务工期和激烈的行业竞争,短时间内很难保证完成任务,于是,采集标注的外包团队应运而生,并在短短两年多的时间里呈现井喷式增长。据估计,中国全职的“数据标注者”已达到10万人,兼职人群的规模则接近100万。
纵观整个外包市场,与旺盛的需求形成鲜明对比的,是大量得不到采集、标注任务的小型团队。数据服务公司合作的外包“数据工厂”中,少则几十人,多则两三百人,在规范的机构之外,还游离着三五人到十几人规模不等的“小作坊”。在目前的采集、标注市场中,大公司为了提高产出质量,往往喜欢跟一些大型采标团队合作,只有那些实力雄厚、有足够经验的团队才能获得信任和足够的任务量。
这样的后果显而易见,在马太效应加持下,巨大的数据缺口决定了较大规模的数据工厂可以挑拣任务甚至坐地起价,不利于AI企业将更多资源配置在开发新程序、进行新探索上,而小型数据公司、采标团队因为没有足够任务量又得不到锻炼,将在数据市场举步维艰,闲置的生产力难以有合理的产出。从AI企业流出的数据需求必须经过一段“黑箱”,到达外包渠道商的途中经过了哪些操作,是否保证了效果最好、性价比最优,又有哪些风险无人知晓,行业亟需规范,标准化、流程化是唯一方案。
勇于变革:砍掉“白名单”,走出“舒适区”
作为AI数据行业的引领者——龙猫数据一直致力于为整个AI领域提供最专业的数据服务。龙猫数据成立于2014年,是一家全球领先的AI数据采集和标注服务商,专注为AI及传统企业提供安全高效的综合数据解决方案。团队汇集行业顶尖技术研发人才,借助500万注册用户,为上百家AI明星企业提供专业定制化数据服务,并与众多国际知名企业开展了长期业务合作。
在数据服务领域,龙猫数据一直是以锐意进取、不断革新的形象示人。比如他们建成国内首个超像素分割图像标注系统,使没有任何图像经验的人也能够精准快速的进行图像标注,降低了标注门槛,使单人标注效率不止提升了一倍。他们还创造性搭建出国内首个人工智能基础服务系统,可以为AI企业提供数据、算力、环境等全套AI服务方案。
而这一次,龙猫数据又有了大动作:他们决定开启渠道商流程化管理——砍掉合作渠道商白名单,对所有数据任务实行基础定价策略。
长久以来,龙猫数据因为专业、专注、负责和对数据安全、数据质量的严格把控而得到了大批客户的认可,同时也吸引了大批渠道商寻求合作,如果按照目前的模式,借助目前的资源,本可以只和熟悉的渠道商合作,“舒适安逸”的走下去,但龙猫精神要求他们永远不会停下前进的脚步。他们把用户、渠道管理自动化作为数据生产系统自动化的重要部分,借助
自主开发的定价系统,对所有上线的任务进行定价。合作商可以根据自己能力选择任务量,同一个任务可以由不同渠道商合作完成,而任务价格都是相同且公开的,如果渠道商缴纳一定任务保证金,在任务完成后还会获得额外奖励。任务领取、完成提交、结算全部由系统自动完成,减少了人工干预,为数据采集标注规范流程化提供了范例。
赋能AI:数据服务规范化是AI走向成熟的第一步
人工智能作为新一轮科技革命和产业变革的核心驱动力,正在对世界经济、社会进步和人类生活产生极其深刻的影响,而数据正是人工智能发展的助推剂,行业的发展离不开数据服务业的支撑。从软件时代到互联网,再到如今的大数据时代,数据的数量和复杂性经历了从量到质的改变,数据正成为引领人工智能发展进入重要战略的窗口。数据服务行业作为AI发展的第一步,直接决定了AI产业发展的速度、质量和规模。
人工智能公司的总支出中,目前有20%-30%用于数据,按此比例,现阶段大陆市场数据采集及标注的规模保守估计有五十亿,然而面对客户需求量大、数据类型复杂,整个数据服务行业都比较新,没有规范化流程化自动化的机制可以参考的现实,行业产能的提升必须借由生产方式的规范化流程化实现。这就要求行业内有能力有资质的引领企业勇挑大梁,积极变革,这也是龙猫数据推出基础定价机制的初衷:实现规范化生产管理,跑好AI发展的第一棒。
李开复曾说,最好的数据就是最多的数据。而目前现状是,能被建模量化的数据只占真实世界中的极少一部分,随着AI深入更多垂直行业,新需求不断涌现,完成需求需要的不仅是更多的数据,也是更高素质、更快速度的采集、标注团队,而比团队更重要的,很明显是——高效有序的管理机制,良好透明的市场环境,如此才能为AI发展提供有保障的数据服务。
数据生产规范化,数据服务流程化是AI高速发展的基础,无论是算法的优化,还是应用的落地,只有配合规范流程的数据服务,才能保证有效率、有质量的产出。AI产业离走向成熟,拥有像传统行业那样不可或缺的地位,在人们心里成为理所当然的存在还有一段路要走,而在这条路的开始,便是像教育对于社会发展一样的数据服务行业——规范的教育系统是社会成熟的第一步,规范的数据服务也必然是AI成熟的第一步。
数据服务流程化之路任重道远,我们期待看到更多企业像龙猫数据一样,勇立潮头,砥砺奋进,赋能AI,筑梦未来。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。