中国科技弯道超车在即,云测数据铸造AI“新引擎”

原标题:中国科技弯道超车在即,云测数据铸造AI“新引擎”

科技行业发展滚滚向前,不过一直以来,中国科技行业都是一个追随者,可以说在PC时代我们是一个完全的学习者,而在互联网时代,我们的网络应用和服务开始能够和海外巨头并驾齐驱,而到了移动互联网时代,开始呈现领先全球的态势,中国移动互联网发展的进程远超西方发达国家,很多人都觉得中国人太依赖手机了。不过想要领先世界,那么机会真正出现在人工智能领域,AI改变世界已经是一个不争的趋势,而在这个领域,中国科技界正在凝聚一股强大的力量。

AI三要素和人工智能五小强

在互联网乃至移动互联网时代,大家突然发现中国赖以成功的人口红利优势依然存在,不断增加的互联网用户带来了非常好的发展基础。即便是在最近两年,下沉市场还带动了拼多多这样的企业诞生,可以说,市场规模依然是科技界的最大优势。不过让人感到欣慰的是,这种优势还将继续起作用,到了人工智能时代,依旧是中国科技行业能够实现弯道超车的基础。因为大量的人口红利、多样且丰富的使用场景、对新技术的接受程度等等因素叠加,产生了大量的可在AI场景中数据,这种数据样本从规模到价值都非常宏大。对人工智能三要素来说,这也是其为关键的数据优势。

AI三要素是指算法、算力和数据,用简单的话讲,算法可以说是计算的方法,好的算法效率高,准确率高,而算力则是硬件能力,在量子计算机诞生之前,在算力方面,不会产生什么跨时代的差距,目前努力的方向也是芯片产品的小微化,能够让更多的智能设备具有运算能力。而5G的发展将会带来一个非常巨大的变革就是设备可以共享云端算力,这会大大增强智能设备的算力,这也是为什么我们会说5G时代才是真正的万物互联的原因。而数据这个层面,那就非常简单了,是AI学习的基础,就好像是你读的书,简单的可以说,你读的书越多,你也就越聪明越有智慧。而在这个层面,各大科技公司开始出现了一些差距。

目前中国在AI数据方面还是具有显著优势的,硅谷的人工智能公司大部分都只能在算法上想办法。而中国市场的数据规模更为庞大,更多的公司可以提供这些数据来供人工智能公司进行学习,由此产生了一个非常好的人工智能生态,而一旦这个生态达到临界爆发,人工智能的自学习能力达到一定的程度,那么就会产生一个代际的差距,就好像大学生和小学生一样。而目前中国在人工智能领域有五家公司被业界称为“五小强”,算法层有商汤、旷视,AI数据领域有云测数据,硬件方面有涂鸦智能、地平线,这些公司虽然不是BAT级的巨头公司,但是在人工智能领域都有着自己专业的深耕和成果,可以说是中国人工智能领域弯道超车的中坚力量。

AI领域的数据英雄

在人工智能“五小强”中都是人工智能领域的头部企业,商汤、旷视经常在视觉和识别等方面一骑绝尘,而涂鸦和地平线,支撑了目前大量的智能产品进入全球千家万户,而云测数据用高质量的AI数据撑起了人工智能的一片天,曾被媒体称为“AI领域的数据英雄”。简单说,云测数据就像是生产行业燃料的企业,帮助算法公司去把数据进行标记,从而实现更好的学习效果,而这个工作可以说是非常庞大和繁琐,但确实又非常重要。不然再好再多的数据,也没有办法实现他们的核心价值。

比如人工智能领域有一个有趣的话题,人脸识别的准确率对于有色人种随着肤色的加深会大大下降,这里有一个很重要的原因就是训练数据的不足。如果想要训练一个低精度的人脸识别比如性别识别,那么随便标注性别人像的数据就可以了,但如果要精准识别一个人,就要有不同维度的被标注好的数据。由此也就诞生了定制化的AI数据服务,还原或搭建真实使用场景中所需要的环境,采集好定制化的场景数据并经过精准标注后,用这些高质量数据去训练算法模型,才能使其具有越来越智能。

这种定制化的数据服务能力的要求很高,必须具备对场景深度的还原能力、作业协同化能力、专业化能力这三种能力,首先保证对用户的需求进行精准的拆解、理解甚至预判,其次设立专业规范的协作流程,最后有足够专业的人士能够保证数据标注的质量。比如说,在医疗领域做X光片病理诊断中,标注人员需要非常专业,甚至是副主任医师专业以上的级别,才能对病理的片子进行正确的数据标注与解读。类似的情况也出现在教育、法律、智能驾驶等多个领域。

而云测数据正是这个领域的头部企业,他们通过自建数据标注基地和场景实验室的方式,打造专业的定制化采集和高质量的标注队伍,帮助人工智能企业获取更多优质的特定场景数据,持续为AI训练、优化提供安全可靠、精准高质的数据服务。现在已经覆盖了智能驾驶、智慧城市、智能家居、智慧金融、新零售等诸多领域的定制化的数据采集、数据标注服务,实现了语音、图像、文本、视频的全领域覆盖,全方位支持各类型数据的处理。可以说是成为了人工智能领域的数据基础服务提供者。目前已经拥有了行业内最大规模的专业数据服务全职人员,成功为上百家企业提供了AI数据服务。

数据优势是核心优势

目前在算法和算力方面,其实并没有什么代际差距,所以人工智能竞争的关键核心,还是在数据本身,这是行业的源头活水,也是发展的关键。不过对于人工智能公司来说,选择第三方的数据标准公司已经是当下最优的选择,这里面存在人员成本、专业程度以及效率质量等多方面问题,可以说越专业的数据公司就有着越高的数据标记能力,更有着丰富的数据标记经验和对客户训练需求的深刻理解。这对于云测数据来说,其实是一个很好的机会,而随着行业规模的不断扩大,其领军和带头作用也越发明显,而其在隐私保护、数据安全等方面的高标准,也逐渐成为行业的标杆。所以云测数据也开始越来越多地出现在大众视野之中,从相当程度上推动了AI 数据行业的规范化发展。

不过总体来看,整个数据领域的水平还有待发展,还有大量良莠不齐的外包团队,进行一些游击战式的数据标注服务,但随着企业对数据标准要求的提升,数据标注向着更专业的方向发展是大势所趋,因为这样才能建立真正的人工智能壁垒,毕竟最好的建筑材料才能建设起最坚固的房子。云测数据总经理曾说过,“以人脸识别为例,以前的需求是拉框、标注五官,现在需要标注几百个点,精确到3-5像素以内。而诸如智能驾驶领域的3D点云标注、和家居、金融等领域涉及的NLP标注等,对数据标注的整体能力也有更高的要求”这种级别的数据服务,门槛还是相当高的。

其实从社会发展来看,倒也有很多相似之处,之前我们追求经济发展的速度,现在则追求经济发展的质量,只有速度没有质量,最后还是沙上建塔,经不起风浪的冲刷。而中国人工智能行业如果想要真正实现弯道超车和逆袭,对数据标注方面的专业度提升和投入,还是要加大关注。而云测数据这样的专业机构,也会迎来更大的发展空间。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2020-03-03
中国科技弯道超车在即,云测数据铸造AI“新引擎”
目前中国在人工智能领域有五家公司被业界称为“五小强”,算法层有商汤、旷视,AI数据领域有云测数据,硬件方面有涂鸦智能、地平线,这些公司虽然不是BAT级的巨头公司,但是在人工智能领域都有着自己专业的深耕

长按扫码 阅读全文