顾嘉/文
山清水秀的贵州一般都会给人留下生态良好、环境优美、民族文化绚烂等印象,但如果要把科技前沿和这个地方联系起来,似乎显得有些不可思议。
然而就在这个地方,竟然诞生了中国第一个国家级大数据综合试验区,就连习近平、李克强等党和国家领导人都在为贵州发展大数据事业「点赞」、「代言」。近年来,凭借着在大数据产业发展中的显著成效,贵州已经创造了多项「全国第一」,「谈大数据必谈贵州」成为业界共识。
幸运的是,我所在的企业和团队赶上了这一波难得的浪潮,而我也有幸参与了这场关于大数据的「造梦」之旅。
在我10年+的职业生涯中,有一大半时间是在与文字打交道,而真正干与大学专业相关的工作,还要算是最近这一年多在贵州移动大数据运营中心的经历。
我们的主要任务是——
在贵州大数据产业大发展的契机下,探索出一条真正适合通信运营商的大数据发展道路,让大数据成为运营商转型发展的突破口和有力武器,也为更多行业注入大数据的智慧和能力,最终形成多方共赢、百姓受益的良好生态。
我知道这听上去非常「官方」,有些不接地气、不好理解,但如果要把这个任务目标再细分一下就清晰了——
找到通信运营商在大数据领域的独特性优势;
在不触碰信息安全红线的前提下明确大数据商业模式;
找到大数据与各行各业的契合点并形成合力;
将大数据打造成运营商转型发展的利器;
与产业链上下游合作伙伴互惠共赢。
这话说来简单,真要落地实施的时候就变得非常困难了。事实上,很多外省兄弟公司以及友商都在开展大数据业务方面的尝试,真正成功的案例却是凤毛麟角,原因很复杂,有些是因为缺乏一个良好的政策环境,有些是因为没有明确的商务模式,还有些是撞到了信息安全、个人隐私的红线。
我们是幸运的,作为大数据产业的先行者,贵州的政策大环境几乎是全国一流的。
我们也是「鸭梨山大」的,如果在这样的政策环境中都碌碌无为,那真的很丢人;
在经历了400多天,访谈了5000多位客户,实践了10余个项目后,我们终于找到了一条可行的路子,我也总结出了省级运营商发展大数据业务的「8字诀」——
大、小、多、少,前、后、左、右。
第一组关键词:大和小
所谓「大」是指通信运营商发展大数据业务的机会非常大。
原因不外乎两点:能力和动机。
能力方面最值得一提的是数据。李彦宏前段时间发的内部信中有这样一个论断:数据是新的内容、数据秒杀一切算法。运营商拥有令人羡艳垂涎的海量宝贵数据资源,除了用户规模大、信号覆盖广、数据连续性强以外,运营商的数据还有实时性好、真实准确(实名制)以及维度丰富、吞吐量达、处理能力强等特征。这些优势,都是一般互联网企业难以企及的,也可是说是运营商数据的独特优势。
动机方面,通信行业的竞争异常激烈,还随时面临OTT业务的异质替代,从以前的坐着赚钱变成了跑着赚钱,行业缺乏新的收入增长点,量收剪刀差日趋加大,产业转型面临艰巨的挑战。对于拥有数据矿藏的通信运营商来说,无论对内服务或者对外拓展,都有着极高的热情,并且行动力极强。
因此,无论从能力还是动机来说,运营商发展大数据的机会都非常之大。
所谓「小」是指运营商发展大数据业务要从小做起、以小搏大。
具体原因我曾经专门写过一篇文章分析,感兴趣的同学可以点击这里(为什么「大」数据项目反而要做「小」?)
具体来说,主要还是一个项目管控力的问题。在我看来,项目做小至少有这几个好处:
1.更接地气,容易产生实际的运营效果。
2.更加可控,信息安全风险相对较低。
3.操作性更强,运营商的话语权相对较强。
4.成长性更好,单个项目成功后可规模推广。
第一点是指在大数据项目合作中,避免产生单纯作秀的情况,让大数据服务于合作行业实际生产一线,与行业合作推出的功能也是真正应用于实际工作中的,可以帮助行业切实产生效果,让人无法拒绝;
第二点很容易理解,大数据项目对于信息安全风险管控的要求非常高,在项目规模相对较小的情况下风险也会随之降低。即便是对于贵州这样大数据政策非常先进的地方,这点也是项目参与者必须关注的;
第三点是非常现实的,近些年来运营商在市场上的过度竞争导致话语权急剧降低,很多行业非常善于利用三家运营商之间的竞争关系达到低价甚至免费中标的目的,尤其是在ICT项目中经常导致运营商赔钱赚吆喝。因此,在大数据项目中一定要避免产生类似的情况,一个可行的思路就是用更高级别的组织与基层主管部门合作。在我们的实践过程当中,这种合作模式被证明是非常可靠高效,而且对双方有利的(文后会单独讲讲我们的合作情况);
第四点更容易理解了,运营商做大数据并非短期行为,而是一个相对长期的战略,成长性就是我们必须要考虑的因素。当我们将一个项目真正做小、做精、做深、做透以后,完全可以在更大范围内进行复制,从而产生可观的规模效益。
从另外一个方面来讲,小项目也不容易让人形成过高的期望值,即使失败了试错成本也比低,比较符合互联网「快速迭代」的方法论。
第二组关键词:多和少
所谓「多」是指数据种类要多、维度要全。
这牵扯到人们对于大数据这个概念的误解,其实大数据并不是单一地讲数据量大,在我看来大数据更将就多种类、多维度数据的融通应用。
当10万个手机用户的网龄数据扩展1000万个的时候,数据量扩大了100倍,但似乎并没有办法得出什么不一样的结论;然而当10万个手机用户的网龄信息遇到同样这些用户的信用信息的时候,我们就会得出一些有趣的结论,比如说:网龄与个人信用呈现正相关关系,网龄长的手机用户在个人信用方面的表现往往更好。这就是「数据融通」的魔力,也是大数据项目最大的魅力。
因此在大数据项目合作过程当中,一定要尽可能多的引入合作行业的数据。一方面可以增加项目成功的概率,毕竟大家都拿出了真实数据开展合作,比「孤掌难鸣」的单方面数据项目要靠谱;另一方面,随着引入数据维度和种类的丰富,合作的维度也会随之产生变化,一些意想不到的结论或许会增加项目内容,甚至会产生决定性的影响。
所谓「少」是指项目中的功能一定要聚焦、收敛。
功能收敛的目的非常明确,就是实现单一功能的不断优化,真正做到「小步快跑」、「快去迭代」,让复杂的简单化、简单的标准化、标准的数据化、数据的不断优化。
另一个收敛功能的原因是支撑能力不一定跟得上需求的快速变化。其实在任何一个研发项目中,功能都是需要被收敛的,毕竟再强大的研发团队都没法适应随时变化的功能需求。而且无数案例证明,前期设定的功能越多后期交付的体验越差,反之一些「小而美」的功能往往能引发大规模的传播和拓展。
综合以上两组关键词,特别需要说明的就是「项目要小、功能要少」。这背后既有基于运营商现有市场环境的「不得不」,还有很多大数据产业政策中的「必须必」,而且对于一个省级运营商来说,在相对较小的区域内完成几个收敛后的功能研发也是比较安全而且现实的,更加重要的是,这种「小步快跑」的模式似乎更容易在区域市场内产生战果,也更容易形成「星星之火可以燎原」之势。
如果说上面的「大、小、多、少」更像是项目把控方面的大原则、大方向,那么我后面要谈的「前、后、左、右」则更贴近于项目具体实施过程中的小技巧、小方法。
第三组关键词:前和后
具体来说就是,试点在前,收费在后。
大数据项目的一个特殊性在于结果的「不确定」,这既来自于数据建模以及融通过程中数据本身的不确定,也来自于一种未曾有过的分析框架下会呈现出的结果的不确定。而我们能确定的是,大数据是一门「分析过去、计算现在、预测未来」的技术。
在我们的项目经验中真的出现过类似情况,一个微小参数的调整导致结果相差好几倍,反复查了很多遍才发现问题来自源数据。因此,确保在全流程中排除每一个可能导致误差的点就成为项目成功的关键要素,毕竟没人会对一个不准确的结果买单。
于是,根据我们实际项目运作下来的一个重要经验就是「先试点」。这样做的好处主要有3点:
1.试点可以不断校正模型和算法,提高准确率;
2.试点可以增强双方合作过程中的磨合度,为项目后续奠定基础;
3.试点可以在选取区域内展开对比,效果更加明显。
第一点是最重要的原因。尽管大数据的魅力就在于像魔术师的帽子一样把不同种类、不同维度的数据组合在一起,让数据间产生「化学反应」,最终输出超乎想象的结论。那么如何能够保障数据质量、如何确保数据之间可以正常地「接触」、如何引入合适的「催化剂」、如何能让数据在适当的「容器」内发生反应等问题就需要耐心细致地逐步解决了。
这也是大数据项目合作中非常重要的一步,按照我们的经验,这一步开展得越扎实,后续工作的进展就越顺利。通常情况下,这样的试点至少会在1~3个月。
第二点是双方合作中逐步建立信任、默契的过程。与其他ICT项目不同,大数据项目绝不是一个「单打」项目,更像是真正意义上的「合鸣」。
「我们永远不可能比行业用户更懂行业。」
这是我在大数据项目上和团队成员反复强调的一个观点。
在传统的ICT项目中,运营商扮演的角色往往更像是「包工头」,常见的运作模式是从甲方手上拿到项目,转手外包给SA或SI,自己留下传统的专线、话音、IMS等通道类业务。甲方的业务需求由合作方帮着搞定,有些情况下合作方甚至就是甲方指定的,运营商扮演着「集成商」的角色,但基本上还干着运营商自己的活儿。
然而在大数据项目中,运营商的定位一定不是「包工头」,而更像是与用户一起完成项目的工程师。因此,如何与客户建立良好的合作机制、如何合理地引导客户需求、如何掌控项目进度、如何调配配套资源等问题就成为考研项目操盘手的重要能力。
第三点非常好理解,有了试点就可以展开对比。既可以对比「做」与「不做」的差别,还可以比较「A方法」与「B方法」的不同,对推进项目起到了实战筛选的作用。
第四组关键词:左和右
具体来说就是平台资源在左、信息安全在右,两手抓两手都要硬。
一个成功的大数据项目离不开两点:丰富成熟的平台配套资源和严格管控的信息安全保障。否则,一旦在这两个环节出现问题,最终的结局一定是劳民伤财、两败俱伤。
所谓「平台资源」是指大数据项目实施所需要的计算平台资源。这里面重点考虑三个方面:一是扩展性,要确保项目在局部试点成功后,快速在全省范围内覆盖;二是兼容性,要确保不同来源的数据资源都可以整合进大数据平台;三是使能性,对于常用的通信信令数据处理要形成「能力下沉、接口开放」的能力输出。
「信息安全」则是大数据项目的高压线。无论项目本身有多紧迫、多重要,信息安全这一道防线绝不可掉以轻心。
说到底主要是两条:技防和人防。
技术方面,应当采用目前国内外先进的信息安全技术,采取有效的安全策略和技术手段,建立覆盖硬件网络、操作系统、数据库、应用软件和管理等各个方面的统一、安全、稳定、高效的信息安全体系,保证系统安全稳定运行。
其实更应该关注的是人防。人们往往容易关注技术,却忘记了所有的信息安全技术手段都无法阻止人类的好奇和贪婪,任何可能访问系统的人理论上都是一个风险点。如何建立一套可靠、有效的信息安全审核机制就显得尤为重要。
写到这里,我所说的「大数据8字诀」就基本介绍完了。下面,我想就我所观察到的现象,简单聊聊目前运营商发展大数据业务模式的几种典型场景和存在的问题。
1.服务复购率低,短期行为导向明显;
各种「征信」、「验真」统统属于这一类业务,这种业务的好处在于变现简单,收入可观。但坏处也非常明显,即便是反馈一个「是」或「否」的结果,这种服务很难产生复购,谁会为验证过的结果反复买单呢?业务收入可持续性必然较差。很多地方为了冲业绩签下「大单」,殊不知这种短期行为是在透支未来。
2.纯粹形象工程,让大数据飘在空中难以落实;
这似乎是常事,双方高层领导签订一份战略合作框架协议,辅以大数据的名义,合作内容各种「高大上」,合作前景各种「伟光正」,然而只要仔细看一眼协议,要么是空洞无物,要么是「马关条约」。
3.将大数据服务停留在提供分析报告等表层;
不是说报告不好,而是如果仅仅把大数据服务停留在报告层面,未免太大题小做了。一个不好的征兆是,只要一有重要节庆,运营商们都在争先恐后地发布各种各样的报告,形式越来越新颖多样、内容越来越丰富多彩,可是令人尴尬的是好像没多少人看。一种观点是发布报告是公司大数据实力的象征,我要轻声提醒一句:没有合理的商业模式,再美的报告也是泡影。
4.借大数据之名,行传统通信营销之实;
最后一种也比较常见,合作双方签署《大数据**合作协议》,但仔细一看合同,几乎和大数据没有任何关系,合作内容大部分还是传统的专线、IDC或者其他集团客户产品。这样做本无可厚非,但如果是将大数据作为服务附属条件添加,容易将这只刚刚培养出来的「金牛」贬成「瘦狗」。
最后,谈谈这一年多来开展大数据业务中的两点感受。
首先是兴奋和不安全感。作为一名大数据产业的观察者、参与者、实践者,我特别激动能赶上这一波浪潮,但我深知还有很长的路要走。实话说,在这个领域我们甚至都还只是小学生。有那么一瞬间,我突然觉得在小学一年级学过的这几个字特别贴切,而且也很符合现状,所以就花了一周时间总结出来了。认真读的华,这背后其实隐藏着深深的焦虑和不安全感。
其次是深深的感谢。在我的团队所经历的项目中,最让人激动的要算是某市公安系统的大数据服务项目了。客户方的技术负责人曹警官利用自己多年的经验给我们提供了一套精密的算法,帮助我们不断调整模型参数,耐心细致地配合我们解决实际应用中存在的问题;团队中的龙同学、梁同学、吴同学又非常给力地完成着每一项任务,很多任务都是突发性安排的,他们也都任劳任怨,这毕竟是个全新领域,所有人都在摸着石头过河。还有更多的幕后英雄默默为这个项目付出着努力,感谢所有人!
善谋者胜,远谋者兴。贵州从2014年开始做大数据,从一知半解的「门外汉」变成业内无人不谈的「领跑人」,这当中的酸甜苦辣恐怕也只有我们这些亲身参与过的人会懂。无论怎样,都应该感谢这个时代,让我们遇上了可能是此生最重要的一次机遇,尽管还不知道最后的结局,但这是一个可以期待的未来!
若干年后,人们再提起贵州,已经不再只有山清水秀的印象,那里还有一群人,在给数据插上飞翔的翅膀。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。