“搜”出民调,影响舆论场

文|吴俊宇

“卡特里娜”飓风运行轨迹

在中国,我们同样需要构筑自己的社会灾害预警保护机制。搜索大数据和社会民调互为表里,它其实和社会、舆论、决策可以构筑一个成熟社会的稳定铁三角。

搜索大数据与社会民调其实有三个特质值得我们关注。

  • 社会反馈:人们的日常思考、社会焦虑会在搜索大数据上得到完整反映,报告式呈现之后往往就是民意的真实反馈;

  • 舆论倒逼:搜索大数据的报告式呈现往往会带来严密的逻辑佐证,铁一般的事实往往是具备社会影响力的,它会影响到决策层的心智;

  • 科学决策:决策机构的决策其实是需要科学数据作为支撑的,搜索大数据很大程度上可以成为决策机构了解社会问题以及社会民意的一环。

社会反馈、舆论倒逼和科学决策三者结合在一起时,往往可以形成持久的良性循环。

二 搜索大数据的深度挖掘

我们不妨去看看国外是如何把这三者稳定结合在一起的。

2009年美国甲型H1N1流感爆发的时候,官方数据依旧是习惯性滞后。不过,“咳嗽”和“发烧”、“关节或肌肉疼痛”这些与流感症状相关的关键词在流感爆发期间明显增多。

这一观察结果使谷歌工程师认为,他们有可能比传统的疾病控制中心方法更快地追踪报告流感发病率。

谷歌把5000万条美国人最频繁检索的词条和美国疾控中心在2003-2008年间季节性流感传播时期的数据进行比较,分析人们的搜索记录,以此判断这些人是否患上了流感。

谷歌因此成了一个更有效、更及时的指示标甚至不需要分发口腔试纸和联系医生,就形成明晰的社会洞察。美国公共卫生机构官员因此获得了非常有价值的数据信息。

后来约翰霍普金斯大学的Scott Levin以及约翰霍普金斯医学院的Richard E Rothman这两位研究者根据谷歌的Google Trends根据七个季节(2004-2011年)每周确诊流感病例数,分为训练和样本外验证集,建立了提前一周预测的预测模型。

流感病例的整数值自回归提供了一个强大的基础预测模型,而Google流感趋势的加入增强了该模型,证实了基于搜索查询的综合征监测的预测能力。这种可访问的和灵活的预测模型可以由各个医疗中心使用,以提供对未来流感病例的高级警告。

这一次百度搜索大数据同样反映出了疫情期间的社会趋势以及群体心态。疫情期间,用户都在搜素引擎上不断查看疫情进展以及防护知识,百度因此沉淀了大量搜索大数据。

一个数字是,日均超10亿人次在百度APP搜索、浏览疫情信息。搜索,这个互联网时代的“水电煤”又一次在无形之中彰显了它的价值。越是纷乱芜杂的信息环境,越是民众聚焦的社会事件,主动搜索对于民众也愈发重要。

从这些数据中可以提取大量有价值的信息,我们列举几个典型案例。

在经济领域,大家关注的是,中国经济是否会受影响,疫情之后的各个细分领域将发生哪些变化。民众在经济、生活里方方面面的搜索行为,在无形之中积累出了清晰的经济指向——比如受到影响的旅游业,以及因疫情出现用户增长的教育、医疗、娱乐产业。

在社会领域,大家关注的是复工防疫知识,比如早期搜索口罩以及具体口罩用法信息的大数据,它向我们透露了武汉地区物资紧缺和粤浙两地民众对疫情防控的重视急迫。

心理研究层面,中期湖北地区心理疏导搜索量激增,它向我们指示应尽快对湖北地区的民众进行心理疏导。

搜索大数据显示,大年三十当晚22时-23时,这一春晚的黄金时段却也是武汉市民在百度搜索疫情相关消息的全天波峰时段,其焦虑不安的情绪可见一斑。

此外,1月下旬,“心理疏导”在湖北区域的资讯指数,相邻7天环比上涨7428%,搜索指数7天环比上涨55%。为此,1月底相关部门迅速组织起了心理专家,紧急筹备开通心理支持热线和网络辅导服务。

以我身边从事行业调研和市场研究的朋友为例,他们依旧还是在使用百度搜索大数据进行市场调研分析,对比钉钉、企业微信、华为welink乃至今日头条飞书之间的竞争关系。

这位研究机构的研究员把这次疫情期分成了三个时间波段,把返工前,返工后第一个波段,返工后第二个波段分开分析,再根据双重标准化来处理,解决了各品牌整体数据基数不一致的问题。

他根据模型分析最后得出的结论是,钉钉虽然负面舆情很多,但是负面效应很小;企业微信负面舆情很少,但是负面效应非常强。

在统计学以及各项研究模型的辅助之下,各种看似不起眼的数据之中,往往潜藏着巨大的乾坤,它值得长期挖掘。

三 成熟社会的稳定关系

一个真正成熟的社会,需要决策机构、企业、机构、公众四者之间形成稳定的参与关系。

一个健康的社会必然是各方都积极主动参与协作的,社会的成熟需要企业、机构、公众都普遍介入其中,通过社会公共参与的方式不断自我训练。

财新在2月18日发布了一篇名为《用智慧手段助力疫情防控,推动城市治理现代化》,这篇文章在末尾提到:

鼓励多主体参与城市治理。构建“自下而上”的多主体参与模式,重视发挥各种社会力量,聆听社会多种声音,积极推动形成决策层、企业、机构、公众多元主体共建、共治、共享的社会治理格局。提升网络环境中的公众参与,通过运用网络和社交媒体,完善信息公开和公众反馈机制,提升透明度。

企业作为社会主体之一,同样可以参与到社会治理之中。

疫情之后,我们能不能形成持续、稳定的社会机制?

比如,ToB侧通过开放搜索大数据的方式帮助企业重新寻找商业机遇;

一些大数据研究和归因机构可以通过对搜索大数据以及移动归因数据对各个企业、产品的数据进行研究分析,帮助企业提升自身的业务能力。比如这一次疫情中最热门的在线教育行业,便在其中得到了发展机遇。

ToG侧通过长期追踪调研帮助政府科学理性决策,预测、分析下一个阶段的走势;

今年疫情期间,百度发布了《新型冠状病毒肺炎搜索大数据报告-拒绝野味篇》。报告通过搜索大数据还原了一个真实又令人震惊的现实:

非典过去17年,中国人对野味的搜索热度不降反升,尤其“野味的做法”“野味馆”“果子狸做法”等关键词的搜索指数持续走高。事实上,国人丝毫未从非典上吸取足够多的教训。

搜索大数据早已给了我们警醒,我们对禁食野生动物的力度还远远不够。

在信息社会,大数据尤其搜索大数据也有着其自身的社会责任属性,正确权威的信息可以有效的引导用户真实的了解事件发展过程,从而建立正确的认知观。

我在《在搜索框和回车键里,寻觅我们的社会脉络》一文中就提到:

在国内,程序员、产品经理因专业、精力所限无法发掘其中数据中的问题,它需要有经验的人在其中发挥作用。成熟企业往往会招聘政府、法律背景员工,参与业务和数据研究。

企业的话语体系、决策部门的话语体系、研究机构的话语体系存在差异,三套话语体系需要碰撞融合,共同服务公众。

决策机构更需要在其中充当协调者。在日本甚至出现了“产学合作协调者”一词。

产学合作、官民合作、跨学科研究、不同行业交流等联结不同领域的活动,既能帮助解决问题,又有助于创造新知识。

协调者要做的事情正是联合企业、机构组建团队,通过技术手段,从搜索大数据中获得更多民众、企业等诉求性的数据,后期展开数据研究,分析需求背后的内在发展逻辑和趋势,并形成针对社会具体问题的解决方案,定制完善的计划,并加以引导,使各方合作者达成共识,确定统一目标。

真正的成熟社会是流动的,它会为僵化现象提供预防效果。成熟社会的稳定四角关系,恰恰是构建起它的基石。

——END——

作者 | 吴俊宇 公众号 | 深几度

前南都、中经记者,关心技术、文化与人

钛媒体2015、2016、2018、2019年度作者

转载、商务请联系个人微信852405518

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2020-02-22
“搜”出民调,影响舆论场
后来约翰霍普金斯大学的ScottLevin以及约翰霍普金斯医学院的Richard E Rothman这两位研究者根据谷歌的Google Trends根据七个季节每周确诊流感病例数,分为训练和样本外验证集,建立了提前一周预测的预测模型。

长按扫码 阅读全文