5月22日消息,大数据厂商Teradata天睿公司CTO宝立明(Stephen Brobst)日前在“2013 Teradata大数据峰会”上向腾讯科技表示,不能一味的否定看似无用的数据,它们同样蕴含着价值,只是尚未找到价值体现手段,可以用低成本的存储服务器加以保留。
数据均有价值
如何区分大数据的价值?宝立明表示,不能一味地否定无用的数据,它们同样蕴含着价值,它们确切的说法应该是低价值密度数据。因此,企业也应该保留这些数据,只是暂时尚未发现它的价值,可以用低成本的存储服务器保留它们。
他举例说,当人们通过搜索引擎检索时,会出现一些习惯性的拼写错误。这些错误数据虽然表面上没有意义,但通过收集这些数据却可以发现大量的用户习惯和规律。
他表示,人们对于海量数据感到困惑,这是因为未能全局掌握整个数据只是看到破碎的、零散的、局部的数据。这就像通常“给数据做提炼总结”而在总结的过程中往往会丢失掉大量细节,但是很多有价值的信息正隐藏在具体的细节当中。
宝立明建议,对于不同价值的数据要区分对待,把价值不高的数据存储在低成本的环境当中,但是绝对不会把它丢弃,因为假以时日,它还是会有一定的价值会被挖掘出来。
隐私保护仍待解决
在谈到对大数据的隐私恐慌问题时,宝立明认为,应该对用户隐私提供一定的保护,例如通过数据加密,只让需要知道数据的人了解、接触或者访问到这些数据。他希望大众了解,通常通过数据挖掘软件,实际上看到的用户数据或者信息并不针对某个具体的人。
他介绍,很多国家的立法机构或者政府希望通过制定隐私保护法律来实现对用户信息的保护。但是,由于对数据分析不了解,有些法规最终可能限制了用户对信息和数据的使用。
例如,在某些国家要求电话的呼叫记录最多只能保持90天,这种呼叫记录只能够用于计费目的,就限制了电信运营商对数据的保存,不能够很好地来设计符合消费者或者用户需求的电信产品,同时给定价方式也带来很大限制,进而影响市场竞争。
- 国内首个省级旅游AI智能体“AI游贵州”发布,马蜂窝助力贵州开启智慧文旅新篇章
- 2024年终盘点 | 华为以“技术为根、实战为魂”,助力高校,培养千万数智人才
- 余承东2025年全员信:通过海量鸿蒙设备,拉动中国电子工业崛起
- 速通 NVIDIA 专业显卡:专业显卡有哪些优势?适合什么场景?
- 马蜂窝跨年出行预测:仪式感必不可少,“跨年烟花”带动目的地热度上涨
- 30亿元!比亚迪捐资兴教推动中国科教进步
- 闭着眼睛写代码是一种什么样的体验?
- 2024世界显示产业大会启幕,4K花园自研“满天星”获十大创新应用
- 哈佛商学院:2024年全球96%代码库包含开源组件 Rust采用率增长500%
- 硅谷1/10程序员在摸鱼?基本不干活却能拿20-30万美元年薪
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。