随着科技的不断更新,移动互联网的流行改良了人类记录数据的方式,进而数据暴增进入大数据时代。今天正是国家全力投入发展数据技术的时代,定义数据科学这个新专业也越来越收到重视,截至目前,全国34个行省级行政区中有29个省级行政区的481所院校成功新增备案数据科学与大数据技术专业,其中有个别院校开设了两个不同学位的数据科学与大数据技术专业。
那么为什么就业市场会如此青睐拥有数据科学专业呢?
主要是因为面对这个信息爆炸的时代,数据的高数量、高维度、高更新速度以及背后的高商业价值,都对传统的硬件存储、数据管理和统计分析方法提出了更高的要求。原先的统计大多都是适用于小样本的情况,原先的统计分析工具也以Excel为主,而面对这样的大数据往往显得无能为力。
举个例子,一个人观看某视频网站的娱乐节目,下次刷新网页,他会看到新的娱乐节目或者上一个视频博主新的视频。视频中插播的广告也是关于视频内容相关的。这就是网站一个重要的广告盈利模式,通过数据分析来预测观众的偏好,这个就是数据科学中的Predictive Analytics预测分析,而预测分析也只是它的冰山一角。
因此,数据科学需要包含更全面、更综合的内容,它更像是一个对于实际数据问题所需要具备的一些基本和专业的知识。另外,数据科学涉及到如何从数据过渡到模型,再过渡到应用程序。因此,数据科学学科需要的不同的角色和技能,包括:统计学家、计算机科学家和软件工程师等,其中不同的角色所交付的成果也不同。
那么在数据科学教学应该如何实施呢?
国内领先的数据科学协同平台和鲸科技联合TalkingData旗下腾云大学、全球知名云计算服务平台AWS、开源学习社群Datawhale多家机构共同发布了《数据科学教育白皮书》(以下简称白皮书),旨聚焦于数据科学教育领域,研究基于全球视角下,数据科学教育的发展轨迹与方向。
《白皮书》认为,数据科学可以分成三个不同的核心:编程技能、数学和统计学能力、行业知识。这些领域共同构成了定义中的技能和技术,包括获取数据、数据清理、数据分析、创建假设、算法、机器学习、优化、结果可视化等等,数据科学汇集了这些领域和技能,支持和改进了从原始数据中提取见解和知识的过程。
而数据科学与其他学科也密切相关,一方面,作为高新技术产业的支柱,数据科学与信息技术在材料、器件等方面的需求带动了物理、生物等学科的发展;另一方面,数据处理、存储、检索等技术推动了物理、生物、地球科学等现代科学进行更为复杂和全面的深入研究。
数据科学是系统的、跨学科的研究领域,用于从各种不同形式的数据中获取知识和洞察。它就像粘合剂一样,把不同领域的知识和不同人的想法融合到一起,共同来解决关于数据的问题,把信息转换成知识,以及可以采取行动的洞察,合作将成为数据科学领域的常态。
想要了解更多数据科学教育项目发展现状和学科建设路径,关注和鲸公众号,后台回复“数据科学教育白皮书”,即可获得完整内容。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )