ITPub博客

首页 > 大数据 > 数据分析 > 读《大数据时代》后的思考(一)

读《大数据时代》后的思考(一)

数据分析 作者:ghsy2002 时间:2013-06-24 23:00:14 0 删除 编辑
注:《大数据时代》是英国IT专家维克托.迈尔所著。

A、什么是大数据?
大数据是数量概念、技术概念、还是思想概念?我理解是以上兼有。没有多年来的IT发展、尤其是互联网的兴起,导致的数据量爆发式增长,也不会导致大数据的产生,海量、大是大数据的成因。随着数据量的积累,对海量数据的应用需求促使了大数据相关技术的进步。而随着一系列大数据应用实例的产生,开始引导IT行业、互联网行业、乃至各行各业的思维变革,利用大数据来解决日常经营管理中的各类问题。
B、总体数据
大数据的基本概念之一就是总体而非抽样,这里所谓总体我理解是指能收集到的尽可能多的数据,而非样本数据。要了解某一现象的相关因素,需要利用该现象相关的全部数据进行分析,而非对筛选出的相关抽样数据进行分析。
C、混杂
这是大数据的典型特征。数据质量对于大数据是不重要的,大数据环境下,数据质量问题会由于数据总量的规模而显得微不足道,不会影响分析结果,相反,还可能带来意料之外的发现。比如对于同一参数的不同名称,在传统IT这可能是一个数据质量问题,但在大数据模式下这不是问题。当然,包容混杂性需要以技术为基础,需要打破传统结构化数据库的界限。
D、相关而非因果
大数据环境下,重点关注的是相关性而非因果性。以往的数据分析方法中,需要思科数据的因果关系,建立分析模型,而大数据研究者只需关注那些变化中具有关联性的数据,并不需要提前知晓其中的因果关系。比如超市在分析飓风灾害来临期间民众购买食品的倾向,根据大数据的分析结果,得出在飓风灾害无法出门时蛋挞是顾客最喜欢的食物,虽然研究者并不能获知为何会产生如此结果,但这已经足够帮助超市进行决策。在电子政务环境中,也会出现同样情况,通过大数据分析,我们可以发现某一项业务的变化和某一情况相关,但事先我们可能并不知道其因果关系。
<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/7862730/viewspace-1118454/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-12-10