ITPub博客

首页 > 大数据 > 数据分析 > 我读大数据时代

我读大数据时代

数据分析 作者:yjkimsung 时间:2013-12-29 01:57:09 0 删除 编辑

之前全球掀起了一股“大数据妖风”,只要能跟信息商品扯上关系的都挂有大数据这样一个名头。当然说是妖风,也只是我一家之言,不具有任何代表性。《大数据时代》这本书我是花了几天的时间把它读完的,原本可以一天之内把它读完,但始终静不下心来。

也许之前吵得太热,我对这本书抱了很大的期许,到收目合书的那一刻,我真是长叹了一口气,太累了,这是它给我读后的第一感觉。道理很简单,但要是让我跟着这个道理一直的走下去,可能对我来时实在有些牵强。

这本书的逻辑结构很清晰。第一部分是与大数据时代相关的思维变革。作者提出了三点结论:第一,要尽可能分析事物相关的“全部”数据,而不是之前的随机抽样,即“样本=总体”。第二,要乐于接受数据的繁杂,而不应过分追求其精确性。第三,重视大数据呈现的“相关关系”,而不要执于探索事物间的因果关系。以上几点,我想谈谈我自身的感受。

大数据思维,这是作者一直强调并且阐述的真谛。我们大家都知道,随着科技革命的开展和信息时代的到来,第四媒体的肆意扩张已经深深地改变了这个地球的面貌。既然地球上的人群种类可以归在一起,那就必须去管理,但面对这样一个大的群体,我们该怎样去统筹安排呢?我觉得大数据或者说数字化时代确实给了我们一个方向,并且这个方向也可能会转化成一种答案。信息的数据化为我们的决断提供了极大地便利,现如今,存储设备越来越廉价,且内存也不断地扩大,这为数据的存放及提取提供了完善的载体。再把这些数据归到一个数据库中,依托网络的平台,达到全球共享的结果。但这些都靠谱吗?我想打一个大大的问号。

作者提出要分析事物相关的全部数据,这是我不能接受的一点。从小的方面说,如果把样本夸大到被考察对象的全部,也就是再也不需要随机调查、抽样调查这种信息采集方式,那我就不明白了,我们大学里开设概率论和数理统计还有什么意义。另一方面,能不能收集到全部的数据,这也是一个问题,当然搜集数据的手段越来越多,但数据的绝对量也在不断地增长,两者都在不断地扩张,也说不准谁会被谁“吞并”。另外,数据的准确性却得到确切的保证吗?单单从网络上搜罗阅者的信息,可靠吗?还有,你能确保每一位人都会在网络上留下信息吗?(网络覆盖不到的地方怎么办)。“要乐于接受数据的繁杂,而不应过分追求其精确性”,其实在这我始终觉得存在着一个矛盾,不应过分追求数据的精确性,这不是与第一点的目的相违背了吗?大数据的收集就是为了获得最准确的信息,而此刻又不再强求其准确性,我到底该信哪一个?如果说不追求其准确性的话,为何不用随机抽样的方式呢,这种方式岂不更省时省力。大数据的核心就是预测,我就更没办法理解了?对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。人毕竟是有思想的动物,如果割裂了人们对于人世间前因后果的思考,那我想这样的社会该是多么的死气沉沉。我想这些都不是你我所想要看到的。

大数据这本书是本好书,它提出了一个更加简单地社会,其初衷绝对是好的,方便社会问题的解决。但我可不想生活在冷冰冰的数据下,也不想被数据控制甚至出卖,我还想保留我那一点“为什么这样呢”的傻乎乎的劲头。

当然,以上都是我自己最简单且有肤浅的看法,可能有点偏颇。但我改不了,因为我是一个活在自己世界的人,一个执拗固执的人。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23234873/viewspace-1121198/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2010-01-24