ITPub博客

首页 > 大数据 > 数据挖掘 > 《谁说菜鸟不会数据分析》读后感

《谁说菜鸟不会数据分析》读后感

数据挖掘 作者:tang2041 时间:2013-07-11 23:15:13 0 删除 编辑

@小蚊子乐园 

《谁说菜鸟不会数据分析》读后感



其实我是犹豫了一段时间后才决定购买这本书的。因为觉得这本书太过于简单无趣,于是就直接去学习SPSS和SAS

至于EXCEL,由于之前使用过,所以没太在意,特别是OFFICE 2010。因为之前认为OFFICE 2003可以解决大部分

的日常办公问题,而且现在用这软件的单位还不少,所以忽视了OFFICE 2010。事实上,OFFICE在实际工作中能提

供比OFFICE 2003强得多的感受。但是直接学习了SPSS和SAS之后又感觉好像学不到什么东西似的,不知道这两个

统计软件真正的用途是什么,更重要的是对于数据分析这一行业的彻底迷茫。我又看了很多统计学理论的书,但

是这些书里很多是复杂的数学公式,学起来很头大。我不知道自己选择往这行走是否正确,但又不甘心,只能蒙

着头走下去。我本来想通过网上下载的方式获得此书,但是一直没有得逞。现在想想,如果真的是通过PDF的形

获取此书,可能只会浏览而已,不会真正用心去学习,更不会写这篇文章了。


我想,此书最大的意义在于对具体实践的解释,能把数据分析这一过程作为一个整体进行讲解。最重要的是介绍

了数据分析的基本思路,和实际操作的流程。各个过程中的注意事项也是本书的亮点,这些细节往往是非常重要

的,有很多启发意义。这本书对于初学者帮助很大,数据分析是一个大的整体,不像IT行业一样,可能只要精于

其中某一刻就行。数据分析要求对于相关技术和行业情况都有一定的了解才行,否则就无法入手了。在整体性方

面的讲解上,此书刚好填补了这块的空白。


最后,提一点建议。能不能提供一个数据分析学习体系的整体思路和相关推荐书籍。这可能会对今后进一步学习

和进行实践提供更大的帮助。(如果怕有什么问题可以私下发个我!《谁说菜鸟不会数据分析》读后感



附:我对于此书的要点总结:

第1章      数据分析那些事儿

1、  其实他们最主要的区别在于目的是否明确,如果目的明确,所有问题就自然迎刃而解了。

 

2、  一般来说,数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律

 

3、  比例是指在总体中各部分的数值占全部数值的比重,常反映总体的构成和结构;比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。

 

 

第2章      结构为王——确定分析思路

1、  逻辑树的使用三原则:

(1)       要素化:把相同问题总结归纳成要素。

(2)       框架化:将各个要素组织成框架,遵守不重不漏的原则。

(3)       关联化:框架内的各要素保持必要的相互关系,简单而不孤立。

 

 

第3章      无米难为巧妇——数据准备

 

 

第4章      三心二意——数据处理

1、  数据清洗:重复数据处理、缺失数据处理、检查数据逻辑错误;数据加工:数据抽取、数据计算、数据分组、数据转换;数据抽样

 

 

第5章      工欲善其事必先利其器——数据分析

1、  数据分析方法的三大作用:现状分析、原因分析、预测分析。

作用

方法

数据分析方法

现状分析

对比

对比、平均、综合评价

原因分析

细分

分组、结构、交叉、杜邦、漏斗图、矩阵关联、聚类

预测分析

预测

回归、时间、决策树、神经网络

对比、分组、结构、平均、交叉、综合评分、杜邦、漏斗图、矩阵关联、高级数据分析方法。

 

2、  对比分析法:与目标对比、不同时期对比、同级部门、单位、地区对比、行业内对比、活动效果对比。

 

3、  分组法必须与对比法结合运用。

 

4、  结构分析法是指分析总体内各部分与总体之间进行对比的分析方法。

 

5、  综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。

 

 

第6章       给数据量体裁衣——数据展现

1、  图表的作用:表达形象化、突出重点、体现专业化。

 

2、  数据间的关系:成分、排序、时间序列、频率分布、相关性、多重数据比较。

 

3、  图表制作五步法:

确定所要表达的主题或目的=

确定哪种图表最适合你的目的=

选择数据制作图表=

检查是否真实有效地展示数据=

检查是否表达了你的观点

 

4、  表格中突出显示单元格、项目选取、数据条、图表集、迷你图等几种展现数据的表格技巧。

 

5、  常用图表:平均线图、双坐标图、竖形折线图、瀑布图、帕累托图、旋风图、人口金字塔图、漏斗图、矩阵图。

 

 

第7章       专业化生存——图表可以更美的

1、  标题、图例、单位、脚注、资料来源这些图表元素是图表的五脏六腑。

 

2、  要注意的条条框框:

A 避免生出无意义的图表;

B 不要把图表撑破;

C 只选对的,不选复杂的;

D 一句话标题。

 

3、各个图表的注意事项

 

饼图

A对于饼图要按照时钟表盘的刻度,把数据从12点钟的位置开始排列,最重要的成分紧靠12点钟的位置;

B 数据项不要太多,保持在5项以内;

C 不要使用爆炸式的“饼图分离”;

D 饼图不要使用图例;

E 尽量不要使用标签连线,如果要用则切记凌乱;

F 尽量不适用3D效果,如果要用厚度要尽量薄一些;

G 当扇区使用颜色填充时,推荐使用白色的边框线,具有较好的切割感。

柱形图

A 同一数据序列使用相同的颜色;

B 不要使用倾斜的标签,别让读者歪着脑袋看;

C 纵坐标轴一般刻度从0开始;

D 一般来说,柱形图最好添加数据标签,这样让读者一眼就能看到具体数值;

E 如果柱状图已经有了数据标签,纵坐标刻度线和网格线则显得多余了,最好删除。

条形图

A 同一数据序列使用相同的颜色;

B 尽量让数据由大到小排序,方便阅读;

C 不要使用倾斜的标签;

D 最好添加数据标签。

折线图

A 折线选用的线型要相对粗些,最好比网格线、坐标轴更突出;

B 线条一般不超过5条,否则像意大利面条,非常杂乱。如果线条太多的话可以分开做图表;

C 不要使用倾斜的标签;

D 纵坐标轴一般刻度从0开始。

 

4、  图表会说谎:a虚张声势的增长;b3D效果的伪装;c逆序排列的误导;d一维图形的障眼法。

 

5、  图表美化的三原则:简约、整洁、对比。

 

6、  美化图表的技巧:最大化数据墨水比、找出隐形的线、图表喜欢的数字格式、如何突出对比。

 

7、              数据墨水比最大化的步骤

A 去掉不必要的背景充填色;

B 去掉无意义的颜色分类;

C 去掉装饰性的渐变色;

D 去掉网格线、边框;

E 删掉不必要的图例;

F 去掉不必要的坐标轴;

G 去掉装饰性图片;

H 以上不能去掉的元素就尽量淡化;

I 对需强调的数据元素进行突出标识。

 

 

第8章       专业的报告——体现你的职场价值

1、  数据分析报告的作用:展示分析结果、验证分析质量、提高决策参考。

 

2、  数据分析报告种类:专题分析报告、综合分析报告、日常数据通报。

 

项目

word

excel

powerpoint

优势

·易于排版

·可打印装订成册

·可含有动态图表

·结果可实时更新

·交互性更强

·可加入丰富的元素

·适合演示汇报

·增强展示效果

劣势

·缺乏交互性

·不适合演示汇报

·不适合演示汇报

·不适合大篇文章

适用

范围

·综合分析报告

·专题分析报告

·日常数据通报

·日常书记通报

·综合分析报告

·专题分析报告

 

3、  数据分析报表由标题、目录、前言、正文、结论与建议、附录六大组成部分组成。

 

4、  撰写数据分析报告的五大注意事项:

A 合理的结构以及清晰的逻辑;

B 实事求是,反映真相;

C 用词准确,避免含糊

D 篇幅适宜,简洁有效;

E 结合具体业务进行合理的分析。

 

5、  标题常用类型:解释基本观点、概括主要内容、交代分析主题、提出问题。

 

6、  前言:为何要开展此次分析?有何意义?;通过此次分析要解决什么问题?达到何种目的?;如何开展此次分析?主要通过哪几方面开展?

 

7、  报告正文的特点:包含所有数据分析事实和观点、通过数据图表和相关的文章结合分析、正文各部分具有逻辑关系。

 

8、  撰写报告时的注意事项:

A 结构合理,逻辑清晰;

B 实事求是,反映真相;

C 用词准确,避免含糊;

D 篇幅适宜,简洁有效;

E 结合业务,分析合理。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22215850/viewspace-1120737/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-07-28