ITPub博客

首页 > 大数据 > 可视化 > 【些些书情】《谁说菜鸟不会数据分析-入门篇》

【些些书情】《谁说菜鸟不会数据分析-入门篇》

可视化 作者:sadness2000 时间:2014-01-28 21:22:06 0 删除 编辑
《谁说菜鸟不会数据分析-入门篇》
张文霖、刘夏璐、狄松 编著  电子工业出版社2013.1

之前的《你早该这么玩Excel》算是从工具的角度讲了一遍数据分析,这一本书从工具进去讲到了数据分析的基本理论和方法,算是对前一本的补充。其中的一些图表平常用到很少,也蛮有启发。
本书围绕新入职的总经理助理小白的故事进行,以小白的第一次数据分析工作为案例,即总结分析公司员工调查满意度,按照数据分析的流程进行入门引导。

一、理论部分

数据分析的分类:描述、探索、验证
graphic
graphic

数据分析术语
绝对数和相对数
graphic

百分比和百分点
百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度, 1个百分点=1% ,在比较时使用

频数和频率
频数是绝对数,频率是相对数

比例与比率
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体
中各部分之间的关系。

倍数与番数
倍数是一个数除以另一个数所得的商。比如 A÷B C,就是说 AB C倍。
番数是指原来数量的 2N 次方倍。比如翻一番为原来数量的 2倍(21 ),翻两番为 4倍(22 )。

同比与环比
同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。

数据分析方法论
就是模型思考!

PEST分析法
graphic
5W2H分析法
graphic
逻辑树分析法
graphic
4P营销理论
graphic
graphic

graphic
用户使用行为理论
graphic
graphic

二、数据分析部分
1、开始前
一维表 VS二维表
graphic
graphic

数据源导入
自文本 +自网站(可更新)或者Ctrl+c v 选择可更新的 web查阅

问卷录入方法
graphic

2、数据处理
三心:信心、细心、平常心
二意:诚意、合意
graphic
graphic
①数据清洗(重复数据、缺失数据、错误数据)
1)重复数据
找出重复项:
1、     函数法  COUNTIF
graphic
graphic

B:A列中,这个数值一共出现的次数
C:这行以上的A列中,这个数值出现的次数
所以C可以完全筛选出非重复项,=1的就是

2、     筛选的高级筛选
3、     条件格式
4、     数据透视表  行和列都为同一字段时,默认为统计次数

删除重复项:
1、     运用删除重复项菜单
2、     添加函数辅助列,如以上的C列,然后排序降序来删除

2)缺失数据
找出缺失值:
1、     F5定位空白格
graphic
graphic
graphic
2、     当缺失值不为空值为错误符时,用Ctrl+H 来替换错误符

3)错误数据  逻辑错误
graphic
graphic
graphic

②数据加工 (数据提取、计算、分组、转换、抽样)
1)数据提取(字段分裂、合并、匹配)
字段分列
1、     用分列菜单命令,当有明显分隔符或分列特征时
2、     用函数
【些些书情】《谁说菜鸟不会数据分析-入门篇》

字段合并
  函数
【些些书情】《谁说菜鸟不会数据分析-入门篇》

将文本+数字变成文本

字段匹配
graphic
graphic
将另一张表的字段匹配到这一张表来~
在三表系统中,就是在第一张参数表中来寻找可以匹配到源数据表中的字段

2)数据计算
1、     菜单的自动计算
2、     函数计算
graphic
日期计算
graphic
graphic
日期加减
graphic

③ 数据分组
Vlookup函数,模糊匹配
graphic 

④ 数据转换
行列互换
选择性黏贴
其他功能:
graphic
多重选择和二分法互换
1、用 HLookup函数
graphic
根据行来查找
【些些书情】《谁说菜鸟不会数据分析-入门篇》
在这个行里如果有相应数字,则返回的是第一列的数字,是true,所以是1
如果没有相应数字,则返回的是#/A,不是数字,所以是false,是0
2、     用Search函数
graphic
graphic

⑤数据抽样
graphic
【些些书情】《谁说菜鸟不会数据分析-入门篇》

graphicgraphic

三 数据分析方法
【些些书情】《谁说菜鸟不会数据分析-入门篇》

1、综合评价分析法
graphicgraphicgraphicgraphic

权重确定法
用矩阵来分析,如果纵轴上的项目比横轴重要,就投票1,反之则0.
graphic
graphic

2、杜邦分析法
graphic
就是将一个问题进行分解成各个子因素,因为因素之间的彼此联系,从各因素的动态来分析现象的原因。

3、漏斗图分析法
graphic
graphic

4、矩阵分析法
graphic

发展矩阵
graphic

改进难易矩阵
graphic
这个矩阵维度可进行举一反三进行应用

5、高级数据分析方法
graphic

四 数据分析工具
数据透视表
可进行以下问题的统计:
【些些书情】《谁说菜鸟不会数据分析-入门篇》
也就是说可以通过筛选字段来看某一个具体项的值
同时还可以进行百分比、同比(差异百分比-选择年份)、环比(差异百分比-选择月份)的计算,只要在汇总里面选择值显示方式即可

五 数据展现
1、     运用图表
【些些书情】《谁说菜鸟不会数据分析-入门篇》

2、     运用条件格式
【些些书情】《谁说菜鸟不会数据分析-入门篇》
3、运用迷你图 2010新功能
4、进阶展现形式:
平均线图
【些些书情】《谁说菜鸟不会数据分析-入门篇》平均线这一线是在平均值辅助列的帮助下完成的

双坐标图
graphic
graphic添加次坐标轴后,柱形会重叠,要之间有 2个数据占位作为间隔

竖形折线图
graphic
【些些书情】《谁说菜鸟不会数据分析-入门篇》

瀑布图
graphic
graphic
graphic用辅助列、占位的方法可以变化出进阶图形

帕累托图
graphic
单个数量 +数量趋势

旋风图
graphic
graphic
为了让产生的反向坐标轴不显示负数

人口金字塔图
graphic

漏斗图
graphic
graphic

矩阵散点图
graphic
graphic

发展矩阵图
graphic这里的点可以进行箭头设置

气泡图
graphic

六、图表美化
graphic

graphic
饼图
graphic
graphic
graphic
graphic

柱形图
graphic

图表简化
graphic

TIPS
可生成自己的图表模板,避免重复制作
可自己制作截断标记,来表示超大数据
graphic








<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/7507997/viewspace-1121826/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论