ITPub博客

首页 > 人工智能 > 机器学习 > 《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

机器学习 作者:dicksonjyl560101 时间:2019-04-04 08:34:32 0 删除 编辑


《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法

统计学的基础概念

统计学本质是收集、处理、分析、解释数据,并从中得出结论的科学。

数据类型不同维度分为不同数据:

测量尺度:分类数据、顺序数据、数值型数据;

收集方法:观测数据、实验数据;

时间状况:截面数据、时间序列数据。

数据分析的方法可分为描述统计和推断统计。

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

数量变量分为:

离散——度量『可数事物』的多少,离散型变量则是通过计数方式取得的,即是对所要统计的对象进行计数(计量),增长量非固定的。比如人数,客户数,生产产品数。

连续——度量『不可数事物』的多少,连续型变量是一直叠加上去的,增长量可以划分为固定的单位。比如身高,体重,重量。

(这个世界到底是离散的还是连续的?)

分类变量如“行业”,其变量值可以为“零售业”、“旅游业”、“汽车制造业”;

顺序变量如“产品等级”,其变量值可以位“一等品”、“二等品”、“次品”。

分类变量与顺序变量均可称为定性变量、属性变量。

数据的描述——数值方法

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

度量值来自于总体与样本的统计量。

度量值分为单变量与双变量,统计方法有:

单变量——中心位置、变异程度、分布形态、相对位置;

双变量——线性关系

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

中心位置的度量方法

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

变异程度

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

分布形态

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

线性关系

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

探索数据分析

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

在excel 数据---“数据分析---描述统计 中能得到所有指标值。

数据的概括性度量

集中趋势:平均数(算数平均数、几何平均数、调和平均数、算术-几何平均数、平均数不等式)、众数、中位数等。

离散程度:全距、内距、平均差、标准误、离散系数等。

分布:偏态系数、峰度系数,反映数据偏离正态分布的程度。

具体如图总结:

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

数据的图表展示

图表应简洁、合理的表达统计目的,不应在图形的修饰上花费太多时间。在绘制图形时,应避免一切不必要的装饰,注重图形所要表达的信息,图形产生的视觉效果应与数据所体现的事物特征一致,不得歪曲数据。

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

图表一般定义与约束

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

统计表左右两边不封口,列标题之间在必要时可用竖线分开,而行标题通常不必用横线分开;表中数据一般是右对齐,有小数点时小数点对齐,小数点位数统一,对于没有数字的单元,一般用“—”表示,表中不应出现空白单元格。

总结

《统计学》脑图:描述性统计——最全的梳理(强烈收藏)

(此图引用于 Gavin Chen 的 blog)



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29829936/viewspace-2640342/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
行万里路,读万卷书,阅无数人。 吃货一枚,爱吃湘菜,粤菜与杭帮菜,尝遍天下美食。 摄影爱好者,游遍名川大山,江河胡海,赏遍人间春色。 爱看电影,尤其是国产大片,好莱坞大片。英文名:Dickson Jin, 网名:风一样的BOY。精通SAP供应链咨询。2017年开始研习人工智能。

注册时间:2014-08-27

  • 博文量
    2528
  • 访问量
    3909745