咆哮|作者
知乎|来源
https://zhuanlan.zhihu.com/p/51935629
首先,本次讲座的内容是描述性统计分析。我觉得有必要搞清楚什么是描述性统计,于是我去了谷歌,得到了以下答案:
描述性统计:描述性统计是通过图表或数学方法对数据和资料进行整理和分析,对数据分布、数值特征和随机变量之间的关系进行估计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述分为三个部分:集中趋势分析、偏离中心趋势分析和相关性分析。
首先,统计学是用图表或数学方法来描述的。这里提到了图表。有哪些类型的图表?谷歌再次获得了以下常用图表(所有图表均来自普通图表)
一个
公共图
1.柱状图
定义:显示一段时间内的数据变化或项目之间的比较,主要用颜色区分类型。XY轴的二维表示。
主要用于比较各组数据之间的差异或数据变化。
当然,柱形图也有一大类,下面可以细分为各种派生柱形图。同样,其他类型的图表也有许多细分图表。由于篇幅原因,这里不一一列举。
2.折线图
定义:显示随时间变化的连续数据(根据常用的刻度设置),非常适合等时间间隔显示数据的趋势。
主要用于趋势分析。
3.圆形分格统计图表
定义:显示每个数值相对于总数值的大小。
主要用来说明各部分占整体的多少。
建议:饼图不要超过8块,百分比要按照一定的规则顺时针排序。
4.散点图
定义:散点图显示因变量随自变量变化的一般趋势,据此可以选择合适的函数来拟合数据点。愚蠢的日落是分散的点来表达信息。
主要用来寻找变量之间的相关性。
注:这里经常可以用一些数学方法对散点图进行变换,使散点图有一定的相关性。
5.雷达图
定义:集中在一个圆形图表上,显示整体的个别比率。
主要用来分析各指标的整体情况。
建议:指标不超过20个。
6.地图
定义:用符号、颜色、文字注释等图形,按一定比例描绘和表现地球表面的自然地理、行政区域和社会经济状况。
主要用于反映各种数据在地理位置上的情况。
mg.com/origin/pgc-image/9b87f51dc6534a1e8110fdaa4678e75a.png?from=pc”>
7.矩形树图
主要用于整体中各个子项目占整体的多少。
8.桑基图
定义:它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。
桑基图最明显的特征就是,始末端的分支宽度总各相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。
电商进行流量来源去向分析时,常用桑基图表示。
9.漏斗图
电商领域中,主要是基于用户行为步骤,查看转化率情况。
10.箱线图
定义:常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。
这里的箱线图就是根据四分位数得到的,可以比较直观的得到一组数据的聚集程度。
2
估计和描述的方法
数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
这部分要求利用统计的方法知道某一产品更贴合哪一种分布,从而利用相关的数学模型去进一步分析相关的问题。
3
集中趋势分析、离中趋势分析和相关分析
1.集中趋势分析
集中趋势是用来描述舆论现象的重要统计分析指标,常用的有平均数、中位数和众数等。
2.离散趋势
是指一组数据背离分布中心值的特征,反映各变量值远离其中心值的程度。
常用指标有极差、四分位数间距、方差、标准差、标准误差和变异系数等。
3.相关分析
是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。
常见的包含正相关和负相关。价格和购买量的关系一般来说是正相关,不过实际问题中有很多的因素要具体问题要具体分析。
荐:
【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕
【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!
【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!
声明
来源:RAD极客会,人工智能产业链联盟推荐阅读,不代表人工智能产业链联盟立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!