一个统计有几个指标(最基本的统计指标是什么指标)
来源:原点资讯(www.yd166.com)时间:2023-10-30 19:54:54作者:YD166手机阅读>>
- 描述统计学:找到关键的的指标来描述数据的整体情况
- 描述数据集常用的4个指标
- 平均值
- 意义:对极端值不敏感,出现平均数陷阱
- 案例:如平均工资并不能代表每个人的收入水平,高收入群体将平均工资拉高了
- 四分位数
- 四分位数与中位数有关中位数:将数字按从小到大排序,排在中间的那个数或两个数的平均值即为中位数如何求四分位数?先求出中位数,中位数将整列数据一分为二。四分位数即为,在中位数分割成的两半数据中分别再求一个中位数,则可以求得上四分位数和下四分位数。五个数值:此时下四分位数、中位数、上四分位数将这个数列分为四等分,每份占25%,第一个数称为下界,最后一位数称为上界。用5个数值可以描述数据的整体分布状况(箱线图)
- 箱线图用计算四分位数过程中得到的五个数值,可以绘制箱线图
- 应用1:在箱线图中,离中位数更近的四分位数可以反映出该部分数据更集中。如图,表示该数据集中的数据更加集中于中位数以下。同时,箱线图还可以反映出数据集的最大最小值。
- 应用:识别出可能的异常值。
- 对异常值进行检查和处理四分位数识别异常值的方法——Turkey‘s test 方法