当前位置:首页 > 上门服务 >

中位数也称第二分位数对不对(中位数和分位数的区别)

来源:原点资讯(www.yd166.com)时间:2023-07-03 08:36:02作者:YD166手机阅读>>

1、什么是描述性统计?

  描述性统计,就是从总体数据中提取变量的主要信息(总和、均值等),从而从总体层面上,对数据进行统计性描述。在统计的过程中,通常会配合绘制相关的统计图来进行辅助。

2、统计量

  描述性统计所提取的含有总体性值的信息,我们称为统计量。

1)常用统计量

* 频数与频率

预数

频率

* 集中趋势分析

均值

中位数

众数

分位数

* 离散程度分析

极差

方差

标准差

* 分布形状

偏度

峰度

2)变量的类型

* 类别变量

无序类别变量

有序类别变量

* 数值变量

连续变量

离散型变量

3)本文章使用的相关python库

import numpy as np

import pandas as pd

import matplotlib as mpl

import matplotlib.pyplot as plt

import seaborn as sns

import warnings

from sklearn.datasets import load_iris

from scipy import stats

sns.set(style="darkgrid")

mpl.rcParams["font.family"] = "SimHei"

mpl.rcParams["axes.unicode_minus"] = False

warnings.filterwarnings("ignore")

3、频率与频数

1)频率与频数的概念

  • 数据的频数与频率适用于类别变量。
  • 频数:指一组数据中类别变量的每个不同取值出现的次数。
  • 频率:指每个类别变量的频数与总次数的比值,通常采用百分数表示。

2)代码:计算鸢尾花数据集中每个类别的频数和频率

iris = load_iris()

# iris是一个类字典格式的数据,data、target、feature_names、target_names都是键

display(iris.data[:5],iris.target[:5])

# feature_names是每一列数据的特征名。target_names是鸢尾花的属种名

display(iris.feature_names,iris.target_names)

# reshape(-1,1)表示将原始数组变为1列,但是行数这里我写一个-1,表示系统

# 会根据我指定的列数,自动去计算出行数。reshape(1,-1)含义同理

dt = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)

df = pd.DataFrame(dt,columns=iris.feature_names ["types"])

display(df.sample(5))

# 计算鸢尾花数据集中每个类别出现的频数

frequency = df["types"].value_counts()

display(frequency)

percentage = frequency / len(df)

display(percentage)

frequency.plot(kind="bar")

结果如下:

中位数也称第二分位数对不对,中位数和分位数的区别(1)

4、集中趋势

1)均值、中位数、众数概念

均值:即平均值,其为一组数据的总和除以数据的个数。

中位数:将一组数据升序排列,位于该组数据最中间位置的值,就是中位数。如果数据个数为偶数,则取中间两个数值的均值。

众数:一组数据中出现次数对多的值。

2)均值、中位数、众数三者的区别

”数值变量”通常使用均值与中值表示集中趋势。

“类别变量”通常使用众数表示集中趋势。

计算均值的时候,因此容易受到极端值的影响。中位数与众数的计算不受极端值的影响,因此会相对稳定。

众数在一组数据中可能不是唯一的。但是均值和中位数都是唯一的。

在正态分布下,三者是相同的。在偏态分布下,三者会所有不同。

3)不同分布下,均值、中位数、众数三者之间的关系

中位数也称第二分位数对不对,中位数和分位数的区别(2)

记忆方法:哪边的尾巴长,就叫做 “X偏”。左边的尾巴长,就叫做“左偏”;右边的尾巴长,就叫做“右偏”。并且均值离着尾巴最近,中位数总是在最中间,众数离着尾巴最远。

4)代码:计算鸢尾花数据集中花萼长度的均值、中位数、众数

mean = df["sepal length (cm)"].mean()

display(mean)

median = df["sepal length (cm)"].median()

display(median)

# 由于series中没有专门计算众数的函数,因此需要我们统计频数最大的那些值

s = df["sepal length (cm)"].value_counts()

s = s[s.values == s.values[0]]

s.index.tolist()

t = s.index[0]

t

# scipy的stats模块中,可以计算众数

from scipy import stats

t = stats.mode(df["sepal length (cm)"])

# 注意:t展示的类字典格式的数据类型,mode展示众数,count用于展示众数出现的次数

display(t.mode,t.count)

sns.distplot(df["sepal length (cm)"])

plt.axvline(mean,ls="-",color="r",label="均值")

plt.axvline(median,ls="-",color="g",label="中值")

plt.axvline(t,ls="-",color="indigo",label="众数")

plt.legend(loc="best")

结果如下:

中位数也称第二分位数对不对,中位数和分位数的区别(3)

5、集中趋势:分位数

1)分位数的概念

分位数:将数据从小到大排列,通过n-1个分位数将数据分为n个区间,使得每个区间的数值的个数相等(近似相等)。

以四分位数为例,通过3个分位数,将数据划分为4个区间。(十分位数含义相同)

第一个分位数成为1/4分位数(下四分位数),数据中有1/4的数据小于该分位数。

第二个分位数成为2/4分位数(中四分位数,也叫中位数),数据中有2/4的数据小于该分位数。

第三个分位数成为3/4分位数(下四分位数),数据中有3/4的数据小于该分位数。

中位数也称第二分位数对不对,中位数和分位数的区别(4)

栏目热文

大学a班是重点吗(大学分重点班吗)

大学a班是重点吗(大学分重点班吗)

听到小男孩说读书很难,我终于松了口气,总算知道了主要的缘由了。可以判断出,小男孩从小就缺爱,没有家的温暖,在学校也没有存...

2023-07-03 08:55:22查看全文 >>

211大学要求初中会考等级(211学校对会考成绩有什么要求)

211大学要求初中会考等级(211学校对会考成绩有什么要求)

网校导读:会考成绩对大家考大学有什么影响吗,会考如果有C的话会不会影响考211或者985大学呢,网校为大家分析一下,仅供...

2023-07-03 08:54:41查看全文 >>

哪些名校要求会考全a

哪些名校要求会考全a

在中考升学路上,总有一些道听途说、愈演愈烈的不实消息,干扰着家长们,影响最终的判断和选择。大鹿针对过去半年里家长们咨询到...

2023-07-03 08:34:35查看全文 >>

什么大学需要会考全a(金牛座会考上什么大学)

什么大学需要会考全a(金牛座会考上什么大学)

我是香港留学第一品牌OfferMax的创始人Davy学长,香港大学Mphil,香港留学百事通,目前已帮助上千位同学留学香...

2023-07-03 08:45:06查看全文 >>

重点大学需要考多少个a(成绩一般怎么考重点大学)

重点大学需要考多少个a(成绩一般怎么考重点大学)

这两年来,英国和美国的学校,已经成为了很多人和父母的首选,而与之对应的国际学校,比如A-Level, IB, AP等等,...

2023-07-03 08:45:18查看全文 >>

两位数的表示形式(两位数可以表示为二位数吗)

两位数的表示形式(两位数可以表示为二位数吗)

  英语学习中的数词!大部分人用错的点总结,你真的会用吗?  数词在初中考的虽然不多,但是却是非常实用的一个语法点,快来...

2023-07-03 08:24:57查看全文 >>

两位数有几种不同的表示方式

两位数有几种不同的表示方式

幼升小孩子必备的数学知识有多少!有心家长的整理建议家长及时看看有顺序的数数:从小到大的数0、1、3、4、5、6、7、...

2023-07-03 08:29:30查看全文 >>

两位数可以表达成2位数吗

两位数可以表达成2位数吗

喜欢的可以关注我【严老师小学数学教学】收藏点赞转发,有问题的可以留言,后期会为大家带来更多实用的学习视频和资料...

2023-07-03 08:48:42查看全文 >>

一位数和两位数是按什么分的

一位数和两位数是按什么分的

当你拿到一本新书时,也许你迫不及待的做的第一件事便是翻看它的总页码,而页码是大家最常见、最常用、最熟悉的。由于页码中的数...

2023-07-03 08:56:31查看全文 >>

两位数的表示方法有几种(身高两位数表示方法)

两位数的表示方法有几种(身高两位数表示方法)

2022年高考英语巅峰突破精讲系列03数词在英语中,数词用于表示数量和顺序,表示事物数量的是基数词,表示事物顺序的是序数...

2023-07-03 08:46:24查看全文 >>

文档排行