当前位置:首页 > 上门服务 >

置信水平转换方案(置信水平通俗理解)

来源:原点资讯(www.yd166.com)时间:2024-01-29 10:25:42作者:YD166手机阅读>>

00、背景

今晚重温下数据统计,学习以下内容:

1、对给定数据进行探索性数据分析。

2、计算描述性统计数据并绘制直方图。

3、使用 scipy 库计算置信区间、Z-score和 T-score。

01、几个名词介绍

置信区间(confidence interval):即误差范围。

用(a, b)表示,a和b的确切数值取决于事件对于“该区间包含总体均值”这一结果的可信程度。

置信区间在频率学派中间使用,其在贝叶斯统计中的对应概念是可信区间(credible interval)

置信水平转换方案,置信水平通俗理解(1)

从正态分布产生的50个样本中得出的50个置信区间

置信水平(Confidence level):即置信区间包含总体平均值的概率多大。

例如,95%的置信水平指的是100个置信区间有95个包含了总体平均值。置信水平越高,区间越宽,置信区间包含总体统计量的几率越大,但置信区间太宽,则会失去意义。常用置信水平为95%。

我们常犯一个概念性错误,是将基于观测到的数据所同样构造的置信区间的置信水平,误认为是它包含真实未知参数的真实值的概率。正确的理解是:置信水平只有在描述这个同样构造置信区间的过程(或称方法)的意义下才能被视为一个概率。

Z分数:

z分数(z-score),也叫标准分数(standard score)是一个数与平均数的差再除以标准差的过程。在统计学中,标准分数是一个观测或数据点的值高于被观测值或测量值的平均值的标准偏差的符号数。

z分数可以回答这样一个问题:"一个给定分数距离平均数多少个标准差?"在平均数之上的分数会得到一个正的标准分数,在平均数之下的分数会得到一个负的标准分数。z分数是一种可以看出某分数在分布中相对位置的方法。

T分数:

T分数是原始分数的导出分数。把原始分数转换成标准化分数为线性转换,Z分数与原始分数的分布形状相同,原始分数为正态分布,则Z分数也为正态分布。

原始分数如果不是正态分布,如何使导出分数为正态分布呢?这时可先把原始分数转换成百分等级,而后再把百分等级转换成标准正态分布的z值,从而迫使导出分数z服从均数为0、标准差为1的正态分布,叫做正态化的标准分数。

置信水平转换方案,置信水平通俗理解(2)

02、完整代码

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('Q7.csv') df.head()

输出:

Unnamed: 0

Points

Score

Weigh

0

Mazda RX4

3.90

2.620

16.46

1

Mazda RX4 Wag

3.90

2.875

17.02

2

Datsun 710

3.85

2.320

18.61

3

Hornet 4 Drive

3.08

3.215

19.44

4

Hornet Sportabout

3.15

3.440

17.02

df.describe()

输出:

Points

Score

Weigh

count

32.000000

32.000000

32.000000

mean

3.596563

3.217250

17.848750

std

0.534679

0.978457

1.786943

min

2.760000

1.513000

14.500000

25%

3.080000

2.581250

16.892500

50%

3.695000

3.325000

17.710000

75%

3.920000

3.610000

18.900000

max

4.930000

5.424000

22.900000

df['Weigh'].mode()

输出:

0 17.02 1 18.90 Name: Weigh, dtype: float64

df['Weigh'].var()

输出:

3.193166129032258

df['Weigh'].std()

输出:

1.7869432360968431

df['Weigh'].max() - df['Weigh'].min()

输出:

8.399999999999999

sns.boxplot(df)

输出:

置信水平转换方案,置信水平通俗理解(3)

sns.scatterplot(df)

输出:

置信水平转换方案,置信水平通俗理解(4)

首页 1234下一页

栏目热文

如何理解置信上限(置信区间怎么算阈值)

如何理解置信上限(置信区间怎么算阈值)

设总体的分布函数含有一个未知参数 θ,θ∈Θ(Θ 是 θ 可能的取值范围);对于给定值 α(0<α<1),若...

2024-01-29 10:37:21查看全文 >>

置信水平的原则(置信水平为什么通常选取95%)

置信水平的原则(置信水平为什么通常选取95%)

置信水平。在统计学中,置信水平是用来衡量我们对样本估计结果可靠性的度量。它告诉我们,如果进行类似的实验或调查很多次,那么...

2024-01-29 10:28:37查看全文 >>

置信度100%的规则(置信度计算标准)

置信度100%的规则(置信度计算标准)

有必要学下“概率”,为什么?尽管提到这三个字会不自觉地把它往“赌博”上靠拢,可要知道,概率的知识能够帮助人们避开不确定的...

2024-01-29 10:57:42查看全文 >>

如何提高置信区间的精度(置信水平和区间精度关系)

如何提高置信区间的精度(置信水平和区间精度关系)

本部分包含基本PCR / qPCR / dPCR实验方案实例,可用作探索本指南理论章节所述某些概念的基础。除了提供更一般...

2024-01-29 10:20:14查看全文 >>

怎么降低置信区间(置信区间最低多少数值有可信度)

怎么降低置信区间(置信区间最低多少数值有可信度)

这里也没有狄拉克三角洲,所以与我的主观实验不同,它的可信区间是一维的。消除p=0然而,情况与我们的直觉相反。在生命中的每...

2024-01-29 10:17:30查看全文 >>

如何对置信水平提问(置信水平如何计算)

如何对置信水平提问(置信水平如何计算)

CDA数据分析师 出品简介–思维方式的差异当一个人MIS专业人士的身份开始了职业生涯,然后进入商业智能(BI),随后进入...

2024-01-29 10:37:25查看全文 >>

置信度和置信水平(置信水平和置信区间区别)

置信度和置信水平(置信水平和置信区间区别)

置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估...

2024-01-29 10:30:04查看全文 >>

置信水平的研究(置信水平的例子)

置信水平的研究(置信水平的例子)

置信区间是统计学中一个重要的概念,它提供了一个参数的可能范围,以及这个范围的置信度。这个参数可能是总体的均值、比例、差异...

2024-01-29 10:20:26查看全文 >>

置信度对置信区间的影响(置信度与置信区间之间的关系如何)

置信度对置信区间的影响(置信度与置信区间之间的关系如何)

数据给你一双看透本质的眼睛,这里是《数据分析思维课》。从今天开始,我们就要进入数据算法基础部分了。一说到算法,很多人都会...

2024-01-29 10:40:39查看全文 >>

生育保险查询入口(12333社保查询网官网)

生育保险查询入口(12333社保查询网官网)

长江日报4月17日讯异地保胎住院,是否可报销?武汉社保交满多久可以领取生育津贴?不是武汉户口,新生幼儿怎么办理武汉医保社...

2024-01-29 10:25:30查看全文 >>

文档排行