高中数学统计知识点汇总
数字特征 | 定义及性质 |
极差 | 一组数据中最大值与最小值的差。 |
众数 | 在一组数据中,出现次数 最多 的数据叫做这组数据的众数 (不唯一,一定是这组数据中的数) |
中位数 | 将一组数据按大小依次排列,把处在 中间 位置的一个数据(或最中间两个数据的 平均数 )叫做这组数据的中位数. |
平均数 | 样本数据的算数平均数,即)= |
方差 | |
标准差 | s== |
= 方差等于原始数据平方的平均数减去平均数的平方. | |
若数据,,…,的平均数为 ,方差为, 则数据的平均数是m a,方差为. | |
标准差、方差的实际意义 | 标准差和方差都反映了样本数据的离散程度。 标准差(方差)越小,表明各个样本数据在样本平均数周围越集中; 标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散. |
频率分布直方图与众数、中位数与平均数的关系 | (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(等于0.5) 频率分布直方图从左到右或者从右到左累加,面积等于0.5时x的值。 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
,, |
频率、频数、样本容量的计算方法 |
|
茎叶图 | 给定两组数据的茎叶图,可根据“重心”下移者平均数较大,数据集中者方差较小来估计数字特征. |
作用 | 平均数、中位数、众数描述数据的集中趋势, 方差和标准差描述数据的波动大小. 用样本估计总体就是利用样本的数字特征来描述总体的数字特征. |
两个变量的相关关系
变量
1、线性回归方程:
(回归直线过样本中心点(, ))
2、相关系数r:(-1≤r≤1)
r>0,表示两个变量正相关.r<0,表示两个变量负相关.
|r|越接近1,表明两个变量的线性相关性越强,
|r|越接近0,表明两个变量之间几乎不存在线性相关关系.
通常当|r|∈[0.75,1]时,认为两个变量有很强的线性相关性.
r∈[0.75,1]正相关很强,r∈[-1,-0.75]负相关很强;
- 相关指数:(0≤≤1)
R2=1- =1-
=1-=
=
=
4、判断相关关系的方法
5、回归分析模型拟合效果的判断:
6、回归系数与相关系数关系:r
为变量X、Y的标准差 =
X | Y | 合计 | |
a | b | a b | |
c | d | c d | |
合计 | a c | b d | a b c d |
- 独立性检验
卡方统计量
K2=
判断假设是否成立的规则:
如果k≥6.635, 就判断不成立,即认为X与Y有关系;
否则,就判断成立,即认为X与Y没有关系。
在该规则下,把结论“成立”错判成“ 不成立”的概率不会超过 P(K²≥6.635)≈0.01,即有99%的把握认为不成立。
如果k<6.635,既不能推定假设成立(X与Y无关),也没有足够的把握推定X与Y有关系。