步子百科步子百科

样本容量是什么意思(样本均数与已知总体均数比较)

总体均数μ可信区间的样本计算公式可以利用样本均数x-的抽样分布获得。实际中,容量总体均数可信区间的什意思样数已数比计算方法,根据总体标准差σ是本均否已知,以样本量n的知总大小而有所不同。

σ已知

如果变量X服从均数μ、体均标准差为σ的样本正态分布,则经1式变换服从标准正态分布。容量

1式:标准正态分布统计量z

按照标准正态分布规律,什意思样数已数比95%的本均z值在-1.96和1.96之间,即

从而得到95%的知总可信区间:

更一般的情况:

σ已知、服从正态分布的体均总体均数μ可信区间的计算公式

Zα/2为标准正态分布的双界值,即标准正态分布左右两侧概率相加为α时对应的样本上侧界值。若取1-α=0.95,容量则为总体均数的什意思样数已数比95%可信区间,或取1-α=0.99,则为总体均数的99%的可信区间。

σ未知

事实上,总体标准差σ通常是未知的,这时我们可以用其估计量S代替σ,但在这种情况下,1式中(x─-μ)/(S/√n)已不再服从标准正态分布,而是服从著名的t分布。

式2:t分布公式求统计量t

在正态分布总体中进行抽样,(x─-μ)/(S/√n)服从自由度为n=v-1的t分布。

v值不同的t分布曲线

t分布随着自由度v的增大,t分布的曲线越来越接近于标准正态分布曲线;当n趋近于无穷大时,t分布的极限分布就是标准正态分布。

t分布不是一条曲线,而是一簇曲线。

因此,t分布曲线下面积95%的界值不是一个常量,它随自由度大小不同而变化。

为了应用方便,可根据书中附表查找相应的t界值。t界值表中给出了不同自由度情况下,单侧概率和双侧概率对应的t界值。如当v=24、双侧概率α=0.05时,由表中查得t0.05/2,24=2.064,此处2.064即为两侧尾部概率各为0.025的t界值。

按t分布规律,95%的t值在-t0.05/2,v和t0.05/2,v之间,即

从而得到95%的可信区间:

更一般的情况:

注意:在大样本情况下(n>50),无论变量X是否服从正态分布,按照中心极限定理样本均数都服从正态分布,同时t分布逼近标准正态分布,可信区间可以用下式近似计算: