您好,欢迎来到小侦探旅游网。
搜索
您的当前位置:首页样本容量的确定

样本容量的确定

来源:小侦探旅游网


样本容量的确定 分类: S tntis tics 在参数区间估计的讨论中,估计值禾ife体的参数之尙存在着一定的差异,这种差 异是由样本的随机性产生的。在样本容量不变的情况下,若要增加估计的可靠 度,置信区间就会扩大,估计的精度就降低了。若要在不降低可靠性的前提下,增 加估计的精确度,就只有扩大样本容量。当然,增大样本容量要受到人力、物力 和时间等条件的,所以需要在满足一定精确度的条件下,尽可能恰当地确定样 本容量。 -、影响样本容量的因素

(一) 总体的变异程度(总体方差R)

在其它条件相同的情况下,有较大方差的总体,样本的容量应该大一些,反之则应 该小一些。例如:在正态总体均值的估计中,抽样平均误差为

\"晶它反映了样本

均值相对于总体均值的离散程度。所以,当总体方差较大时,样本的容量也相应要 大,这样才会使较b皿 小,以保证估计的精确度。 (二) 允许误差的大小

弹-3 =亠

允许误差指允许的抽样•譬,记为 「 ,例如,样本均值与总体均值之间的

2

允许误差可以表示为lx-川卜^,允许误差以绝对值的形式表现了抽样误差的可 能范围,所

以又称为误差。

允许误差说明了估计的精度,所以,在其他条件不变的情况下,如果要求估计的精 度高,允许误差就小,那么样本容量就要大一些;如要求的精确度不高,允许误差 可以大些,则样本容量可以小一些。

(三) 概率保证度1— C1的大小

概率保证度说明了估计的可靠程度。所以,在其他条件不变的情况下,如果要求较 高的可靠度,就要增大样本容量;反之,可以相应减少样本容量。 (四) 抽样方法不同

在相同的条件下,重复抽样的抽样平均误差比不重复抽样的抽样平均误差大,所需 要的样本容量也就不同。重复抽样需要更大的样本容量,而不重复抽样的样本容量 则可小一些。

此外,必要的抽样数目还要受抽样组织方式的影响,这也是因为不同的抽样组织方 式有不同的抽样平均误差。

二、样本容量的确定

(一)估计总体均值的样本容量

在总体均值的区间估计里,置信区间是由下式确定的:

X耳U询~7=-

例如,对于正态总体以及非正态总体大样本时,都是以它为置信区间。

从图6-1中可以看到,从估计量x的取值到点

的距离实际上为置信区间长

度的2。这段距离表示在一定置信水平1—Q下,用样本均值估计总体均值时所允 许的最大绝对误差即允许误差 表示为:

。显然,若以x的取值为原点,则允许误差

可以

(6-15)

图6-1允许误差示意图

公式(6-15)反映了允许误差、可靠性系数、\"创秫标准差与样爲量之间的相 互制约关系。只要这四个因素中的任意三个因素确定后,另一个因素也就确定了。

在重复抽样条件下,把允许误差 容量的计算公式:

的计算公式 变形整理,则得到样本

⑴ —

b (6~16)

在不重复抽样的条件下,抽样允许误差为 形后得到不重复抽样条件下的样本容量公式为

因此变

4沖皿# (6 一 17)

例6-14某食品厂要检验本月生产的10 000袋某产品的重量,根据以往的资料,这 种产品每袋重量的标准差为25克。如果要求在95.45%的置信度下,平均每袋重量的 误差不超过5克,应抽查多少袋产品?

解 由题意可知N=10 000 (原作者误为20 000 ) , 6二25克,匚=5克,根据置信 度1 - a =95.45%,挣—2。在重复抽样的条件下

= 100

2

(AJ n=5s

(袋)

注:Excel中的计算方法:

利用标准正态分布函数的反函数 NORMSINV计算在该置信度下的标准偏差度z=2; 题中要求平均每袋重量的误差不超过 5,即表明SD乜小于或者等于5;

那么倒推标准偏差应该不超过2.5;在总体标准差为25克的前提下,那么取样量应 该为99.96 ,当然,取样量应该是整数,即100。 在不重复抽样条件下

2 X 25 xlOOOO

33

55叫八対今9 (袋)

由计算结果可知:在其它条件相同的情况下,重复抽样所需要的样本容量大于不重 复抽样所需要的样本容量。

在计算样本容量时,必须知道总体的方差,而在实际抽样调查前,往往总体的方 差是未知的。在实际操作时,可以用过去的资料,若过去曾有若干个方差,应该 选择最大的,以保证抽样估计的精确度;也可以进行一次小规模的调查,用调查所 得的样本方差来替代总体的方差。

(二)估计总体成数时的样本容量

估计总体成数时样本容量的确定方法与估计总体均值是一样的,设 允许误差,在1—a的置信度下,重复抽样条件下有

A?=

別为

解上面的方程可得重复抽样条件下样本容量的公式为

同理可得不重复抽样条件下的样本容量公式为

每*心尸\"(6_]9)

在估计成数时,计算样本容量时需要总体的成数,但是总体的成数通常是未知的,在 实际的抽样调查时,可先进行小规模的试调查求得样本的成数来代替。也可用历 史的资料,如果有若干个成数可供选择,则应选择最靠近50%的成数,使样本成数的 方差最大,以保证估计的精确度。

例6-15为了检查某企业生产的10 000个显像管的合格率,需要确定样本的容量。根 据以往经验合格率为90%、91.7%o如果要求估计的允许误差不超过0.0275,置信水 平为95.45%o求应该取多少只显像管?

解根据资料,我们应该选择P二0.9计算样本容量,根据置信水平 0.95 ,有心

重复抽样条件下,样本容量

于 x0.9x(l-0.9)

0.0275

476 D3»477

不重复抽样条件样本容量

;「

%PQ-BN 耳M+

2

0.0275 x 10000 -b x 0.9x(1 - 0.9) 心H1-鬥

从计算的结果可以看出,重复抽样应该抽477件件检验,而不重复抽样应该抽455件, 可见,在相同条件下,重复抽样需要的样本容量更大。

4.40^455

注:Excel中的计算方法:

利用标准正态分布函数的反函数 NORMSINV计算在该置信度下的标准偏差度z=2.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- xiaozhentang.com 版权所有 湘ICP备2023022495号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务