第2章 1.1 指出下面的变量类型。
(1) 年龄。 (2) 性别。 (3) 汽车产量。
(4) 员工对企业某项改革措施的态度(赞成、中立、反对). (5) 购买商品时的支付方式(现金、信用卡、支票)。 详细答案: (1)数值变量. (2)分类变量。 (3)数值变量. (4)顺序变量。 (5)分类变量.
1。2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他
们的消费支付方式是用信用卡.
(1) 这一研究的总体是什么?样本是什么?样本量是多少? (2) “月收入\"是分类变量、顺序变量还是数值变量? (3) “消费支付方式\"是分类变量、顺序变量还是数值变量? 详细答案:
(1)总体是“所有IT从业者\",样本是“所抽取的1000名IT从业者”,样本量是1000。 (2)数值变量。 (3)分类变量.
1。3 一项调查表明,消费者每月在网上购物的平均花费是200元,
他们选择在网上购物的主要原因是“价格便宜”. (1) 这一研究的总体是什么?
(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值变量? 详细答案:
(1)总体是“所有的网上购物者\"。 (2)分类变量。
1。4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1) 这种抽样方式是分层抽样、系统抽样还是整群抽样? (2) 样本量是多少? 详细答案: (1)分层抽样. (2)100。
第2章 用图表展示数据
2。1 为评价家电行业售后服务的质量,随机抽取由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D。较差;E.差.调查结果如下: B D A B C D E A D A B A C C B C C C C B C D E B A C C E D C D D A A B D C E E B C E B C D D C C A E C D B E E E B C C B B B A C E A D B C C B C C D C E A E C D D A A B C B E C B D D C A D C B E C B C (1)用Excel制作一张频数分布表. (2)。绘制一张条形图,反映评价等级的分布。 (3)。绘制评价等级的Pareto图。 (4)。绘制一张饼图,反映评价等级的构成。 详细答案: (1)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级 A B C D E 合计 家庭数(频数) 14 21 32 18 15 100 频率(%) 14 21 32 18 15 100 (2)条形图如下: (3)帕累托图如下: (4)饼图如下: 2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下: 700 706 708 668 706 694 688 701 693 713 716 715 729 710 692 690 6 671 697 699 728 712 694 693 691 736 683 718 6 725 719 722 681 697 747 6 685 707 681 726 685 691 695 674 699 696 702 683 721 704 709 708 685 658 682 651 741 717 720 729 691 690 706 698 698 673 698 733 677 703 684 692 661 666 700 749 713 712 679 696 705 707 735 696 710 708 676 683 695 717 718 701 665 698 722 727 702 692 691 688 1.以组距为10进行分组,整理成频数分布表。 2.根据分组数据绘制直方图,说明数据分布的特点. 3。制作茎叶图,并与直方图作比较。 详细答案: (1)频数分布表如下: 100只灯泡使用寿命的频数分 按使用寿命分组(小时) 灯泡个数(只) 频率(%) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计 2 5 6 14 26 18 13 10 3 3 100 2 5 6 14 26 18 13 10 3 3 100 (2)直方图如下: 从直方图可以看出,灯泡使用寿命的分布基本上是对称的。 (3)茎叶图如下 数 叶 茎 个数 65 1 8 2 5 据66 1 4 5 6 8 67 1 3 4 6 7 9 6 14 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 18 71 0 0 2 2 3 3 5 6 7 7 8 8 9 13 72 0 1 2 2 5 6 7 8 9 9 10 73 3 5 6 3 74 1 4 7 3 茎叶图与直方图所反映的数据分布是一致的,不同的是茎叶图中保留了原始数据。 2。3 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下: 人数 考试成绩 甲班 优 良 中 及格 不及格 3 6 18 9 4 乙班 6 15 9 8 2 (1)根据上面的数据,画出两个班考试成绩的环形图,比较它们的构成。 (2)画出雷达图,比较两个班考试成绩的分布是否相似。 详细答案: (1)环形图如下: (2 )雷达图如下: 从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。从雷达图的形状看,两个班考试成绩的分布没有相似之处。 2.4 下面是我国10个城市2006年各月份的气温数据: 月份 北京 沈阳 上海 南昌 郑州 武汉 广州 海口 重庆 昆明 5.7 5。6 11.1 16.6 20。8 6.6 6.5 12.7 19.3 22.7 0。3 3.9 11.5 17。1 21。8 4。2 5。8 15.8 17.3 18.5 20。5 7.8 9。0 10.8 13。2 1月 —1。9 -12。7 2月 -0。9 3月 8。0 4月 13。5 5月 20.4 6月 25。9 7月 25.9 8月 26。4 9月 21。8 1016.1 月 116.7 月 12-1.0 月 —6.7 0.8 11。6 —8.1 0。5 8.0 18.3 21。6 24。2 24。3 17。5 12。8 17。9 21。8 13。3 15。9 19.0 23.9 28.4 30。2 23。6 25.3 26.7 28。3 19.2 22.9 25.4 18.0 18。0 20.4 25。6 26。0 27。8 29。4 30。0 30。2 30.0 27.1 26.1 21.2 27。8 29。4 29.8 30.0 28.5 27。4 31。0 21。3 32。4 24.8 20.6 18。3 29。7 29。4 24.0 27.0 23。9 24。3 22.1 22.1 19.0 21.0 26。4 27.1 20.6 16.9 15。7 15.0 10.8 14。0 21.9 25.3 14.6 13.2 8.2 8.1 3。0 6。8 16.0 20。8 9.4 9.8 绘制各城市月气温的箱线图,并比较各城市气温分布的特点。 详细答案: 箱线图如下: 从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。
第3章 用统计量描述数据
3.1 随机抽取25个网络用户,得到他们的年
19 23 30 23 41 15 21 20 27 20 29 38 19 22 31 25 22 19 34 17 24 18 16 24 23 龄数据如下(单位:周岁):
计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。 详细答案:
网民年龄的描述统计量如下:
平均 中位数 25%四分位数 75%四分位数 众数 24 23 19 26。5 19 标准差 方差 峰度 偏度 极差 最小值 最大值 6.65 44.25 0。77 1。08 26 15 41 从集中度来看,网民平均年龄为24岁,中位数为23岁.从离散度来看,标准差在为6。65岁,极差达到26岁,说明离散程度较大。从分布的形状上看,年龄呈现右偏,而且偏斜程度较大.
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验.一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1。97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5 6。6 6.7 6.8 7。1 7。3 7.4 7.8 7。8 (1)计算第二种排队时间的平均数和标准差. (2)比两种排队方式等待时间的离散程度.
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。 详细答案:
(1) (岁); (岁)。
(2) ; 。第一中排队方式的离散程度大.
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:
按利润额分组(万元) 300以下 300~400 400~500 500~600 600以上 合计 企业数(个) 19 30 42 18 11 120 计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。 详细答案:
=426。67(万元); (万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想? 详细答案:
通过计算标准化值来判断, , ,说明在A项测试中该应试者比平均分 数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):
方法A 1 167 168 165 170 165 1 168 1 162 163 166 167 166 165 方法B 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132 方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 1。你准备用哪些统计量来评价组装方法的优劣?
2。如果让你选择一种方法,你会做出怎样的选择?试说明理由。 详细答案:
3种方法的主要描述统计量如下:
方法B 方法A 平均 中位数 众数 标准差 峰度 偏度 极差 离散系数 最小值 最大值 165。6 165 1 2。13 -0。13 0.35 8 0。013 162 170 平均 中位数 众数 标准差 峰度 偏度 极差 离散系数 最小值 最大值 128。73 129 128 1.75 0.45 —0。17 7 0。014 125 132 平均 中位数 众数 标准差 峰度 偏度 极差 离散系数 最小值 最大值 125。53 126 126 2。77 11.66 —3。24 12 0.022 116 128 方法C (1)从集中度、离散度和分布的形状三个角度的统计量来评价。从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
第4章 概率分布
4.1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:
X P 0 1 2 3 4 5 6 7 8 9 10 0.041 0.130 0。209 0。223 0.178 0.114 0。061 0。028 0。011 0.004 0。001 根据这些数值,分别计算:
(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。 (2)只有不到2个空调器出现重要缺陷的概率。
(3)有超过5个空调器出现重要缺陷的概率。 详细答案:
(1)0。724。(2)0。171。(3)0.105.
4.2 设 是参数为 和 的二项随机变量.求以下概率: (1) ;(2) 。 详细答案:
(1)0。375。(2)0.6875。
4.3 求标准正态分布的概率: (1) ;(2) ;(3) . 详细答案:
(1)0。3849。(2)0.1844。(3)0.0918。
4。4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)
9。19 9.63 10.10 9.70 10。09 10。01 8。82 9。43 10.03 9.85 9。60 10。50 10。12 9.49 9。37 9。27 8。83 9.39 9.48 9。 9.78 9。35 9. 9。36 9。68 8。82 8。65 8。51 9.14 9。75 绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布? 详细答案: 正态概率图如下:
由正态概率图可以看出,汽车耗油量基本服从正态分布。
4.5 从均值为200、标准差为50的总体中,抽取 的简单随机样本,用样本均值 估计总体均值。 (1) 的期望值是多少? (2) 的标准差是多少? (3) 的概率分布是什么? 详细答案:
(1)200.(2)5。(3)近似正态分布。
4.6 从 的总体中,抽取一个容量为500的简单随机样本。 (1) 的期望值是多少? (2) 的标准差是多少? (3) 的分布是什么? 详细答案:
(1)0。4.(2)0。0219 。(3)近似正态分布。
4.7 假设一个总体共有8个数值,,55,59,63,,68,69,70。从该总体中按重复抽样方式抽取的随机样本。 (1)计算出总体的均值和方差。 (2)一共有多少个可能的样本?
(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布? (5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么? 详细答案:
(1) , 。
(2)共有个样本。
(3)所有样本的样本均值如下:
.5 。0 。5 56。5 58。5 59。0 61.0 61.5 62。0 55.0 57。0 59。0 59.5 61。5 62.0 62。5 57.0 59.0 61.0 61.5 63。5 。0 。5 59.0 61.0 63.0 63.5 65。5 66。0 66。5 59.5 61。5 63。5 。0 66。0 66.5 67。0 61.5 63。5 65。5 66.0 68.0 68.5 69。0 62.0 .0 66.0 66.5 68.0 69。0 69.5 62.5 .5 66.5 67。0 69。0 69.5 70.0 56.5 58。5 59.0 61.0 61。5 62.0
(4)样本均值的正态概率图如下:
从正态概率图可以看出,样本均值近似服从正态分布。
(5) , 。样本均值的平均数等于总体平均数,样本均值的标准差等于总体标准差的 .
第5章 参数估计
5.1 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的标准误差。 (2)在95%的置信水平下,求估计误差。 (3)如果样本均值为120元,求总体均值 的95%的置信区间. 详细答案: (1) 。 (2)E=4。2. (3)(115。8,124.2)。 5。2 利用下面的信息,构建总体均值 的置信区间. (1)总体服从正态分布,且已知 , , ,置信水平为95%。 (2)总体不服从正态分布,且已知 , , ,置信水平为95%. (3)总体不服从正态分布,未知, , ,,置信水平为90%。 (4)总体不服从正态分布,未知, , ,,置信水平为99%. 详细答案: (1)(87,9153). (2)(8734,9066)。 (3)(8761,9039)。 (4)(8682,9118)。 5。3 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)如下: 3。3 4。4 2。1 4.7 3。1 2.0 1.9 1。4 6。2 5。4 1。2 1.2 5.8 2。6 5.1 2。9 2.3 6.4 4.3 3。5 4。1 1。8 4.2 2.4 5.4 3.5 3。6 0。5 4.5 5.7 0.8 3。6 3.2 2。3 1。5 2。5 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%. 详细答案: (1)(2.88,3。76); (2)(2。80,3。84); (3)(2。63,4.01)。 5.4 某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。 (2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%.应抽取多少户进行调查? 详细答案: (1)(51.37%,76.63%)。 (2)62。 5.5 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取的10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下: 方式1 方式2 6。5 6。6 6。7 6.8 4.2 5.4 5.8 7。1 7。3 7.4 7。7 7。7 7。7 10。0 6。2 6。7 7。7 7。7 8。5 9.3 (1)构建第一种排队方式等待时间标准差的95%的置信区间。 (2)构建第二种排队方式等待时间标准差的95%的置信区间。 (3)根据(1)和(2)的结果,你认为哪种排队方式更好? 详细答案: (1)(0。33,0.87)。 (2)(1。25,3。33). (3)第一种排队方式更好。 5。6 两个正态总体的方差 和 未知但相等。从两个总体中分别抽取两个的随机样本,它们的均值和标准差如下: 来自总体1的样本 来自总体2的样本 (1)求 的95%的置信区间。 (2)求 的99%的置信区间. 详细答案: (1)(1.86,17。74)。 (2)(0.19,19。41)。 (3)(—3。34,22.94)。 5.7 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下: 人员编号 1 2 3 方法1 78 63 72 方法2 71 44 61 4 5 6 7 8 9 10 91 49 68 76 85 55 84 74 51 55 60 77 39 构建两种方法平均自信心得分之差的95%的置信区间. 详细答案: (6。33,15。67)。 5。8 从两个总体中各抽取一个 的随机样本,来自总体1的样本比例为 ,来自总体2的样本比例为 。 (1)构造 的90%的置信区间。 (2)构造 的95%的置信区间。 详细答案: (1)(3.02%,16.98%)。 (2)(1。68%,18.32%)。 5。9 生产工序的方差是工序质量的一个重要度量.当方差较大时,需要对工序进行改进以减小方差。下面是两部机器生产的袋茶重量(单位:克)的数据: 机器1 3。45 3.20 3。22 2.98 3。90 3.70 3.22 3。38 机器2 3。28 3。19 3。35 3。30 3.22 3.50 2.95 3。16 3.20 3。75 3。38 3.45 3.48 3.18 3。28 3.35 3.20 3。12 3。25 3。30 3.30 3.34 3。28 3。30 3。20 3.29 3。35 3。16 3.34 3.05 3。33 3.27 3.28 3.25 构造两个总体方差比 的95%的置信区间。 详细答案: (4.06,24。35)。 5.10 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本? 详细答案: 139。 5。11 假定两个总体的标准差分别为: , ,若要求估计误差不超过5,相应的置信水平为95%,假定 ,估计两个总体均值之差 时所需的样本量为多大? 详细答案: 57。 5.12 假定,估计误差 ,相应的置信水平为95%,估计两个总体比例之差 时所需的样本量为多大? 详细答案: 769。
第6章 假设检验
6.1 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7。25小时,标准差为2。5小时。据报道,10年前每天每个家庭看电视的平均时间是6。70小时。取显著性水平 ,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”? 详细答案:
, =3。11,,拒绝 ,如今每个家庭每天收看电视的平均时间显著地增加了。 6。2 为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):
81.6 96。6 77。3 74.0 86。6 74。9 76.1 82。5 80。0 83。0 92.2 87.0 85。8 66。6 72.4 73.2 78。6 68.6 61.7 88。5 58.3 70.9 75.6 86.9 68.7 71.7 85.5 94。9 73。2 71。6 72。5 83。0 根据最近的测量数据,当显著性水平 时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值? 详细答案:
, =—2.39, ,拒绝 ,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
6。3 安装在一种联合收割机的金属板的平均重量为25公斤.对某企业生产的20块金属板进行测量,得到的重量数据如下:
22。6 27。0 26.2 25。8 22.2 26。6 25。3 30。4 23。2 28。1 23。1 28.6 27.4 26。9 24。2 23。5 24.5 24。9 26。1 23.6 假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求? 详细答案:
, , ,不拒绝 ,没有证据表明该企业生产的金属板不符合要求.
6.4 在对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。在 显著性水平下,检验该生产商的说法是否属实?详细答案: , , ,拒绝,该生产商的说法属实.
6.5 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的样本产生如下结果:
操作A =100 =14。8 =0。8 操作B =50 =10.4 =0。6 对 =0.02,检验平均装配时间之差是否等于5分钟。 详细答案:
, =—5。145, ,拒绝 ,两种装配操作的平均装配时间之差不等于5分钟.
6。6 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分.潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对 =0。05的显著性水平,用下列数据检验该假设,并对该广告给予评价.
购买力得分 个体 1 2 3 4 看后 6 6 7 4 看前 5 4 7 3 购买力得分 个体 5 6 7 8 看后 3 9 7 6 看前 5 8 5 6 详细答案:
设 , 。 , =1.36, ,不拒绝 ,广告提高了平均潜在购买力得分.
6。7 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2 对12名员工进行培训。培训后的测试分数如下:
方法1 56 47 51 52 45 43 59 52 方法2 57 56 53 65 42 50 47 53 42 44 52 48 44 53 55 53 57 两种方法培训得分的总体方差未知且不相等.在 显著性水平下,检验两种方法的培训效果是否有显著差异? 详细答案:
, , ,拒绝 ,两种方法的培训效果是有显著差异。
6.8 为研究小企业经理们是否认为他们获得了成功,在随机抽取 100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为39人.在 的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异? 详细答案:
设 , 。 , , ,拒绝 ,男女经理认为自己成功的人数比例有显著差异。
6.9 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料 109 98 103 97 101 98 88 105 97 94 108 102 98 99 102 104 100 104 106 101 105 113 106 110 109 111 117 111 新肥料 110 111 99 103 118 99 107 110 109 112 119 119 取显著性水平 ,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为: ①两种肥料产量的方差未但相等,即 . ②两种肥料产量的方差未且不相等,即 . (2)两种肥料产量的方差是否有显著差异? 详细答案:
(1)设 , 。 , , ,拒绝 ,新肥料获得的平均产量显著地高于旧肥料。 (2) ,拒绝 ,新肥料获得的平均产量显著地高于旧肥料。 (3) , 。 , ,两种肥料产量的方差有显著差异。
6。10 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:克)如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异(a=0。05)。
机器1 2。95 3。16 3。20 3.12 机器2 3.22 3。38 3.30 3。45 3.20 3.22 3.50 3。22 2.98 3。75 3。38 3.45 3。48 3。90 3。70 3.26 3.36 3。34 3.33 3.25 3.18 3。20 3。28 3.35 3.30 3.34 3.28 3.34 3。35 3.30 3.28 3。19 3。20 3.29 3。35 3.16 3。25 3。05 3.33 3.30 3。36 3.27 3.28 详细答案:
, . =8.28, ,拒绝 ,两部机器生产的袋茶重量的方差存在显著差异。
第7章 方差分析与实验设计
教材习题答案 7.1 一家牛奶公司有4台机器装填牛奶,每桶的容量为4升。下面是从4台机器中抽取的装填量样本数据: 机器1 4.05 4.01 4。02 4。04 机器2 3.99 4。02 4。01 3。99 4.00 4.00 机器3 3。97 3。98 3。97 3.95 4.00 机器4 4。00 4.02 3.99 4。01 取显著性水平 ,检验4台机器的装填量是否相同? 详细答案: 7。2 一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者.该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10 代表非常满意): 高级管理者 7 7 8 中级管理者 8 9 8 低级管理者 5 6 5 7 9 10 9 10 8 7 4 8 取显著性水平 ,检验管理者的水平不同是否会导致评分的显著性差异? 详细答案: 7。3 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经实验得其寿命(单位:小时)数据如下: 电池生产企业 实验号 A 1 2 3 4 5 50 50 43 40 39 B 32 28 30 34 26 C 45 42 38 48 40 试分析3个企业生产的电池的平均寿命之间有无显著差异?( )如果有差异,用LSD方法检验哪些企业之间有差异? 详细答案: 7.4 某企业准备用3种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果: 方差分析表 差异源 组间 组内 总计 SS 3836 df 29 MS 210 — F — — P—value 0。245946 — — F crit 3.3131 - — (1)完成上面的方差分析表。 (2)若显著性水平 ,检验3种方法组装的产品数量之间是否有显著差异? 详细答案: 7.5 有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行实验,取得的收获量数据如下表: 施肥方案 品种 1 1 2 3 4 5 12。0 13。7 14。3 14。2 13.0 2 9。5 11。5 12。3 14.0 14。0 3 10.4 12.4 11.4 12。5 13。1 4 9。7 9。6 11。1 12。0 11.4 检验种子的不同品种对收获量的影响是否显著?不同的施肥方案对收获量的影响是否显著?( ) 详细答案: 7。6 城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通分别在3个路段和高峰期与非高峰期亲自驾车进行实验,通过实验取得共获得30个行车时间(单位:分钟)的数据。试分析路段、时段以及路段和时段的交互作用对行车时间的影响.( ) 路段 路段1 36.5 34。1 高峰期 37.2 35。6 38。0 时段 30。6 27。9 非高峰期 32.4 31.8 27.3 27.6 24。3 22.0 25.4 21。7 31.8 28。0 26。7 29.3 25。6 路段2 28。1 29。9 32。2 31.5 30。1 路段3 32.4 33。0 36.2 35.5 35。1 详细答案: 7。7 为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实验,考察三种广告方案和两种广告媒体,获得的销售量数据如下:
广告媒体 报纸 8 广告方案 A 12 8 电视 12 22 B 14 10 C 18 26 30 18 14 检验广告方案、广告媒体或其交互作用对销售量的影响是否显著?( ) 详细答案:
第8章 一元线性回归
8。1 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号 产量(台) 生产费用(万元) 企业编号 产量(台) 生产费用(万元) 1 2 3 4 5 6 40 42 50 55 65 78 130 150 155 140 150 1 7 8 9 10 11 12 84 100 116 125 130 140 165 170 167 180 175 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验( ),并说明二者之间的关系强度。 详细答案: (1)散点图如下: 产量与生产费用之间为正的线性相关关系。 (2) 。检验统计量 , ,拒绝原假设,相关系数显著。 8。2 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22460 11226 347 4851 44 2662 49 人均消费水平(元) 7326 4490 116 2396 2208 1608 2035 (1)绘制散点图,并计算相关系数,说明二者之间的关系. (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性( ) (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 详细答案: (1)散点图如下: 二者之间为高度的正线性相关关系。 ,二者之间为高度的正线性相关关系。 (2)估计的回归方程为: 。回归系数 表示人均GDP每变动1元,人均消费水平平均变动0。3087元。 (3)判定系数 。表明在人均消费水平的变差中,有99.63%是由人均GDP与消费水平之间的关系决定的。估计标准误差 ,表示用人均GDP预测人均消费水平的平均误差为247。3元。 (4)检验统计量 , ,拒绝原假设,线性关系显著。 (5) 元. (6)置信区间:[1990.749,2565。4];预测区间:[1580。463,2975。750]。 8.3 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下: 航空公司编号 1 2 3 4 5 6 7 8 9 航班正点率(%) 81。8 76.6 76.6 75。7 73.8 72。2 71.2 70.8 91.4 投诉次数(次) 21 58 85 68 74 93 72 122 18 10 68.5 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。 (2)检验回归系数的显著性( )。 (3)如果航班正点率为80%,估计顾客的投诉次数。 详细答案: (1)估计的回归方程为: 。回归系数 表示航班正点率每变动1%,顾客投诉次数平均反向变动4。7次. (3)检验回归系数的P=0.001108〈 ,拒绝原假设,回归系数显著. (4) 次。 (5)置信区间:[37。660,70。619];预测区间:[7.572,100。707]. 8。4 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源 回归 残差 总计 df 11 SS 40158.07 12866.67 — MS F — — Significance F 2.17E-09 — - 参数估计表 Coefficients Intercept 363.61 标准误差 62。45529 t Stat 5.823191 P—value 0.000168 X Variable 1 1。420211 0.071091 19.97749 2.17E—09 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义. (5)检验线性关系的显著性(a=0.05). 详细答案: (1)方差分析表中所缺的数值如下: 方差分析表 变差来源 回归 残差 总计 df 1 10 11 SS 1422708.6 40158.07 12866。67 MS 1422708.6 4015.807 - F 3。277 — — Significance F 2。17E—09 — - (2) .表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。 (3) 。 (4) 。回归系数 表示广告费用每变动一个单位,销售量平均变动1。420211个单位. (5)Significance F=2.17E-09 8。5 随机抽取7家超市,得到其广告费支出和销售额数据如下 超市 广告费支出/万元 销售额/万元 A B C D E F G 1 2 4 6 10 14 20 19 32 44 40 52 53 1。用广告费支出作自变量 ,销售额为因变量 ,求出估计的回归方程。 2.检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。 3。绘制关于 的残差图,你觉得关于误差项 的假定被满足了吗? 4。你是选用这个模型,还是另寻找一个该更好的模型? 详细答案: (1)估计的回归方程为: . (2)Significance F=0。020582 (3)残差图如下: (4)虽然线性关系通过了显著性检验,但从残差图来看,关于x与y之间存在线性关系的假设仍只得怀疑。因此可考虑选用非线性模型。 第9章 多元线性回归
9。1 根据下面的数据用Excel进行回归,并对回归结果进行讨论,计算 、 时y的预测值。
y x1 x2 12 18 31 28 52 47 38 22 36 17 174 281 1 202 149 188 215 150 167 135 3 9 4 8 9 12 5 11 8 5 详细答案:
由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 df 0。459234 0。2106 -0.01456 13。34122 10 SS 2 332。9837 MS 166.4919 F 0。931 Significance F 0.4385 残差 总计 Intercept X Variable 1 X Variable 2 Coefficients 7 1245。916 9 177。988 t Stat P-value Lower 95% —27.6519 Upper 95% 77.70928 1578。9 标准误差 25.0287 22。27863 -0.04971 0。105992 1.928169 1。47216 1.12344 0。298298 -0.46904 0。653301 1.309755 0.231624 —0.30035 0。200918 —1.55294 5。409276 得到的回证方程为: . 表示,在 不变的条件下, 每变化一个单位,y平均下降0.04971个单位; 表示,在不变的条件下,每变化一个单位,y平均增加1.928169个单位。
判定系数 ,表示在因变量y的变差中能够被y与和之间的线性关系所解释的比例为21.09%.由于这一比例很低,表明回归方程的拟合程度很差。估计标准误差 ,预测误差也较大.
方差分析表显示,Significance F=0。4385>a=0.05,表明y与和之间的线性关系不显著.用于回归系数检验的P值均大于a=0。05,两个回归系数均不显著.
当=200、=7时,y的预测值为:
9.2 根据下面Excel输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F、 、 及调整的 的值对模型进行讨论。
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归 残差 总计 Intercept X Variable 1 X Variable 2 X Variable 3 0。842407 0。709650 0。630463 109。429596 15 df 3 11 14 标准误差 167。459539 1.791836 0.322193 1.442935 SS 321946.8018 131723.1982 MS 107315。6006 F Significance F 0.002724 8。961759 11974。84 t Stat 3。923655 P—value 453670 Coefficients 657.0534 5.710311 —0。416917 -3.471481 0.002378 3.186849 0。008655 -1.293998 0。222174 -2。405847 0。034870 详细答案:
模型中涉及2个自变量,15对观察值。 估计的回归方程为: 。
从判定系数 和调整的判定系数 可以看出,回归方程的拟合程度一般。估计标准误差 ,预测误差比较大.
从方差分析表可知,Significance F=0。002724〈a=0.05,表明因变量Y与
3个自变量之间的线性关系显著。从回归系数检验的各P值可知,自变量x2不显著,表明因变量y与3个自变量之间的线性关系显著。从回归系数检验的各P值可知,自变量 不显著,其他两个自变量都是显著的.这可能意味着模型中存在多重共线性。
9.3 根据两个自变量得到的多元回归方程为 ,并且已知n=10,SST=6724。125,SSR=6216。375, , 。
(1)在a=0。05的显著性水平下,、与y线性关系是否显著? (2)在a=0.05的显著性水平下, 是否显著? (3)在a=0。05的显著性水平下, 是否显著? 详细答案:
(1)提出假设: : : 至少有一个不等于0 计算检验的统计量F
当a=0.05时, 。由于 ,所以拒绝原假设,表明 、 与y线性关系显著。 (2)提出假设: : :
计算检验的统计量t
当a=0。05, ,由于 ,所以拒绝原假设,表明 显著。
(3)提出假设: : :
计算检验的统计量t
当a=0。05, ,由于 ,所以拒绝原假设,表明 显著。
9。4 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据
月销售收入y(万元) 96 90 95 92 95 94 94 94 电视广告费用 (万元) 5。0 2.0 4。0 2。5 3.0 3.5 2。5 3.0 报纸广告费用 (万元) 1.5 2.0 1.5 2。5 3。3 2.3 4.2 2.5 (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。
(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?
(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 Intercept X Variable 1 Coefficients 88.63768 1。603865 df 1 0.807807 0.652553 0.5945 1。215175 8 SS 16.01 MS F Significance F 16。01 11。26881 0。015288 Lower 95% 84.76577 0。434777 Upper 95% 92.50959 2.772952 6 8。859903 1。476651 7 标准误差 25.5 t Stat P—value 2.17E—09 0.015288 1.582367 56。01588 0.477781 3.356905 估计的回归方程为: 。
(2)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 Intercept X Variable 1 X Variable 2 0。958663 0。919036 0。88665 0.2587 8 df 2 5 7 标准误差 SS MS F Significance F 23.431 11.7177 28。37777 0。001865 Lower 95% 79.18433 Upper 95% 87.27585 2.0592 0。412918 25。5 t Stat P—value Coefficients 83.23009 1。573869 52。88248 2.290184 0。304065 1。3009 0.320702 7.5319 4.57E-08 0.000653 1。508561 3。071806 0.476599 2.125379 4.056697 0。009761 估计的回归方程为: 。
(3)不相同。在月销售收入与电视广告费用的方程中,回归系数 表示电视广告费用每增加1万元,月销售额平均增加1.603865万元;在月销售收入与电视广告费用和报纸广告费用的方程中,回归系数 表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.290184万元。
(4) , 。表明在销售收入的总变差中,被估计的回归方程所解释的比例为88.665%
(5) 的P—Value=0.000653, 的P—Value=0.009761,均小于a=0。05,两个回归系数均显著.
9.5 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下
收获量y(kg/hm2) 2250 3450 4500 6750 7200 7500 8250 降 雨 量x1(mm) 25 33 45 105 110 115 120 温 度x2 ( ) 6 8 10 13 14 16 17 (1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。 (2)解释回归系数的实际意义。
(3)根据你的判断,模型中是否存在多重共线性? 详细答案:
(1)由Excel输出的回归结果如下: 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 0。995651 0.991321 0.986982 261.431 7 回归分析 残差 总计 Intercept X Variable 1 X Variable 2 df 2 SS 31226615 MS F Significance F 15613308 228。4445 7.53E-05 Lower 95% -1402.71 -4。262 Upper 95% 1401.526 49.04184 4 273384。7 68346。19 6 31500000 标准误差 t Stat P—value 0.999122 Coefficients —0。591 505。0042 —0。00117 22。386 9。6004 2.331791 0。080095 327.6717 98。79792 3。316585 0。029472 53。37 601。9787 早稻收获量对春季降雨量和春季温度的二元线性回归方程为:
(2)回归系数 表示,降雨量每增加1mm,小麦收获量平均增加22。3865kg/hm2;回归系数 表示,温度每增加1 ,小麦收获量平均增加327。6717kg/mh2.
(3)从降雨量和温度与收获量的关系看,两个变量与收获量之间都存在较强的关系,而且温度与降雨量之间也存在较强的关系,因此,模型中可能存在多重共线性.
9。6 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值( )、房产的评估价值( )和使用面积( )建立一个模型,以便对销售价格作出合理预测.为此,收集了20栋住宅的房地产评估数据
房地产编号 销售价格y(元/㎡) 地产估价(万元) 房产估价(万元) 1 2 60 4850 596 900 4497 2780 使用面积(㎡) 18730 9280 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 5550 6200 11650 4500 3800 8300 5900 4750 4050 4000 9700 4550 4090 8000 5600 3700 5000 2240 950 1000 1800 850 800 2300 810 900 730 800 2000 800 800 1050 400 450 340 150 3144 3959 7283 2732 2986 4775 3912 2935 4012 3168 5851 2345 20 5625 2086 2261 3595 578 11260 12650 22140 9120 90 18030 12040 17250 10800 15290 24550 11510 11730 19600 13440 9880 10760 9620 用Excel进行回归,回答下面的问题: (1)写出估计的多元回归方程。
(2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
(3)检验回归方程的线性关系是否显著(a=0.05).
(4)检验各回归系数是否显著(a=0。05). 详细答案:
(1)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 Intercept X Variable 1 X Variable 2 X Variable 3 Coefficients 148。7005 0。814738 df 3 16 19 0.947362 0。7496 0。878276 791.6823 20 SS 87803505 MS 29267835 F 46.69697 Lower 95% Significance F 3.88E—08 Upper 95% 10028175 626760。9 97831680 标准误差 574.4213 t Stat 0。25887 P—value 0.799036 0.131099 —1069.02 1366。419 -0。27063 1.900105 0.5119 1。591321 0。82098 0。211177 0。135041 0.065863 3.8876 0。001307 2.050322 0。057088 0.373305 1。2686 —0.00458 0。274665 估计的多元回归方程为: 。
(2)判定系数 ,调整的判定系数 。表明销售价格的总变差中,被估计的回归方程所解释的比例为87。83%。 (3)由于Significance F=3。88E—08
(4) 的P—Value=0。1311〉a=0。05,不显著; 的P-Value=0.0013 的P—Value=0。0571>a=0。05,不显著。 9.7 根据9。4题中的数据,回答下面的问题:
(1)a=0.01的水平下,检验二元回归模型线性关系的显著性。
(2)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗?
(3)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗? 详细答案:
(1)由于Significance F =0.001865 (2)的P-Value=0.0007 (3)的P-Value=0。0098
9。8 根据下面的数据回答下面的问题:
y 123。7 126。6 120。0 119.3 110。6 22.3 25.7 38.7 31.0 33.9 96.6 。4 44.0 66。4 49.1 130。3 131。3 114.4 128.6 108.4 112.0 115.6 108。3 126。3 124。6 28。3 30。2 21.4 30。4 32。6 33.9 23。5 27.6 39。0 31。6 85.2 80。4 90.5 77.1 51。1 50.5 85.1 65。9 49。0 69。6 (1)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?(a=0.05)
(2)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?(a=0。05)
(3)根据上面的结论,你认为 对预测y是否有用?
(4)用Excel进行回归,并对模型进行检验,所得的结论与(3)是否相同?(a=0。05)
(5)计算与之间的相关系数,所得结果意味着什么? 详细答案:
(1)由excel的“CORREL”函数计算的系数r=0。0025。 检验的统计量为:
取a=0。05, 。由于检验统计量 ,拒绝原假设。无证据表明二者之间存在线性关系。
(2)由excel的“CORREL”函数计算的系数r=0.4341。检验的统计量为:
取a=0。05, .由于检验统计量 ,拒绝原假设。无证据表明二者之间存在线性关系。
(3)由于、与y没有相关关系,所以用 对预测y没有用。 (4)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 Intercept X Variable 1 Coefficients df 0.999924 0.999847 0。999822 0.107155 15 SS 2 900。7222 12 14 标准误差 0.137787 MS 450.3611 0.011482 t Stat P-value F 39222.34 Lower 95% -46。4863 Significance F 1.28E—23 900。86 Upper 95% -43.822 -45.11 0。611418 —73。8515 2。53E—17 3。097008 0.012274 252。3137 1.01E-23 3.0702 3。123752 X Variable 2 1.031859 0.003684 280.07 2。E—24 1。023832 1.039886 由于Significance F=1。28E-23
(5)由excel的“CORREL”函数计算的系数r=-0.98,两个自变量之间高度负相关。
这意味着模型中存在多重共线性。
9.9 下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)
企业编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 销售价格y 1238 1266 1200 1193 1106 1303 1313 1144 1286 1084 1120 1156 1083 1263 购进价格 966 4 440 6 791 852 804 905 771 511 505 851 659 490 销售费用 223 257 387 310 339 283 302 214 304 326 339 235 276 390 15 1246 696 316 (1)计算y与、y与之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?
(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?
(3)用Excel进行回归,并检验模型的线性关系是否显著(a=0。05)。 (4)解释判定系数 ,所得结论与问题(2)中是否一致? (5)计算 与 之间的相关系数,所得结果意味着什么? (6)模型中是否存在多重共线性?你对模型有何建议? 详细答案:
(1)由excel的“CORREL”函数计算的系数 ; .检验的统计量分别为:
取a=0.05, 。由于检验统计量 , 。因此没有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系。 (2)没有用。
(3)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 0.593684 0.35246 0。244537 69.75121 15 方差分析 回归分析 残差 总计 Intercept X Variable 1 X Variable 2 df SS MS F 3.265842 Significance F 2 31778。15 158。08 12 58382。78 4865。232 14 Coefficients 标准误差 90160.93 t Stat 1.10663 0。073722 Lower 95% Upper 95% P-value 0.290145 0。0252 375.6018 339。4106 -363。91 1115。114 0。079317 0.002386 0.996365 2.912001 0。537841 0。210447 2。555711 1.457194 0。667707 2。182386 0。049681 回归方程为: .
由于Significance F=0。073722>a=0.05,线性关系不显著。 (4);。所得结论与问题(2)一致.
(5)由excel的“CORREL”函数计算的系数 ,两个自变量高度负相关。 (6)由于两个自变量高度负相关,可能存在多重共线性。建议将一个自变量从模型中剔除.
9.10 设因变量为y,一个数值型自变量 和一个具有两个水平(水平1和水平2)的分类型自变量。
(1)写出因变量y关于自变量和分类自变量的多元回归方程。 (2)对应于分类自变量水平1的y的期望值是多少? (3)对应于分类自变量水平2的y的期望值是多少? 详细答案:
(1) ,式中: 。 (2) 。 (3)
(4) , 是当 保持不变时,由于 变化一个单位引起 变化的数量。
9。11 一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运输费用作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15个路程大致相同、而货物类型不同的运输费用数据
每件产品的运输费用y(元) 17.2 11.1 12.0 10。9 13。8 6.5 10.0 11.5 7.0 8.5 2.1 1.3 3。4 7。5 货物类型 易碎品 易碎品 易碎品 易碎品 易碎品 易碎品 易碎品 易碎品 非易碎品 非易碎品 非易碎品 非易碎品 非易碎品 非易碎品 1 1 1 1 1 1 1 1 0 0 0 0 0 0 2.0 非易碎品 0 (1)写出运输费用与货物类型之间的线性方程。 (2)对模型中的回归系数进行解释。
(3)检验模型的线性关系是否显著(a=0.05)。 详细答案:
(1)由Excel输出的回归结果如下:
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 Intercept X Variable 1 Coefficients df 1 13 14 0。780195 0.608704 0.578604 3。042926 15 SS MS F 20.2229 Lower 95% 2.058179 Significance F 187.2519 187。2519 120.3721 9。259396 307。624 标准误差 t Stat 0.000601 P-value 0.001662 0.000601 Upper 95% 7.027535 4。2857 1。150118 3。949906 7。082143 1。5748 4。496988 3。679857 10。48443 运输费用与货物类型之间的线性方程为: .
(2) 表示,“易碎品\"的预期运输费用比非易碎品的预期运输费用多7.0821元.
(3)由于Significance F=0。000601
9。12 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下
性别(1=男,0=女) 月薪y(元) 工龄 18 1629 1011 1229 1746 1528 1018 1190 1551 985 1610 1432 1215 990 1585 3.2 3。8 2.7 3。4 3.6 4。1 3。8 3。4 3.3 3.2 3。5 2.9 3.3 2.8 3.5 1 1 0 0 1 1 0 0 1 0 1 1 0 0 1 用Excel进行回归,并对结果进行分析. 详细答案: 回归结果如下。
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归 残差 总计 Intercept X Variable 1 X Variable 2 Coefficients 732。06061 111。22016 458.68406 df 2 12 14 0.9433914 0。873 0.8716518 96.791578 15 SS 909488.42 112423.32 MS 4744。21 9368。6096 t Stat 3.1074246 1。29368 8.58019 P—value 0。00901 0.1487956 1。823E-06 F 48.539135 Significance F 1.773E-06 1021911。7 标准误差 235.58436 72。083424 53.458498 估计的回归方程为 。
调整的判定系数 ,表示在月薪的变差中能够被月薪与工龄和性别之
间的线性关系所解释的比例为87。179%,表明回归方程拟合的程度较高。估计标准误差 ,预测误差不大。
方差分析表显示,Significance F=1。773E-06〈 td〉
第10章 时间序列预测 10。1 下表是1981年-1999年国家财政用于农业的支出额数据 年份 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 支出额(亿元) 110.21 120.49 132。87 141.29 153.62 184.2 195。72 214.07 265.94 307.84 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 支出额(亿元) 347.57 376.02 440。45 532.98 574.93 700.43 766。39 11.76 1085。76 (1)绘制时间序列图描述其形态。 (2)计算年平均增长率. (3)根据年平均增长率预测2000年的支出额。 详细答案: (1)时间序列图如下: 从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势. (2)年平均增长率为: 。 (3) 。 10。2 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2) 年份 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 单位面积产量 1451 1372 1168 1232 1245 1200 1260 1020 1095 1260 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 单位面积产量 1215 1281 1309 1296 1416 1367 1479 1272 1469 1519 (1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。 (3)采用指数平滑法,分别用平滑系数a=0.3和a=0。5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案: (1)时间序列图如下: (2)2001年的预测值为: | (3)由Excel输出的指数平滑预测值如下表: 指数平滑预测 年份 单位面积产量 a=0.3 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 1996 1451 1372 1168 1232 1245 1200 1260 1020 1095 1260 1215 1281 1309 1296 1416 1367 误差平方 a=0.5 指数平滑预测 误差平方 1451。0 1427。3 1349。5 1314。3 1293。5 1265。4 1263。8 1190。7 1162。0 1191。4 1198。5 1223。2 1249.0 1263。1 1308。9 6241.0 67236。5 13808.6 4796。5 8738.5 29.5 59441.0 9151.5 9611。0 558.1 6812.4 7357。6 2213.1 23387.7 3369.9 1451.0 1411.5 12.8 1260.9 1252.9 1226.5 1243.2 1131.6 1113。3 1186。7 1200。8 1240。9 1275。0 1285。5 1350.7 6241.0 59292。3 3335。1 252。0 2802.4 1124.3 49833.6 1340。8 21518.4 803。5 27。7 4635.8 442。8 17035。9 2。4 1997 1998 1999 2000 合计 1479 1272 1469 1519 — 1326.4 1372。2 1342.1 1380。2 — 23297。7 10031.0 16101。5 19272。1 291455.2 1358。9 1418.9 1345。5 1407.2 — 14431.3 215。8 15260。3 12491。7 239123.0 2001年a=0.3时的预测值为: a=0。5时的预测值为: 比较误差平方可知,a=0。5更合适。 10。3 下面是一家旅馆过去18个月的营业额数据 月份 1 2 3 4 5 6 7 8 9 营业额(万元) 295 283 322 355 286 379 381 431 424 月份 10 11 12 13 14 15 16 17 18 营业额(万元) 473 470 481 449 4 601 587 4 660 (1)用3期移动平均法预测第19个月的营业额。 (2)采用指数平滑法,分别用平滑系数a=0。3、a=0。4和a=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适? (3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。 详细答案: (1)第19个月的3期移动平均预测值为: (2) 营业额 月份 1 2 3 4 5 6 7 8 9 10 11 12 13 14 295 283 322 355 286 379 381 431 424 473 470 481 449 4 a=0。3 295。0 291。4 300.6 316。9 307.6 329.0 344.6 370。5 386。6 412.5 429.8 445.1 446。3 144.0 936.4 2961。5 955.2 5093.1 2699。4 7459.6 2857.8 7468。6 3305.6 2626。2 15。0 97。4 预测 误差平方 a=0.4 295.0 290。2 302。9 323。8 308。7 336。8 3.5 385.1 400。7 429.6 445。8 459。9 455.5 144。0 1011。2 2712。3 1425.2 4949。0 19。5 5856.2 1514。4 5234.4 1632.9 1242.3 117。8 7830.2 预测 误差平方 a=0.5 295。0 2.0 305.5 330。3 308。1 343。6 362.3 396。6 410.3 441。7 455。8 468.4 458。7 144。0 10.0 2450.3 1958。1 5023。3 1401.6 4722。3 748.5 3928。7 803。1 633.5 376.9 7274。8 预测 误差平方 15 16 17 18 合计 601 587 4 660 — 475.6 513。2 535.4 567。9 — 15724.5 43.2 11803.7 8473。4 87514.7 490.9 534.9 555.8 591.1 — 12120.5 2709。8 7785。2 4752.7 62992。5 501。4 551.2 569.1 606.5 - 9929。4 1283。3 5611。7 2857。5 50236 由Excel输出的指数平滑预测值如下表: a=0.3时的预测值: ,误差均方=87514。7。 a=0.4时的预测值: ,误差均方=62992.5.。 a=0.5时的预测值: ,误差均方=50236. 比较各误差平方可知,a=0。5更合适。 (3)根据最小二乘法,利用Excel输出的回归结果如下: 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 df 0.9673 0.9356 0.9316 31。6628 18 SS MS F Significance F 回归分析 残差 总计 1 232982.5 232982.5 232。3944 1002.53 5.99E—11 Upper 16 16040。49 17 249022。9 Coefficients 标准误差 t Stat P-value Lower 95% 95% Intercept X Variable 1 239。73203 15。57055 21.928793 15.3965 5.16E—11 206.7239 272.7401 1.438474 15。24449 5。99E-11 18。87936 24。97822 .估计标准误差 。 10。4 下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出额数据 年份 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 支出(万元) 171。36 196.96 223。 263.17 316。70 379。93 402.75 486。10 553。33 617.29 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 支出(万元) 708。00 792.96 957.77 1278。18 1467。06 1704.25 1903.59 21。38 2408.06 2736.88 (1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额. 详细答案: (1)趋势图如下: (2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。经线性变换后,利用Excel输出的回归结果如下: 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计 df 0。998423 0.996849 0。996674 0。022125 20 SS 1 2。787616 18 MS 2.787616 F 5694.885 Significance F 5。68E—24 0.008811 0。0004 19 2。7927 Intercept X Variable 1 Coefficients 标准误差 t Stat 210.5269 P-value 5.55E-32 Lower 95% Upper 95% 2。163699 0。010278 2.142106 2。185291 0。062942 0.0667 0.0745 0。000858 75。446 5.68E—24 , ; , .所以,指数曲线方程为: . 2001年的预测值为: . 10.5 我国19年~1999年的纱产量数据如下(单位:万吨): 年份 19 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 纱产量 97。0 130.0 156。5 135.2 137.7 180.5 205.2 190.0 188.6 196.7 180.3 210。8 年份 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 纱产量 196.0 223。0 238.2 263.5 292。6 317。0 335。4 327。0 321。9 353.5 397.8 436.8 年份 1988 19 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 纱产量 465.7 476。7 462.6 460.8 501。8 501.5 4.5 2。3 512.2 559。8 2。0 567.0 (1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2000年的产量。 详细答案: (1)趋势图如下: (2)从图中可以看出,纱产量具有明显的线性趋势.用Excel求得的线性趋势方程为: 2000年预测值为: =585。65(万吨). 13.6 对下面的数据分别拟合线性趋势线 、二阶曲线 和阶次曲线 。并对结果进行比较。 时间t 1 2 3 4 5 6 7 8 9 10 11 12 观测值Y 372 370 374 375 377 377 374 372 373 372 369 367 时间t 19 20 21 22 23 24 25 26 27 28 29 30 观测值Y 360 357 356 352 348 353 356 356 356 359 360 357 13 14 15 16 17 18 367 365 363 359 358 359 31 32 33 34 35 357 355 356 363 365 详细答案: 在求二阶曲线和三阶曲线时,首先将其线性化,然后用最小二乘法按线性回归进行求解。用Excel求得的趋势直线、二阶曲线和三阶曲线的系数如下: 直线 Intercept X Variable 1 374。1613 -0.6137 二阶曲线 Intercept X Variable 1 X Variable 2 381。42 -1。8272 0.0337 三阶曲线 Intercept X Variable 1 X Variable 2 X Variable 3 372.5617 1.0030 —0.1601 0.0036 各趋势方程为: 线性趋势: 二阶曲线: 三阶曲线: 。 根据趋势方程求得的预测值和预测误差如下表: 直线 观测值Y 时间t 预测 误差平方 预测 误差平方 预测 误差平方 二阶曲线 三阶曲线 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 372 370 374 375 377 377 374 372 373 372 369 367 367 365 363 359 358 359 360 357 356 352 348 373。5 372。9 372。3 371.7 371。1 370。5 369.9 369。3 368.6 368。0 367.4 366。8 366。2 365.6 365.0 3。3 363.7 363.1 362。5 361.9 361.3 360.7 360.0 2.4 8.6 2.8 10。8 34.9 42.5 17。1 7。6 19.0 15。8 2。5 0。0 0。7 0。3 3.8 28.5 32.8 16.9 6.3 23。9 27。8 75。0 145。1 379。9 378.1 376。5 374.9 373。4 371。9 370。5 369.2 367。9 366。7 365.6 3.6 363。6 362.7 361.8 361.0 360。3 359。7 359.1 358。6 358.1 357。8 357.5 61。6 66.0 6。1 0。0 13.3 26.1 12。2 7.9 25。7 27.6 11.4 5.9 11.6 5。4 1。4 4.2 5.4 0。5 0.8 2。5 4。6 33。2 。3 373.4 374.0 374。2 374。2 374.0 373。6 373。0 372。2 371.2 370.2 369.0 367。7 366。4 365.1 363。7 362.3 361.0 359。7 358.4 357.3 356.3 355.4 3.6 2.0 15.6 0.1 0。6 8。9 11。6 1。1 0.0 3.1 3.3 0.0 0。6 0.3 0。0 0。5 11.1 8。9 0。5 2。4 0.1 0.1 11.3 43.7 24 25 26 27 28 29 30 31 32 33 34 35 合计 353 356 356 356 359 360 357 357 355 356 363 365 - 359.4 358.8 358.2 357。6 357。0 356.4 355。7 355.1 3。5 353。9 353.3 352.7 — 41。4 7.9 4.9 2.5 4.1 13.2 1.6 3.5 0.2 4。4 94。2 151。8 8.9 357。2 357.0 356。9 356.9 356.9 357。0 357.2 357。4 357。7 358.1 358.5 359。0 — 17.7 1。1 0。9 0.8 4.4 9。0 0.0 0.2 7。2 4.2 20。4 36。2 524。7 3.0 353。7 353。5 353.6 353。9 3。5 355.5 356。7 358。3 360.3 362。7 365。4 — 1.1 5.5 6.3 5。9 25.8 29。8 2。3 0。1 11.0 18.4 0。1 0.2 232。1 不同趋势线预测的标准误差如下: 直线: 二阶曲线: 三阶曲线: 比较各预测误差可知,直线的误差最大,三阶曲线的误差最小. 从不同趋势方程的预测图也可以看出,三阶曲线与原序列的拟合最好。 10。7 下表是1981—2000年我国的原煤产量数据 年份 原煤产量(亿吨) 年份 原煤产量(亿吨) 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 6。22 6.66 7。15 7. 8.72 8。94 9。28 9。80 10. 10.80 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 10.87 11.16 11。50 12。40 13。61 13.97 13.73 12。50 10。45 9。98 (1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的产量。 详细答案: (1)原煤产量趋势图如下: 从趋势图可以看出,拟合二阶曲线比较合适。 (2)用Excel求得的二阶曲线趋势方程为: 2001年的预测值为: 。 10。8 一家贸易公司主要经营产品的外销业务,为了合理地组织货源,需要了解外销订单的变化状况。下表是1997-2001年各月份的外销定单金额(单位:万元). 年/月 1 2 3 4 5 6 7 8 9 10 11 12 1997 .3 46.6 62.6 58。2 57.4 56.6 56.1 52.9 .6 51。3 。8 52.1 1998 49。1 50.4 59.3 58.5 60.0 55.6 58。0 55.8 55.8 59.8 59。4 55.5 1999 56.7 52.0 61.7 61。4 62.4 63。6 63。2 63.9 63。2 63。4 。4 63。8 2000 。4 。5 68.0 71.9 69.4 67.7 68。0 66。3 67.8 71。5 70。5 69。4 2001 61.1 69.4 76。5 71。6 74.6 69.9 71。4 72.7 69.9 74。2 72.7 72.5 (1)根据各年的月份数据绘制趋势图,说明该时间序列的特点。 (2)要寻找各月份的预测值,你认为应该采取什么方法? (3)选择你认为合适的方法预测2002年1月份的外销订单金额。 详细答案: (1)趋势图如下: 从趋势图可以看出,每一年的各月份数据没有趋势存在,但从1997-2001年的变化看,订单金额存在一定的线性趋势. (2)由于是预测各月份的订单金额,因此采用移动平均法或指数平滑法比较合适。 (3)用Excel采用12项移动平均法预测的结果为: 。 用Excel采用指数平滑法(a=0。4)预测的预测结果为: . 10.9 1993-2000年我国社会消费品零售总额数据如下(单位:亿元) 月/年 1 2 3 4 5 6 7 8 9 10 11 12 1993 1994 1995 1996 1909.1 1997 2288.5 1998 29.5 1999 2662.1 2000 2774.7 977。5 1192。2 1602.2 2.5 942.3 941.3 1162。7 1491.5 1167.5 1533.3 1911.2 2213。5 2306.4 2538。4 2805。0 1860.1 2130。9 2279.7 2403.1 2627.0 2572.0 2637.0 1170。4 18.7 18。8 2100。5 2252。7 2356.8 962。2 1213。7 1585。4 18。3 2108.2 2265。2 23.0 1005。7 1281。1 1639。7 1966.0 21.7 2326.0 2428.8 25。0 963。8 1251。5 1623。6 1888。7 2102.5 959.8 1286.0 2286.1 2380。3 2597。0 1637.1 1916。4 2104。4 2314.6 2410。9 2636。0 1023。3 1396。2 1756。0 2083.5 2239。6 2443.1 2604。3 28。0 1051。1 1444。1 1818.0 2148。3 2348.0 1102.0 1553.8 1935.2 2536.0 2743。9 3029.0 2290.1 24。9 2652.2 2781。5 3108.0 1415.5 1932。2 23。5 2848.6 2881。7 3131。4 3405。7 3680。0 (1)绘制时间序列线图,说明该序列的特点。 (2)利用分解预测法预测2001年各月份的社会消费品零售总额。 详细答案: (1)趋势图如下: 从趋势图可以看出,我国社会消费品零售总额的变具有明显的季节变动和趋势。 (2)利用分解法预测的结果如下: 时间编号 2001年/月 1 2 3 4 5 6 7 8 9 10 11 12 97 98 99 100 101 102 103 104 105 106 107 108 1.0439 0。9939 0。9593 0.9398 0。9439 0。95 0。9287 0.9261 0。9814 1。0075 1.0472 1。2694 3056。30 3077.50 3098。71 3119.92 3141.13 3162。33 3183. 3204。75 3225。96 3247。16 3268。37 32。58 3190。48 3058。87 2972.48 2931.99 29.88 3032。30 2956。43 2967.86 3166.05 3271.51 3422.77 4175.95 季节指数 回归预测值 最终预测值 10.10 1995年~2000年北京市月平均气温数据如下(单位: ): 月/年 1 2 3 4 1995 -0。7 2。1 7.7 14.7 1996 —2.2 -0。4 6.2 14。3 1997 -3.8 1.3 8。7 14。5 1998 -3。9 2。4 7。6 15。0 1999 —1。6 2。2 4.8 14.4 2000 —6。4 -1.5 8.1 14.6 5 6 7 8 9 10 11 12 19.8 24.3 25。9 25.4 19。0 14.5 7.7 -0.4 21.6 25.4 25.5 23.9 20。7 12.8 4.2 0.9 20.0 24。6 28.2 26。6 18.6 14。0 5.4 -1.5 19。9 23。6 26。5 25.1 22。2 14。8 4.0 0.1 19。5 25。4 28。1 25。6 20。9 13.0 5.9 —0.6 20。4 26。7 29.6 25.7 21。8 12.6 3。0 -0。6 (1)绘制年度折叠时间序列图,判断时间序列的类型。 (2)用季节性多元回归模型预测2001年各月份的平均气温。 详细答案: (1)年度折叠时间序列图如下: 从年度折叠时间序列图可以看出,北京市月平均气温具有明显的季节变动。由于折线图中有交叉,表明该序列不存在趋势。 (2)季节性多元回归模型为: 设月份为 。则季节性多元回归模型为: 虚拟变量为: , ,……, 。 由Excel输出的回归结果如下: 系数 b0 b1 M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 —0。2233 -0.0030 -2。7832 1。3365 7。5062 14.9092 20.52 25。3319 27。6349 25.7213 20。8743 13。9606 5。3803 季节性多元回归方程为: 2001年各月份平均气温的预测值如下: 虚拟变量 时间 年/月 M1 73 74 75 76 1 0 0 0 M2 0 1 0 0 M3 0 0 1 0 M4 0 0 0 1 M5 0 0 0 0 M6 0 0 0 0 M7 0 0 0 0 M8 0 0 0 0 M9 0 0 0 0 M10 0 0 0 0 M11 0 0 0 0 -3。2 0.9 7。1 14.5 预测 1 2 3 4 5 6 7 8 9 10 11 12 77 78 79 80 81 82 83 84 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 20.1 24。9 27。2 25。3 20。4 13.5 4.9 -0.5 10.11 下表中的数据是一家大型百货公司最近几年各季度的销售额数据(单位:万元).对这一时间序列的构成要素进行分解,计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。 年/季 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 1 993.1 1673。6 2342.4 32。4 3904.2 83。2 5123。6 4942.4 5009.9 6059。3 2 971。2 1931.5 2552。6 4245。2 5105。9 5997.3 6051。0 6825.5 6257.9 5819.7 3 22。1 3927.8 3747。5 5951。1 7252.6 8776.1 9592。2 00。1 8016.8 7758。8 4 1943。3 3079.6 4472.8 6373.1 8630.5 8720.6 8341.2 8723。1 7865.6 8128。2 详细答案: 各季节指数如下: 1季度 季节指数 0.7517 2季度 0。8513 3季度 1。2343 4季度 1.1627 季节变动图如下: 根据分离季节因素后的数据计算的趋势方程为: 。 10。12 下表中的数据是一家水产品加工公司最近几年的加工量数据(单位:t).对该序列进行分解,计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。 年/月 1 2 3 4 5 6 7 8 9 10 1997 78。8 78。1 84。0 94。3 97。6 102。8 92。7 41.6 109。8 127.3 1998 91。9 92。1 80.9 94。5 101.4 111。7 92。9 43.6 117。5 153。1 1999 90.4 100.1 114。1 108.2 125。7 118。3 .1 46。1 132。1 173。9 2000 66。8 73.3 85。3 94.6 74.1 100.8 106.7 44。0 132。1 162。5 2001 99.5 80。0 108。4 118.3 126.8 123。3 117。2 42.0 150。6 176。6 11 12 210。3 242.8 229。4 286。7 273。3 352。1 249.0 330。8 249.2 320.6 详细答案: 各月季节指数如下: 1月 0.6744 7月 0。7552 2月 0.6699 8月 0.3449 3月 0.7432 9月 0.9619 4月 0。7903 10月 1.1992 5月 0。8061 11月 1。8662 6月 0.8510 12月 2。3377 季节变动图如下: 根据分离季节因素后的数据计算的趋势方程为: 。 返回首
页
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- xiaozhentang.com 版权所有 湘ICP备2023022495号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务