风险管理课后习题对上海某个商业区企业进行随机抽样,选择样本容量为140,根据调查所得数据,整理出他

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
企业风险管理第一章.ppt 163页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:120 &&
你可能关注的文档:
··········
··········
“现代金融理论有三大支柱,依次为资本的时间价值、资产定价和风险管理”。
——97年诺贝尔经济学奖得主Robert Merton
第一章 企业风险管理基础
1.1风险的定义:
(1)风险是可测定的不确定性,是指经济主体的信息虽然不充分,但恶意对未来可能出现的各种情况给定一个概率值。
(2)险是发生某种影响目标完成的事件的不确定性。
(一)按风险的对象划分: 1、财产风险──通常指财产的损毁、灭失与贬值等所导致的风险。如厂房、设备、运载工具、家庭住宅、家具及其它无形财产因自然灾害或意外事故而遭受的损失。 2、人身风险──指由于人的疾病、伤残、死亡所引起的风险。 3、责任风险──指根据法律、合同或道义上的规定应对他人的财产损失或人身伤亡承担经济赔偿责任的风险。 4、信用风险──在经济交往中,权利人与义务人之间由于一方违约或犯罪而使对方蒙受经济损失的风险。
(二)按风险产生的原因划分: 1、自然风险──由于自然现象、物理现象可能造成物质损毁和人员伤亡的风险。 2、社会风险──指由于个人或团体的行为,包括过失、行为不当及故意行为所导致的风险。 3、经济风险—— 一般指在商品生产和购销过程中,由于经营管理不善、市场预测失误、价格波动、消费需求变化等因素引起经济损失的风险。 4、政治风险── 指起源于种族、宗教、国家之间的冲突、叛乱、战争所引起的,风险,也包括由于政策或制度的变化、政权的更替、罢工、恐怖主义活动等引起的各种损失。 5、技术风险──由于科学技术发展的负作用而带来的各种风险。
(三)按风险的性质划分 1、纯粹风险──指只有损失可能而无获利机会 的风险。
2、投机风险──指既有损失可能又有获利机会 的风险。
(四)按风险产生的环境划分 1、静态风险──不是因社会经济活动发生变化, 而是由于自然力不规则变动或人们行为的失误所 造成的风险,前者如地震、洪水、台风、疾病 等;后者如盗窃、呆帐、事故等。 2、动态风险──是指以社会经济的变动为直接原 因的风险。如经济体制的改变、市场结构的调整、 利率的变动等可能引发的风险。
(五)按面临风险的经济单位分
1、个人风险
2、家庭风险
3、企业风险
4、社会风险
5、国家风险
(六)按承受风险的能力划分 可接受的风险是指经济单位在研究自身承受能力、 财务状况基础上,确认能够接受最大损失的限度, 把低于这一限度的风险称为可接受风险;反之既为 不可接受风险。
1.3 风险管理的概念
1.3.1定义:风险管理是各经济单位通过风险识别、风险衡量、风险评价、风险应对等方式,对风险实施有效控制和妥善处理损失的过程。
1.4 企业全面风险管理战略的定义
全面风险管理战略是根据企业整体经营战略制定的全面风险管理的整体战略,目的是保证企业的风险最优化。
第二章 企业风险管理组织管理体系 2.1 风险管理组织体系和企业目标的关系
2.2 企业风险管理组织体系构成要素:
2)风险管理委员会和审计委员会
3)总经理(风险管理总监)
4)风险管理职能部门
5)其他职能部门及各业务单位
风险管理部与其他部门的合作: 第三章 企业风险管理文化
企业风险管理文化是蕴涵于企业文化之中的核心内容,是在风险管理活动中提炼、形成的集风险管理、风险价值观和风险防范的行为规范于一体的人文文化。
风险管理文化是企业可持续发展的思想保障和理念基础之一。 3.2 企业风险管理文化构成图
风险管理文化的构建需要遵循突出个性、统一和差别、求实和完善的基本原则,强化观念创新及与企业改革相适应。建设的关键要素包括:管理层的积极倡导与策划;科学合理的激励约束机制;信息获取与共享等。其建设路径选择应立足国情、全员参与、以人为本、强化研究、注重系统。 第四章 企业风险的识别和分析 4.1风险识别的概念
风险识别是指风险管理人员运用有关的知识和方法,系统、全面和连续地发现企业面临的财产、责任和人身损失风险。
风险识别实际上就是收集有关风险因素、风险事故和损失暴露等方面的信息发现导致潜在损失的因素。 4.2 风险识别的过程 1、发现或者调查风险源 2、减少风险因素增加的条件 3、预见危害或者危险 4、重视风险暴露 4.2 风险识别的方法 1.风险清单分析法 2.风险源分析法 3.财务报表分析法 4.流程分析法 5.因果分析法 6.层次分析法(A
正在加载中,请稍后...当前位置: >>
统计学课后习题答案 (1)
第 1 章 绪论1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3. .一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查 供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是 2 440 加仑的油漆罐。这家 零售商抽查了 50 罐油漆,每一罐的质量精确到 4 位小数。装满的油漆罐应为 4.536 kg。要 求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的 50 罐油漆; (4)推断:50 罐油漆的质量应为 4.536×50=226.8 kg。 4. “可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战 役因影视明星、 运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。 假定作为百 事可乐营销战役的一部分,选择了 1000 名消费者进行匿名性质的品尝试验(即在品尝试验 中,两个品牌不做外观标记),请每一名被测试者说出 A 品牌或 B 品牌中哪个口味更好。要 求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000 名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。第 2 章 统计数据的描述――练习题●1.为评价家电行业售后服务的质量,随机抽取了由 100 家庭构成的一个样本。服务质量的 等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2) 用 Excel 制作一张频数分布表;1 (3) 绘制一张条形图,反映评价等级的分布。 解: (1)由于表 2.21 中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差 异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级 A B C D E 合计 家庭数(频数) 14 21 32 18 15 100 频率% 14 21 32 18 15 100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图 表向导→条形图→选择子图表类型→完成(见 Excel 练习题 2.1)。即得到如下的条形图:E D C B A 0 20 40服务质量等 级评价的频 数分布 频 率% 服务质量等 级评价的频 数分布 家庭 数(频数)●2.某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下(单位:万元) : 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在 125 万元以上为先进企业,115 万~125 万元为良好企业, 105 万~115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般 企业、落后企业进行分组。 解: (1)要求对销售收入的数据进行分组, 全部数据中,最大的为 152,最小的为 87,知数据全距为 152-87=65; 为便于计算和分析,确定将数据分为 6 组,各组组距为 10,组限以整 10 划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值 87 可能落在最小组之下,最大值 152 可能落在最大组之上,将最小组和最大组设计成开口形 式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数――企业数,也 可以用 Excel 进行排序统计(见 Excel 练习题 2.2), 将结果填入表内, 得到频数分布表如下 表中的左两列; 将各组企业数除以企业总数 40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布, 由下至上逐组计算企业数的向上累积及频率的2 向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40 个企业按产品销售收入分组表 按销售收入分组 企业数 频率 (万元) (个) (%) 100 以下 100~110 110~120 120~130 130~140 140 以上 合计 5 9 12 7 4 3 40 12.5 22.5 30.0 17.5 10.0 7.5 100.0 向上累积 企业数 5 14 26 33 37 40 ― 频率 12.5 35.0 65.0 82.5 92.5 100.0 ― 向下累积 企业数 40 35 26 14 7 3 ― 频率 100.0 87.5 65.0 35.0 17.5 7.5 ―(2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属 40 个企分组表 按销售收入分组(万元) 先进企业 良好企业 一般企业 落后企业 合计 企业数(个) 11 11 9 9 40 频率(%) 27.5 27.5 22.5 22.5 100.0● 3.某百货公司连续 40 天的商品销售额如下(单位:万元) : 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 解:全部数据中,最大的为 49,最小的为 25,知数据全距为 49-25=24; 为便于计算和分析,确定将数据分为 5 组,各组组距为 5,组限以整 5 的倍数划 分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值 24 已落在最小组之中,最大值 49 已落在最大组之中,故将各组均设计成闭口形式; 按照“上限不在组内”的原则,用划记法或用 Excel 统计各组内数据的个数―― 天数,(见 Excel 练习题 2.3)并填入表内,得到频数分布表如下表中的左两列; 将各组天数除以总天数 40,得到各组频率,填入表中第三列; 得到频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元) 25~30 30~35 35~40 40~45 45~50 频数(天) 4 6 15 9 6 频率(%) 10.0 15.0 37.5 22.5 15.03 合计40100.0直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图表向导→柱 形图→选择子图表类型→完成。即得到如下的直方图:(见 Excel 练习题 2.3)40 30 20 10 025303540●4.为了确定灯泡的使用寿命(小时) ,在一批灯泡中随机抽取 100 只进行测试,所得结果 如下: 700 706 708 668 706 694 688 701 693 716 715 729 710 692 690 689 671 697 728 712 694 693 691 736 683 718 664 719 722 681 697 747 689 685 707 681 685 691 695 674 699 696 702 683 721 709 708 685 658 682 651 741 717 720 691 690 706 698 698 673 698 733 677 684 692 661 666 700 749 713 712 679 705 707 735 696 710 708 676 683 695 718 701 665 698 722 727 702 692 691713 699 725 726 704 729 703 696 717 688 (1)利用计算机对上面的数据进行排序; (2)以组距为 10 进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较。 解: (1)排序:将全部数据复制到 Excel 中,并移动到同一列,点击:数据→排序→确定, 即完成数据排序的工作。(见 Excel 练习题 2.4) (2)按题目要求,利用已排序的 Excel 表数据进行分组及统计,得到频数分布表如下: (见 Excel 练习题 2.4) 100 只灯泡使用寿命非频数分布 按使用寿命分组(小时) 灯泡个数(只) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 2 5 6 14 26 18 13 10 3 3 频率(%) 2 5 6 14 26 18 13 10 3 3445某百货公司 日商品销售 额分组表 频 数(天) 某百货公司 日商品销售 额分组表 频 率(%)30354045 ~~~~~50 合计100100制作直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,选择全表后,点 击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图: (见 Excel 练习题 2.4)30 25 20 15 10 5 0(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个 位数按由小到大的顺序填入相应行中,即成为叶, 得到茎叶图如下: 65 66 67 68 69 70 71 72 73 74 1 1 1 1 0 0 0 0 3 1 8 4 3 1 0 0 0 1 5 40~ 67 660 0~ 69 680 0~ 71 700 0~ 73 720 0~ 74 065100只灯泡 使用寿命非 频数分布 灯泡个数 100只灯泡 使用寿命非 频数分布 频率(%)5 4 2 1 1 2 2 6 76 6 3 1 1 2 28 7 3 1 2 3 59 3 1 2 3 64 2 3 5 75 2 4 6 85 2 5 7 95 3 6 7 98 3 6 88 4 6 89 9 4 5 5 6 6 6 7 7 8 8 8 8 9 9 7 7 8 8 8 9 9将直方图与茎叶图对比,可见两图十分相似。 ●5.下面是北方某城市 1~2 月份各天气温的记录数据: -3 2 -4 -7 -11 -1 7 8 9 -14 -18 -15 -9 -6 -1 0 5 -4 -6 -8 -12 -16 -19 -15 -22 -25 -24 -8 -6 -15 -11 -12 -19 -25 -24 -18 -14 -22 -13 -9 -6 0 -1 5 -4 -3 2 -4 -4 -16 -1 7 5 -6-6 -9 -19 -17 -9 -5-7 -3 -21 -24 -3(1) 指出上面的数据属于什么类型; (2) 对上面的数据进行适当的分组; (3) 绘制直方图,说明该城市气温分布的特点。 解: (1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且 0 不表示没有, 因此是定距数据。 (2)分组如下: 由于全部数据中,最大的为 9,最小的为-25,知数据全距为 9-(-25)=34;5 为便于计算和分析, 确定将数据分为 7 组, 各组组距为 5, 组限以整 5 的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值- 25 已落在最小组之中,最大值 9 已落在最大组之中,故将各组均设计成闭口形式; 按照“上限不在组内”的原则,用划记法(或 Excel 排序法,见 Excel 练习题 2.5)统计各组 内数据的个数――天数,并填入表内,得到频数分布表如下表; 北方某城市 1~2 月份各天气温 分组 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计 天数(天) 8 8 10 14 14 4 7 65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图表向导 →柱形图→选择子图表类型→完成。即得到如下的直方图:(见 Excel 练习题 2.5)北方某城市1~2月份各天气温 天数 (天) 15 10 5 0 北方某城市1 ~2月份各天 气温 天数 (天)-2 5~ -2 0 -1 5~ -1 0-5 ~0●6.下面是某考试管理中心对 2002 年参加成人自学考试的 12000 名学生的年龄分组数据: 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 年龄 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图; (2) 从直方图分析成人自学考试人员年龄分布的特点。 解: (1)制作直方图:将上表复制到 Excel 表中,点击:图表向导→柱形图→选择子图表 类型→完成。即得到如下的直方图:(见 Excel 练习题 2.6)5~ 106 % 40 35 30 25 20 15 10 5 0%(2)年龄分布的特点:自学考试人员年龄的分布为右偏。 7.下面是 A、B 两个班学生的数学考试成绩数据: A 班: 44 57 59 60 61 61 62 63 63 66 66 67 69 70 70 71 72 73 73 74 74 74 75 75 75 75 75 76 77 77 77 78 78 79 80 80 85 85 86 86 90 92 92 92 93 B 班: 35 39 40 44 44 48 51 52 52 55 56 56 57 57 57 58 59 60 61 62 63 64 66 68 68 70 70 71 73 74 74 79 81 82 83 83 85 90 91 91 94 95 96 100 10018 ~1 9 21 ~2 1 22 ~2 4 25 ~2 9 30 ~3 4 35 ~3 9 40 ~4 4 45 ~5 965 73 76 82 96 54 61 71 84 100(1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。 解: (1)将树茎放置中间,A 班树叶向左生长,B 班树叶向右生长,得茎叶图如下:A班 数据个数 树 叶 树茎 B班 树叶 数据个数0 1 2 11 23 7 6 04 97
2203 4 5 6 7 8 9 1059 688 345 2 4 12 9 8 6 6 3(2)比较可知:A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比 A 班分散,且平均成绩较 A 班低。 8.1997 年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各 城市平均相对湿度的分布特征。 月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安7 1 49 70 76 57 77 72 79 65 2 41 68 71 57 75 80 83 65 3 47 50 77 68 81 80 81 58 4 50 39 72 67 75 84 79 61 5 55 56 68 63 71 83 75 58 6 57 54 73 57 74 87 82 72 7 69 70 82 74 81 86 84 84 8 74 79 82 71 73 84 78 74 9 68 66 71 67 71 81 75 77 10 47 59 75 53 72 80 78 76 11 66 59 82 77 78 72 78 71 12 56 57 82 65 82 75 82 71 资料来源: 《中国统计年鉴 1998》 ,中国统计出版社 1998,第 10 页。 解:箱线图如下: (特征请读者自己分析)各城市相对湿度箱线图9551 41 49 46 41 43 58 57 55 45 53 5267 67 74 70 58 42 62 55 65 65 73 728575655545M in-M ax 25%-75%35北京长春南京郑州武汉广州成都昆明兰州西安M edian value●9.某百货公司 6 月份各天的销售额数据如下(单位:万元) : 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)计算该百货公司日销售额的均值、中位数和四分位数; (2)计算日销售额的标准差。 解: (1)将全部 30 个数据输入 Excel 表中同列,点击列标,得到 30 个数据的总和为 8223, 于是得该百货公司日销售额的均值:(见 Excel 练习题 2.9)x=? x = (万元)n30或点选单元格后,点击“自动求和”→“平均值” ,在函数 EVERAGE()的空格中 输入“A1:A30” ,回车,得到均值也为 274.1。 在 Excel 表中将 30 个数据重新排序,则中位数位于 30 个数据的中间位置,即靠 中的第 15、第 16 两个数 272 和 273 的平均数: Me=272 ? 273 =272.5(万元) 2由于中位数位于第 15 个数靠上半位的位置上,所以前四分位数位于第 1~第 158 个数据的中间位置(第 8 位)靠上四分之一的位置上, 由重新排序后的 Excel 表中第 8 位是 261,第 15 位是 272,从而: QL=261+273 ? 272 =261.25(万元) 4同理,后四分位数位于第 16~第 30 个数据的中间位置(第 23 位)靠下四 分之一的位置上,由重新排序后的 Excel 表中第 23 位是 291,第 16 位是 273,从而: QU=291-273 ? 272 =290.75(万元) 。 4(2)未分组数据的标准差计算公式为:? ( x ? x)s=i ?1 i302n ?1利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算 30 个数据的离差 平方,并将其求和,()再代入公式计算其结果:得 s=21.1742。(见 Excel 练习题 2.9) 我们可以利用 Excel 表直接计算标准差: 点选数据列(A 列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“” ,选择 “其它函数”→选择函数“STDEV” →“确定” ,在出现的函数参数窗口中的 Number1 右 边的空栏中输入:A1:A30,→“确定” ,即在 A 列最末空格中出现数值:21.17412,即为 这 30 个数据的标准差。于是: 。(见 Excel 练习题 2.9) s ? 21.17 (万元) ●10.甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 单位成本 总成本(元) 名称 (元) 甲企业 乙企业 A 15
比较哪个企业的总平均成本高?并分析其原因。 解:设产品单位成本为 x,产量为 f,则总成本为 xf, 由于:平均成本 x =? xf ?f=总成本 ,而已知数据中缺产量 f 的数据, 总产量又因个别产品产量 f =该产品成本 xf = 该产品单位成本 x从而 x =? xf xf ?x,于是得:甲企业平均成本=? xf xf ?x=2100 ? 3000 ? 1500 =19.41(元) , 00 ? ? 15 20 309 乙企业平均成本=? xf xf ?x=3255 ? 1500 ? 1500 =18.29(元) , 00 ? ? 15 20 30对比可见,甲企业的总平均成本较高。 原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占 比重较大,因此拉低了总平均成本。 ●11.在某地区抽取的 120 家企业按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200~300 300~400 400~500 500~600 600 以上 19 30 42 18 11120 合计 计算 120 家企业利润额的均值和标准差。 解:设各组平均利润为 x,企业数为 f,则组总利润为 xf, 由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得: 按利润额分组(万元) 200~300 300~400 400~500 500~600 600 以上 合计 于是,120 家企业平均利润为: 组中值 x 250 350 450 550 650 ― 企业数(个) f 19 30 42 18 11 120 总利润 xf
x=? xf ?fs==51200 = 426.67(万元) ; 120分组数据的标准差计算公式为:? ( x ? x) f ? f ?12 i手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式: 列表计算如下 组中值 x 250 350 450 550 650 企业数(个) f 19 30 42 18 11 (x-426.67)2f 1
2 910 合计2120表格中(x-426.67) f 的计算方法: 方法一: 将表格复制到 Excel 表中, 点击第三列的顶行单元格后, 在输入栏中输入: =(a3 -426.67)* (a3-426.67)*b3,回车,得到该行的计算结果; 点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时, 压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开, 则各组数据的(x-426.67)2f 计算完毕; 于是得标准差:(见 Excel 练习题 2.11) s=? ( x ? x) f ? f ?12 i= =116.48(万元) 。 120 ? 1点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。 方法二:将各组组中值 x 复制到 Excel 的 A 列中,并按各组次数 f 在同列中复制,使该 列中共有 f 个 x,120 个数据生成后,点选 A 列的最末空格,再点击菜单栏中“∑”符号右 边的小三角“” ,选择“其它函数”→选择函数“STDEV” →“确定” ,在出现的函数参 数窗口中的 Number1 右边的空栏中输入:A1:A30,→“确定” ,即在 A 列最末空格中出现 数值:116.4845,即为这 120 个数据的标准差。(见 Excel 练习题 2.11) 于是得标准差: s =116.4845(万元) 。 ●12.为研究少年儿童的成长发育状况, 某研究所的一位调查人员在某城市抽取 100 名 7~17 岁的少年儿童作为样本, 另一位调查人员则抽取了 1000 名 7~17 岁的少年儿童作为样本。 请 回答下面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者 这两组样本的平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或 者这两组样本的标准差相同? (3)哪一位调查研究人员有可能得到这 1100 名少年儿童的最高者或最低者?或者对 两位调查研究人员来说,这种机会是相同的? 解: (1) (2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准 差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化 的范围就可能越大。 ●13.一项关于大学生体重状况的研究发现,男生的平均体重为 60 公斤,标准差为 5 公斤; 女生的平均体重为 50 公斤,标准差为 5 公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1 公斤=2.2 磅) ,求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在 55 公斤到 65 公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在 40 公斤到 60 公斤之间? 解: (1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组: 因为女生的离散系数为 V=s 5 = =0.1 x 50男生体重的离散系数为 V=s 5 = =0.08 x 6011 对比可知女生的体重差异较大。 (2) 男生: x =60公斤 5公斤 =27.27(磅) = ,s =2.27(磅) ; 2.2公斤 2.2公斤 50公斤 5公斤 =22.73(磅) = ,s =2.27(磅) ; 2.2公斤 2.2公斤女生: x = (3)68%; (4)95%。● 14.对 10 名成年人和 10 名幼儿的身高(厘米)进行抽样调查,结果如下: 166 169 172 177 180 170 172 174 168 173 成年组 68 69 68 70 71 73 72 73 74 75 幼儿组 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么? (2)比较分析哪一组的身高差异大? 解: (1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不 合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。 (2)利用 Excel 进行计算,得成年组身高的平均数为 172.1,标准差为 4.202,从而得: 成年组身高的离散系数: v s ?4.2 ? 0.024 ; 172 .1 2.497 ? 0.035 ; 71.3又得幼儿组身高的平均数为 71.3,标准差为 2.497,从而得: 幼儿组身高的离散系数: vs ?由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散 程度相对较大。 15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽 取 15 个工人, 让他们分别用三种方法组装。 下面是 15 个工人分别用三种方法在相同的时间 内组装的产品数量(单位:个) : 方法 A 方法 B 方法 C 164 167 168 165 170 165 164 168 164 162 163 166 167 166 165 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125(1) 你准备采用什么方法来评价组装方法的优劣?12 (2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:(1)下表给计算出这三种组装方法的一些主要描述统计量:方法 A 平均 中位数 众数 标准偏差 极差 最小值 最大值 165.6 165 164 2.13 8 162 170 平均 中位数 众数 标准偏差 极差 最小值 最大值 方法 B 128.73 129 128 1.75 7 125 132 平均 中位数 众数 标准偏差 极差 最小值 最大值 方法 C 125.53 126 126 2.77 12 116 128评价优劣应根据离散系数,据上得:2.13 =0.0129, 165.6 1.75 方法 B 的离散系数 VB= =0.0136, 128.73 2.77 方法 C 的离散系数 VC= =0.0221; 125.53方法 A 的离散系数 VA= 对比可见,方法 A 的离散系数最低,说明方法 A 最优。 (2)我会选择方法 A,因为方法 A 的平均产量最高而离散系数最低,说明方法 A 的产 量高且稳定,有推广意义。 16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预 期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的 两个直方图,分别反映了 200 种商业类股票和 200 种高科技类股票的收益率分布。在股票 市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关 系。 (1)你认为该用什么样的统计测度值来反映投资的风险? (2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?-30 频50030 收 益 率60 频50-30030 收 益 率60(a)商业类股票 (b) 高科技类股票 数 数 解: (1)方差或标准差; (2)商业类股票; (略) (3) 。 25 25 17.下图给出了 2000 年美国人口年龄的金字塔,其绘制方法及其数字说明与【例 2.10】相 同,试对该图反映的人口、政治、社会、经济状况进行分析。 0 013 2000年美国人口年龄结构金字塔95-99(01-05) 90-94(06-10) 85-89(11-15) 80-84(16-20) 75-79(21-25) 70-74(26-30) 65-69(31-35) 60-64(36-40) 55-59(41-45) 50-54(46-50) 45-49(51-55) 40-44(56-60) 35-39(61-65) 30-34(66-70) 25-29(71-75) 20-24(76-80) 15-19(81-85) 10-14(86-90) 5-9(91-95) 0-4(96-00) -20 -10 0 10女 男年龄20人数(百万)第3章概率与概率分布――练习题(全免)1 .某技术小组有 12 人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分 别是以下几种可能的概率: (1)女性; (2)工程师; (3)女工程师, (4)女性或工程师。并 说明几个计算结果之间有何关系?序号 性别 职称1男2男3男4女5男6男7女8男9女10女11男12男工程师 技术员 技术员 技术员 技术员 工程师 工程师 技术员 技术员 工程师 技术员 技术员解:设 A=女性,B=工程师,AB=女工程师,A+B=女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工 序的次品率分别为 0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种 零件的次品率。 解:求这种零件的次品率,等于计算“任取一个零件为次品” (记为 A)的概率 P( A) 。 考虑逆事件 A ? “任取一个零件为正品” ,表示通过三道工序都合格。据题意,有:P( A) ? (1 ? 0.2)(1 ? 0.1)(1 ? 0.1) ? 0.64814 于是 P( A) ? 1 ? P( A) ? 1 ? 0.648 ? 0.352 3. 已知参加某项考试的全部人员合格的占 80%,在合格人员中成绩优秀只占 15%。试求 任一参考人员成绩优秀的概率。 解:设 A 表示“合格” 表示“优秀” ,B 。由于 B=AB,于是 P( B)=P( A) P( B | A) =0.8×0.15=0.12 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射 击) 。某射击选手第一发命中的可能性是 80%,第二发命中的可能性为 50%。求该选手两发 都脱靶的概率。 解:设 A=第 1 发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事 件的概率即可求得脱靶的概率。P ( B )=P ( A) P ( B | A) ? P ( A ) P ( B | A )=0.8× 1+0.2× 0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二) :P(脱靶)=P(第 1 次脱靶)× P(第 2 次脱靶)=0.2× 0.5=0.1 5.已知某地区男子寿命超过 55 岁的概率为 84%,超过 70 岁以上的概率为 63%。试求任一 刚过 55 岁生日的男子将会活到 70 岁以上的概率为多少? 解: 设 A=活到 55 岁,B=活到 70 岁。所求概率为:P( B | A)=P( AB) P( B) 0.63 = = =0.75 P( A) P( A) 0.846.某企业决策人考虑是否采用一种新的生产管理流程。 据对同行的调查得知, 采用新生产管 理流程后产品优质率达 95%的占四成,优质率维持在原来水平(即 80%)的占六成。该企 业利用新的生产管理流程进行一次试验, 所生产 5 件产品全部达到优质。 问该企业决策者会 倾向于如何决策? 解:这是一个计算后验概率的问题。 设 A=优质率达 95%, A =优质率为 80%,B=试验所生产的 5 件全部优质。 P(A)=0.4,P( A )=0.6,P(B|A)=0.955, P(B| A )=0.85,所求概率为:P ( A | B )=P ( A) P ( B | A) 0.30951 = =0.6115 P ( A) P ( B | A) ? P ( A ) P ( B | A ) 0.50612决策者会倾向于采用新的生产管理流程。 7. 某公司从甲、 丙三个企业采购了同一种产品, 乙、 采购数量分别占总采购量的 25%、 30% 和 45%。 这三个企业产品的次品率分别为 4%、 5%、 3%。 如果从这些产品中随机抽出一件, 试问: (1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的 概率是多少? 解:令 A1、 2、 3 分别代表从甲、 A A 乙、 丙企业采购产品, 表示次品。 B 由题意得: 1)=0.25, P(A P(A2)=0.30, P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率 分别为: (1) P( B)=P( A1 ) P( B | A1 ) ? P( A2 ) P( B | A2 ) ? P( A3 ) P( B | A3 )15 =0.25×0.04+0.30×0.05+0.45×0.03=0.03850.45 ? 0.03 0.0135 = =0. ? 0.04+0.30 ? 0.05+0.45 ? 0.03 0.0385 8.某人在每天上班途中要经过 3 个设有红绿灯的十字路口。 设每个路口遇到红灯的事件是相(2) P( A3 | B)= 互独立的, 且红灯持续 24 秒而绿灯持续 36 秒。 试求他途中遇到红灯的次数的概率分布及其 期望值和方差、标准差。 解:据题意,在每个路口遇到红灯的概率是 p=24/(24+36)=0.4。 设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表: xi P(X= xi) 0 0.216 1 0.432 2 0.288 3 0.064期望值(均值)=1.2(次) ,方差=0.72,标准差=0.8485(次) 9. 一家人寿保险公司某险种的投保人数有 20000 人,据测算被保险人一年中的死亡率为万 分之 5。保险费每人 50 元。若一年中死亡,则保险公司赔付保险金额 50000 元。试求未来 一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用) : (1)至少获利 50 万元的概率; (2)亏本的概率; (3)支付保险金额的均值和标准差。 解:设被保险人死亡数=X,X~B(25)。 (1)收入=20000×50(元)=100 万元。要获利至少 50 万元,则赔付保险金额应该不 超过 50 万元,等价于被保险人死亡数不超过 10 人。所求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过 20 人时,保险公司就要亏本。所求概率为: P(X&20)=1-P(X≤20)=1-0.958 (3)支付保险金额的均值=50000×E(X) =5×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X) =50000×(25×0.=158074(元) 10.对上述练习题 3.09 的资料,试问: (1)可否利用泊松分布来近似计算? (2)可否利用正态分布来近似计算? (3)假如投保人只有 5000 人,可利用哪种分布来近似计算? 解: (1)可以。当 n 很大而 p 很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np=20000× 0.0005=10,即有 X~P(10)。计算结果与二项分布所得结果几乎完全一致。 (2)也可以。尽管 p 很小,但由于 n 非常大,np 和 np(1-p)都大于 5,二项分布也可以 利用正态分布来近似计算。 本例中,np=25=10,np(1-p)=25×(1-0., 即有 X ~N(10,9.995)。相应的概率为: P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。 可见误差比较大(这是由于 P 太小,二项分布偏斜太严重) 。 【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近 似计算二项分布的概率时,通常在二项分布的变量值基础上加减 0.5 作为正态分布对应的区 间点,这就是所谓的“连续性校正” 。 (3)由于 p=0.0005,假如 n=5000,则 np=2.5&5,二项分布呈明显的偏态,用正态分16 布来计算就会出现非常大的误差。此时宜用泊松分布去近似。 11.某企业生产的某种电池寿命近似服从正态分布,且均值为 200 小时,标准差为 30 小时。 若规定寿命低于 150 小时为不合格品。试求该企业生产的电池的: (1)合格率是多少?(2) 电池寿命在 200 左右多大的范围内的概率不小于 0.9。 解:(1) P ( X ? 150) ? P ( Z ?150 ? 200 )=P ( Z ? ?1.6667) =0.04779 30合格率为 1-0.021 或 95.221%。 (2) 设所求值为 K,满足电池寿命在 200±K 小时范围内的概率不小于 0.9,即有:P(| X ? 200 |? K ) ? P{| Z | =即: P{Z ?| X ? 200 | K ? } ? 0.9 30 30K } ? 0.95 ,K/30≥1.64485,故 K≥49.3456。 3012.某商场某销售区域有 6 种商品。假如每 1 小时内每种商品需要 12 分钟时间的咨询服务, 而且每种商品是否需要咨询服务是相互独立的。求: (1)在同一时刻需用咨询的商品种数的 最可能值是多少?(2)若该销售区域仅配有 2 名服务员,则因服务员不足而不能提供咨询 服务的概率是多少? 解:设 X =同一时刻需用咨询服务的商品种数,由题意有 X~B(6,0.2) (1)X 的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数) (2) P ( X ? 2) ? 1 ? P ( X ? 2) ? 1 ? =1-0.92k ?0? C 6k 0.2 k 0.8 6? k第4章抽样与抽样分布――练习题(全免)1. 一个具有 n ? 64 个观察值的随机样本抽自于均值等于 20、标准差等于 16 的总体。 ⑴ 给出 x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述 x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态 z 统计量对应于 x ? 15.5 的值。 ⑷ 计算标准正态 z 统计量对应于 x ? 23 的值。 解: 已知 n=64,为大样本,μ =20,σ =16, ⑴在重复抽样情况下, x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习 4.1 求概率。 ⑴ x &16; ⑵ x &23; ⑶ x &25; ⑷. x 落在 16 和 22 之间; ⑸ x &14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有 n ? 100 个观察值的随机样本选自于 ? ? 30 、 ? ? 16 的总体。试求下列概率 的近似值:解: a. 0.8944b. 0.0228c. 0.1292d. 0.969917 4. 一个具有 n ? 900 个观察值的随机样本选自于 ? ? 100 和 ? ? 10 的总体。 ⑴ 你预计 x 的最大值和最小值是什么? ⑵ 你认为 x 至多偏离 ? 多么远? ⑶ 为了回答 b 你必须要知道 ? 吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含 x 的值等于 0,1,2,…,97,98,99 的总体。假设 x 的取值的可能性是 相同的。 则运用计算机对下面的每一个 n 值产生 500 个随机样本, 并对于每一个样本计算 x 。 对于每一个样本容量, 构造 x 的 500 个值的相对频率直方图。 n 值增加时在直方图上会发 当 生什么变化?存在什么相似性?这里 n ? 2, n ? 5, n ? 10, n ? 30 和 n ? 50 。 解:趋向正态 6. 美国汽车联合会(AAA)是一个拥有 90 个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999 年 5 月,AAA 通过对会员调查得知一个 4 口之家出游中平均每日餐饮和住宿费用大约是 213 美元( 《旅行新闻》Travel News, 1999 年 5 月 11 日) 。假设这个花费的标准差是 15 美元,并且 AAA 所报道的平均每日 消费是总体均值。 又假设选取 49 个 4 口之家, 并对其在 1999 年 6 月期间的旅行费用进 行记录。 ⑴ 描述 x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明 x 服从怎样 的分布以及 x 的均值和方差是什么?证明你的回答; ⑵ 对于样本家庭来说平均每日消费大于 213 美元的概率是什么?大于 217 美元的概率 呢?在 209 美元和 217 美元之间的概率呢? 解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938 7. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为 ? ? 406 克、标准差 为 ? ? 10.1克。监控这一过程的技术人者每天随机地抽取 36 袋,并对每袋重量进行测 量。现考虑这 36 袋奶粉所组成样本的平均重量 x 。 (1)描述 x 的抽样分布,并给出 ? x 和 ? x 的值,以及概率分布的形状; 假设某一天技术人员观察到 x ? 400.8 , 这是否意味着装袋过程出 现问题了呢,为什么? 解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了 8. 在本章的统计实践中,某投资者考虑将 1000 美元投资于 n ? 5 种不同的股票。每一种股 票月收益率的均值为 ? ? 10% ,标准差 ? ? 4% 。对于这五种股票的投资组合,投资 (3) 者每月的收益率是 r ?? r 5 。投资者的每月收益率的方差是 ?i2 r??2n? 3.2 ,它是投资者所面临风险的一个度量。 ⑴ 假如投资者将 1000 美元仅投资于这 5 种股票的其中 3 种,则这个投资者所面对的 风险将会增加还是减少?请解释; ⑵ 假设将 1000 美元投资在另外 10 种收益率与上述的完全一样的股票, 试度量其风险, 并与只投资 5 种股票的情形进行比较。 解:a. 增加 b. 减少 9. 某制造商为击剑运动员生产安全夹克, 这些夹克是以剑锋刺入其中时所需的最小力量 (以 牛顿为单位) 来定级的。 如果生产工艺操作正确, 则他生产的夹克级别应平均 840 牛顿, 标准差 15 牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于 800 牛顿。 为了检查其生产过程是否正常,某检验人员从生产过程中抽取了 50 个夹克作为一个随 机样本进行定级,并计算 x ,即该样本中夹克级别的均值。她假设这个过程的标准差 是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则 x 的样本分布为何? ⑵ 假设这个检验人员所抽取样本的级别均值为 830 牛顿,则如果生产过程正常的话,18 样本均值 x ≤830 牛顿的概率是多少? ⑶ 在检验人员假定生产过程的标准差固定不变时,你对 b 部分有关当前生产过程的现 状有何看法(即夹克级别均值是否仍为 840 牛顿)? ⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从 15 牛顿增加到了 45 牛 顿。在这种情况下 x 的抽样分布是什么?当 x 具有这种分布时,则 x ≤830 牛顿的 概率是多少? 解: a. 正态 b. 约等于 0 c. 不正常 d. 正态, 0.06 10. 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类: 由于特殊原因所引起的变化(例如,某一特定的机器) ,以及由于共同的原因所引起的 变化(例如,产品的设计很差) 。 一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控 制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受, 但只要消除变化的共同原因,便可减少变化(Deming,;De Vor, Chang,和 Sutherland,1992) 。 通常的做法是将产品质量的特征绘制到控制图上, 然后观察这些数值随时间如何变 动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选 n ? 5 块试验 肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值 x 描绘在下图中。 假设这个过程是在统计控制中的,则 x 的分布将具有过程的均值 ? ,标准差具有过程 的标准差除以样本容量的平方根,? x ? ?两条线称为控制极限度,位于 ? 的上下 3 ? x 的位置。假如 x 落在界限的外面,则有充 分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。 当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从 ? ? 2% 和n。下面的控制图中水平线表示过程均值,? ? 1% 的近似的正态分布。⑴ 假设 n ? 4, 则上下控制极限应距离 ? 多么远? ⑵ 假如这个过程是在控制中,则 x 落在控制极限之外的概率是多少? ⑶ 假设抽取样本之前,过程均值移动到 ? ? 3% ,则由样本得出这个过程失控的(正 确的)结论的概率是多少? 解:a. 0.015 b. 0.0026 c. 0.. 参考练习 4.10。 肥皂公司决定设置比练习 4.10 中所述的 3? x 这一限度更为严格的控制 极限。特别地,当加工过程在控制中时,公司愿意接受 x 落在控制极限外面的概率是 0.10。 ⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的 样本中使用 n ? 4 个观察值,则控制极限应该设定在哪里? ⑵ 假设 a 部分中的控制极限已付诸实施, 但是公司不知道, 现在是 3% (而不是 2%) 。 ? 若 n ? 4 ,则 x 落在控制极限外面的概率是多少?若 n ? 9 呢? 解: a. (0.012, 0.028) b. 0.8 4.12. 参考练习 4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。19 警戒限一般被设定为 ? ? 1.96? x 。假如有两个连续的数据点落在警戒限之外,则这个 过程一定是失控的(蒙哥马利,1991 年) 。 ⑴ 假设肥皂加工过程是在控制中(即,它遵循 ? ? 2% 和 ? ? 1% 的正态分布) ,则 x 的下一个值落在警戒限之外的概率是什么? ⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的 x 的这 40 个值中有多 少个点落在上控制极限以上? ⑶ 假设肥皂加工过程是在控制中, x 的两个未来数值落在下警戒线以下的概率是多 则 少? 解: a. 0.05 b. 1 c. 0.000625第5章参数估计●1. 从一个标准差为 5 的总体中抽出一个容量为 40 的样本,样本均值为 25。 (1) 样本均值的抽样标准差σ x 等于多少? (2) 在 95%的置信水平下,允许误差是多少? 解:已知总体标准差σ =5,样本容量 n=40,为大样本,样本均值 x =25, (1)样本均值的抽样标准差σ x =σ 5 = =0.7906 n 40(2)已知置信水平 1-α =95%,得 Z α /2 =1.96, 于是,允许误差是 E = Z α /2σ =1.96×0.6。 n●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周的时间里选取 49 名顾客 组成了一个简单随机样本。 (3) 假定总体标准差为 15 元,求样本均值的抽样标准误差; (4) 在 95%的置信水平下,求允许误差; (5) 如果样本均值为 120 元,求总体均值 95%的置信区间。 解: (1)已假定总体标准差为σ =15 元, 则样本均值的抽样标准误差为 σ x =σ 15 = =2.1429 n 49(2)已知置信水平 1-α =95%,得 Z α /2 =1.96, 于是,允许误差是 E = Z α /2σ =1.96×2.0。 n(3)已知样本均值为 x =120 元,置信水平 1-α =95%,得 Z α /2 =1.96, 这时总体均值的置信区间为 x ? Z α /2124.2 σ =120±4.2= 115.8 n可知,如果样本均值为 120 元,总体均值 95%的置信区间为(115.8,124.2)元。20 ●3.某大学为了解学生每天上网的时间,在全校 7500 名学生中采取不重复抽样方法随机抽 取 36 人,调查他们每天上网的时间,得到下面的数据(单位:小时) : 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5 求该校大学生平均上网时间的置信区间,置信水平分别为 90%、95%和 99%。 解:⑴计算样本均值 x :将上表数据复制到 Excel 表中,并整理成一列,点击最后数据下面 空格,选择自动求平均值,回车,得到 x =3.316667, ⑵计算样本方差 s: 删除 Excel 表中的平均值, 点击自动求值→其它函数→STDEV→选 定计算数据列→确定→确定,得到 s=1.6093 也可以利用 Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格, 输 入“=(a7-3.” ,回车,即得到各数据的离差平方,在最下行求总和,得到:(x ? -x)=90.652 i再对总和除以 n-1=35 后,求平方根,即为样本方差的值 s=(x ? -x) =2 in ?190.65 =1.6093。 35⑶计算样本均值的抽样标准误差: 已知样本容量 n=36,为大样本, 得样本均值的抽样标准误差为 σ x =s 1. 6093 = =0.2682 36 n⑷分别按三个置信水平计算总体均值的置信区间: ① 置信水平为 90%时: 由双侧正态分布的置信水平 1-α =90%,通过 2β -1=0.9 换算为单侧正态分 布的置信水平β =0.95,查单侧正态分布表得 Z α /2 =1.64, 计算得此时总体均值的置信区间为x ? Z α /23.7565 s =3.×0.9 n可知,当置信水平为 90%时,该校大学生平均上网时间的置信区间为(2.87,3.76) 小时; ② 置信水平为 95%时: 由双侧正态分布的置信水平 1-α =95%,得 Z α /2 =1.96, 计算得此时总体均值的置信区间为x ? Z α /23.8423 s =3.×0.0 n21 可知,当置信水平为 95%时,该校大学生平均上网时间的置信区间为(2.79,3.84) 小时; ③ 置信水平为 99%时: 若双侧正态分布的置信水平 1-α =99%,通过 2β -1=0.99 换算为单侧正态 分布的置信水平β =0.995,查单侧正态分布表得 Z α /2 =2.58, 计算得此时总体均值的置信区间为x ? Z α /24.0087 s =3.×0.7 n可知,当置信水平为 99%时,该校大学生平均上网时间的置信区间为(2.62,4.01) 小时。 4. 从一个正态总体中随机抽取容量为 8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求 总体均值 95%的置信区间。 解: (7.1,12.9) 。 5.某居民小区为研究职工上班从家里到单位的距离,抽取了由 16 个人组成的一个随机样本, 他们到单位的距离(公里)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离 95%的置信区间。 解: (7.18,11.57) 。 ●6. 在一项家电市场调查中,随机抽取了 200 个居民户,调查他们是否拥有某一品牌的电 视机。 其中拥有该品牌电视机的家庭占 23%。 求总体比率的置信区间, 置信水平分别为 90% 和 95%。 解:已知样本容量 n =200,为大样本,拥有该品牌电视机的家庭比率 p =23%, 拥有该品牌电视机的家庭比率的抽样标准误差为σp =p (1 ? p ) 0.23 ? 0.77 = =2.98% n 200⑴双侧置信水平为 90%时, 通过 2β -1=0.90 换算为单侧正态分布的置信水平β =0.95, 查单侧正态分布表得 Z α /2 =1.64, 此时的置信区间为 p ? Z α /227.89% p(1 ? p) =23%±1.64×2.98%= 18.11% n可知,当置信水平为 90%时,拥有该品牌电视机的家庭总体比率的置信区间为 (18.11%,27.89%) 。 ⑵双侧置信水平为 95%时,得 Z α /2 =1.96, 此时的置信区间为 p ? Z α /228.8408% p(1 ? p) =23%±1.96×2.98%= 17.1592% n可知,当置信水平为 95%时,拥有该品牌电视机的家庭总体比率的置信区间为 ; (17.16%,28.84%) 。22 ●7.某居民小区共有居民 500 户,小区管理者准备采取一项新的供水设施,想了解居民是否 赞成。采取重复抽样方法随机抽取了 50 户,其中有 32 户赞成,18 户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为 95%; (2)如果小区管理者预计赞成的比率能达到 80%,应抽取多少户进行调查? 解: 已知总体单位数 N=500,重复抽样,样本容量 n =50,为大样本, 样本中,赞成的人数为 n1=32,得到赞成的比率为 p =n 1 32 = =64% n 50(1)赞成比率的抽样标准误差为p (1 ? p ) 0.64 ? 0.36 = =6.788% n 50由双侧正态分布的置信水平 1-α =95%,得 Z α /2 =1.96, 计算得此时总体户数中赞成该项改革的户数比率的置信区间为p ? Z α /277.304% p(1 ? p) = 64%±1.96×6.788%= 50.696% n可知,置信水平为 95%时,总体中赞成该项改革的户数比率的置信区间为 (50.70%,77.30%) 。 (2)如预计赞成的比率能达到 80%,即 p=80%, 由p ( 1? p ) 0.8 ? 0.2 =6.788%,即 =6.788% n n得样本容量为 n =0.8 ? 0.2 = 34.72 取整为 35, (6.788%) 2即可得, 如果小区管理者预计赞成的比率能达到 80%, 应抽取 35 户进行调查。 8.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表: 来自总体 1 的样本 来自总体 2 的样本n1 ? 14 x1 ? 53.2s12 ? 96.8(1) 求 ?1 ? ? 2 90%的置信区间;n2 ? 7 x2 ? 43.42 s 2 ? 102 .0(2) 求 ?1 ? ? 2 95%的置信区间。 解: (1.86,17.74)(0.19,19.41) ; 。 9.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表: 来自总体 1 的样本 来自总体 2 的样本x1 ? 25s12 ? 16x 2 ? 232 s 2 ? 20(1)设 n1 ? n2 ? 100 ,求 ?1 ? ? 2 95%的置信区间;23 (2)设 n1 ? n2 ? 10 , ? 1 ? ? 2 ,求 ?1 ? ? 2 95%的置信区间;2 2 2(3)设 n1 ? n2 ? 10 , ? 1 ? ? 2 ,求 ?1 ? ? 2 95%的置信区间;2(4)设 n1 ? 10, n2 ? 20 , ? 1 ? ? 2 ,求 ?1 ? ? 2 95%的置信区间;2 2 2(5)设 n1 ? 10, n2 ? 20 , ? 1 ? ? 2 ,求 ?1 ? ? 2 95%的置信区间。 解: (1)2±1.176; (2)2±3.986; (3)2±3.986; (4)2±3.587; (5)2±3.364。 10.下表是由 4 对观察值组成的随机样本: 配对号 来自总体 A 的样本 来自总体 B 的样本21 2 3 42 5 10 80 7 6 5(1)计算 A 与 B 各对观察值之差,再利用得出的差值计算 d 和 s d ; (2)设 ? 1 和 ? 2 分别为总体 A 和总体 B 的均值,构造 ? d ( ?1 ? ? 2 ) 95%的置信区间。 解: (1) d ? 1.75 , s d ? 2.63 ; (2)1.75±4.27。 11.从两个总体中各抽取一个 n1 ? n2 ? 250 的独立随机样本,来自总体 1 的样本比率为p1 ? 40% ,来自总体 2 的样本比率为 p2 ? 30% 。(1)构造 ? 1 ? ? 2 90%的置信区间; (2)构造 ? 1 ? ? 2 95%的置信区间。 解: (1)10%±6.98%; (2)10%±8.32%。 12.生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减 小方差。下面是两部机器生产的袋茶重量(克)的数据: 机器 1 机器 2 3.45 3.20 3.22 3.50 2.95 3.16 3.20 3.22 2.98 3.75 3.38 3.45 3.48 3.1823.90 3.70 3.28 3.35 3.20 3.12 3.2523.22 3.38 3.30 3.30 3.34 3.28 3.303.28 3.19 3.20 3.29 3.35 3.16 3.343.35 3.30 3.05 3.33 3.27 3.28 3.25构造两个总体方差比 ? 1 ? 2 95%的置信区间。 解: (4.06,14.35) 。 ●13.根据以往的生产数据,某种产品的废品率为 2%。如果要求 95%的置信区间,若要求允 许误差不超过 4%,应抽取多大的样本? 解:已知总体比率 ? =2%=0.02,由置信水平 1-α=95%,得置信度 Zα/2 =1.96,允许误差 E≤ 4% 即由允许误差公式 E= Z α / 2σp n整理得到样本容量 n 的计算公式:24 n= (Zα/2 σ P E) =(2Zα/2 π(1- π) E) =2Z2 α/2 π(1- π) E2≥1.962 ? 0.02 ? 0.98 =47.由于计算结果大于 47,故为保证使“≥”成立,至少应取 48 个单位的样本。 ●14.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为 120 元,现要求以 95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过 20 元,应抽取多少个顾客作为样本? 解: 已知总体标准差 ? x =120,由置信水平 1-α=95%,得置信度 Zα/2 =1.96,允许误差 E≤ 20 即由允许误差公式 E= Z α / 2σx n整理得到样本容量 n 的计算公式:n= (Zα/2 σ x E)2 ≥ (1.96 ? 120 2 ) =138.2976 20由于计算结果大于 47,故为保证使“≥”成立,至少应取 139 个顾客作为样本。 15.假定两个总体的标准差分别为: ? 1 ? 12 , ? 2 ? 15 ,若要求误差范围不超过 5,相应的 置信水平为 95%, 假定 n1 ? n2 , 估计两个总体均值之差 ?1 ? ? 2 时所需的样本容量为多大? 解: 57。 16.假定 n1 ? n2 ,允许误差 E ? 0.05 ,相应的置信水平为 95%,估计两个总体比率之差? 1 ? ? 2 时所需的样本容量为多大?解: 769。第6章假设检验――练习题(全免)6.1 研究者想要寻找证据予以支持的假设是 “新型弦线的平均抗拉强度相对于以前提高了” , 所以原假设与备择假设应为: H 0 : ? ? 1035 , H 1 : ? ? 1035 。 6.2 “某一品种的小鸡因为同类相残而导致的死亡率” H 0 : ? ? 0.04 , 1 : ? ? 0.04 。 , H ?=6.3 H 0 : ? ? 65 , H 1 : ? ? 65 。 6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于 60 克,但 检验结果却提供证据支持店方倾向于认为其重量少于 60 克; (2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于 60 克,但检验 结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 6.5 (1)检验统计量 z ?x?? s/ n,在大样本情形下近似服从标准正态分布;(2)如果 z ? z 0.05 ,就拒绝 H 0 ; (3)检验统计量 z =2.94&1.645,所以应该拒绝 H 0 。25 6.6 z =3.11,拒绝 H 0 。 6.7 z =1.93,不拒绝 H 0 。 6.8 z =7.48,拒绝 H 0 。 6.9 ? =206.22,拒绝 H 0 。26.10 z =-5.145,拒绝 H 0 。 6.11 t =1.36,不拒绝 H 0 。 6.12 z =-4.05,拒绝 H 0 。 6.13 F =8.28,拒绝 H 0 。 6.14 (1)检验结果如下:t-检验: 双样本等方差假设 变量 1 平均 方差 观测值 合并方差 假设平均差 df t Stat P(T&=t) 单尾 t 单尾临界 P(T&=t) 双尾 t 双尾临界 100.7 24. 28. 38 -5..7..4. 变量 2 109.9 33.t-检验: 双样本异方差假设 变量 1 平均 方差 观测值 假设平均差 df t Stat P(T&=t) 单尾 t 单尾临界 P(T&=t) 双尾 t 双尾临界 100.7 24. 0 37 -5..8..7.26变量 2 109.9 33. (2)方差检验结果如下:F-检验 双样本方差分析 变量 1 平均 方差 观测值 df F P(F&=f) 单尾 F 单尾临界 100.7 24. 19 0... 变量 2 109.9 33. 19第7章7.1 7.2方差分析与试验设计――练习题(全免)F ? 4.6574 ? F0.01 ? 8.0215 (或 P ? value ? 0.0409 ? ? ? 0.01 ), 不能拒绝原假设。 F ? 17.0684 ? F0.05 ? 3.8853 (或 P ? value ? 0.0003 ? ? ? 0.05 ),拒绝原假设。x A ? x B ? 44.4 ? 30 ? 14.4 ? LSD ? 5.85 ,拒绝原假设; x A ? xC ? 44.4 ? 42.6 ? 1.8 ? LSD ? 5.85 ,不能拒绝原假设; x B ? xC ? 30 ? 42.6 ? 12.6 ? LSD ? 5.85 ,拒绝原假设。7.3方差分析表中所缺的数值如下表: SS df MS 差异源 组间 组内 总计 420
27 29 210 142.07 ―F 1.478 ― ―P-value 0.245946 ― ―F crit 3.354131 ― ―F ? 1.478 ? F0.05 ? 3.554131 (或 P ? value ? 0.245946 ? ? ? 0.05 ),不能拒绝原假设。 7.4 有 5 种不同品种的种子和 4 种不同的施肥方案,在 20 快同样面积的土地上,分别采用 5 种种子和 4 种施肥方案搭配进行试验,取得的收获量数据如下表:F种子 ? 7.2397 ? F0.05 ? 3.2592 (或 P ? value ? 0.0033 ? ? ? 0.05 ),拒绝原假设。 F施肥方案 ? 9.2047 ? F0.05 ? 3.4903 (或 P ? value ? 0.0019 ? ? ? 0.05 ), 拒绝原假设。7.5 F地区 ? 0.0727 ? F0.05 ? 6.9443 (或 P ? value ? 0.9311 ? ? ? 0.05 ),不能拒绝原假 设。 F包装方法 ? 3.1273 ? F0.05 ? 6.9443 (或 P ? value ? 0.1522 ? ? ? 0.05 ),不能 拒绝原假设。27 7.6 F广告方案 ? 10.75 ? F0.05 ? 5.1432 (或 P ? value ? 0.0104 ? ? ? 0.05 ),拒绝原假设。F广告媒体 ? 3 ? F0.05 ? 5.9874 (或 P ? value ? 0.1340 ? ? ? 0.05 ), 不能拒绝原假设。 F交互作用 ? 1.75 ? F0.05 ? 5.1432 (或 P ? value ? 0.2519 ? ? ? 0.05 ),不能拒绝原假设。第8章相关与回归分析――练习题●1. 表中是道琼斯工业指数(DJIA) 和标准普尔 500 种股票指数(S&P500) 1988 年至 1997 年对应股票的收益率资料:年份 90
DJIA 收益率(%) S&P500 收益率(%) 年份 16.0 31.7 -0.4 23.9 7.4 16.6 31.5 -3.2 30.0 7.6 95
DJIA 收益率(%) 16.8 4.9 36.4 28.6 24.9 S&P500 收益率(%) 10.1 1.3 37.6 23.0 33.4计算两种指数收益率的相关系数,分析其相关程度,以 0.05 的显著性水平检验相关系 数的显著性。 解: (1)解法一:利用 Excel 进行表格计算相关系数 设 DJIA 收益率为 x,S&P500 收益率为 y,将已知表格复制到 Excel 中, 列出计算 x2、xy、y2 及其合计数的栏目并进行计算,得结果如下: (利用 Excel 计算进行表格计算的方法类似于标准差的 Excel 计算)DJIA 收益率 年份 (%) S&P500 收益率 (%)X2xyy2x90 93 96 16.0 31.7 -0.4 23.9 7.4 16.8 4.9 36.4 28.6y16.6 31.5 -3.2 30.0 7.6 10.1 1.3 37.6 23.0256 .16 571.21 54.76 282.24 24.01 .96265.6 998.55 1.28 717 56.24 169.68 6.37 .8275.56 992.25 10.24 900 57.76 102.01 1.69 28 1997 合计24.9 190.233.4 187.9620.01 4956.2831.66 5072.827.83代入相关系数计算公式得: r=n? x 2 ? ? ? x ) 2 n? y 2 ? ? ? y ) 210 ? 5072.82 ? 190.2 ? 187.9 10 ? 4956.2 ? ???????? 10 ? 5397.83 ? ????????n? xy ? ? x? y== 0.948138 解法二:利用 Excel 函数“CORREL”计算相关系数 (Correlation coefficient, 相关系数) ①将已知数据表复制到 Excel 中,同类数据置于同一列; ②在表格外选择某一单元格后,点选菜单栏中“∑”右边的“”后,选择 “其它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨” ,选择 “统计” ,再在“选择函数(N)”中选择函数“CORREL” ,然后点击“确定” ; ③在 “函数参数” 窗口中, “Array1” 点击 输入栏后, Excel 表中刷取 DJIA 在 “ 收益率”数据,再点击“Array2”输入栏后,在 Excel 表中刷取“S&P500 收益率”数据,然后 点击“确定” 。 (由于相关系数中,两变量是对等的,故两列数据的选择顺序可以对换,而 计算结果是相同的。 ) 这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。 可知,相关系数为 rXY ? 0.948138 , 以上相关系数的计算结果说明, DJIA 收益率与 S&P500 收益率的相关程度属于高度正 相关。 (2)计算 t 统计量(免)t?r n?2 1? r2?0.948138 ? 10 ? 2 1 ? o.9481382?2.681739 ? 8..317859给定显著性水平=0.05,查 t 分布表得自由度 n-2=10-2=8 的临界值 t? 2 为 2.306, 显然 t ? t? 2 ,表明相关系数 r 在统计上是显著的。 ● 2.利用【例 8-3】的表 8.3 中提供的各省市人均 GDP 和第一产业中就业比例的数据,试 分析各省市人均 GDP 与第一产业就业比例的相关性,并对其显著性作统计检验。 解: 表 8.3 中提供的各省市人均 GDP 和第一产业中就业比例的数据为:序号 1 2 3地区 北京 天津 河北GDP 0.10 5577.78就业比例% 11.2 20.0 49.6序号 17 18 19地区 湖北 湖南 广东GDP 3.00 10647.70就业比例% 48.4 60.5 40.029 4 5 6 7 8 9 10 11 12 13 14 15 16山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南5.79 2.48 0.84 8.15 3.68 8.31 5640.1146.9 53.9 37.2 50.7 49.6 12.5 41.4 35.7 58.7 45.8 51.6 52.3 63.120 21 22 23 24 25 26 27 28 29 30 31广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆.96 1.67 4.71 138.73 2.51 300.95 298.38 1485.4861.8 60.3 54.7 58.8 66.4 73.6 71.8 55.7 59.4 60.0 56.5 56.6利用 Excel 中的”数据分析”计算各省市人均 GDP 和第一产业中就业比例的相关系数,方法 同上第 1 题,即应用统计函数“CORREL”进行计算,也可以构成计算表格进行计算: 解法一:构成 Excel 计算表格对相关系数计算公式中的计算元素进行列表计算: 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 GDP x 0.10 9.97 3.08 1.00 1.91 0.13 5.68 0.11 3.00 1.19 545.96 1.67 就业比例% y 11.2 20.0 49.6 46.9 53.9 37.2 50.7 49.6 12.5 41.4 35.7 58.7 45.8 51.6 52.3 63.1 48.4 60.5 40.0 61.8 60.3 54.7 58.8 x2 5 0 4 9 1 4 4 0 6 1 5 9 4 4 1 1 4 0 00 1 6 9 9 xy 02.0
y2 125.44 400.00 9.61 3.84 0.16 156.25 4.49 7.64 5.29 2.56 0.00 6.09 7.4430 24 25 26 27 28 29 30 31 合贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 计4.71 138.73 2.51 300.95 298.38 766.1666.4 73.6 71.8 55.7 59.4 60.0 56.5 56.6 1564.70 1
4698.7 725.8 57.0 78.26.96 2.49 0.00 3.56 85687.8940 将计算结果代入相关系数计算公式中, 由上得 r=n? x 2 ? ? ? x ) 2 n? y 2 ? ? ? y ) 231?
?? 4 ? ???????????? 31? 85687.89 ? ?????????n? xy ? ? x? y==? .5 =? = -0.47.94 ? 456.11解法二:应用 Excel 中的函数“CORREL”计算, ①将已知数据表复制到 Excel 中; ②在表格外选择某一单元格,点选菜单栏中“∑”右边的“”后,选择“其 它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨” ,选择“统 计” ,再在“选择函数(N)”中选择函数“CORREL” ,然后点击“确定” ; ③在“函数参数”窗口中,点击“Array1”输入栏后,在 Excel 表中刷取“就 业比例%”数据,再点击“Array2”输入栏后,在 Excel 表中刷取“GDP”数据,然后点击 “确定” 。 这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。 结果也是 r=-0.34239, 这说明人均 GDP 与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二 者相关程度并不大,属于低度负相关关系。 相关系数检验:(免) 在总体相关系数 ? ? 0 的原假设下,计算 t 统计量:t?r n?2 1? r2??0.34239 ? 31 ? 2 1 ? (?0.34239) 2? ?1.9624查 t 分布表,自由度为 31-2=29,当显著性水平取 ? ? 0.05 时, t? 2 =2.045;当显著性 水平取 ? ? 0.1 时, t? 2 =1.699。 由于计算的 t 统计量的绝对值 1.9624 小于 t? 2 =2.045,所以在 ? ? 0.05 的显著性水平31 下,不能拒绝相关系数 ? ? 0 的原假设。即是说,在 ? ? 0.05 的显著性水平下不能认为人 均 GDP 与第一产业中就业比例有显著的线性相关性。 但是计算的 t 统计量的绝对值 1.9624 大于 t? 2 =1.699, 所以在 ? ? 0.1 的显著性水平下, 可以拒绝相关系数 ? ? 0 的原假设。即在 ? ? 0.1 的显著性水平下,可以认为人均 GDP 与第 一产业中就业比例有一定的线性相关性。 ●3.表中是 16 支公益股票某年的每股账面价值和当年红利:公司序号 1 2 3 4 5 6 7 8 账面价值(元) 22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 红利(元) 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.60 公司序号 9 10 11 12 13 14 15 16 账面价值(元) 12.14 23.31 16.23 0.56 0.84 18.05 12.45 11.33 红利(元) 0.80 1.94 3.00 0.28 0.84 1.80 1.21 1.07根据上表资料: (1)建立每股账面价值和当年红利的回归方程; (2)解释回归系数的经济意义; (3)若序号为 6 的公司的股票每股账面价值增加 1 元,估计当年红利可能为多少? 解: (1)设当年红利为 Y,每股帐面价值为 X 则回归方程为 Yi ? ?1 ? ? 2 X i ,下面分别应用两种方法计算回归参数: 方法一:利用 Excel 进行表格运算计算公式元素:账面价值 公司序号 (元) x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 12.14 23.31 16.23 0.56 0.84 18.05 红利(元) y 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.6 0.8 1.94 3 0.28 0.84 1.8x2 503.1 487.4 429.5 414.9 147.1 263.6 0.5xy 53.856 62.4 15.8 29.2 42.288 9.712 45. 0.6 32.4932 15 1612.45 11.331.21 1.07155.915.1 498.3157合计261.5926.74 将计算结果代入回归系数计算公式,得: 回归系数β2 ?n ? xy ? ? x ? y n? x 2 ? ? ? x)216 ? 498.3157 ? 261.59 ? 26.74 2 16 ?
? (261.59) 978.1346 = = 0.21.9199 ?初始值β1 ? y ? β2 x ==? y ?β ? xn2n26.74 261.59 =0. ? 0.0728759 ? 16 16方法二:应用 Excel 函数计算直线回归方程的两个参数: ⑴应用统计函数“SLOPE”计算直线斜率: (slope,斜率) ①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右 边的“”后,选择“其它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏 右边的“∨” ,选择“统计” ,再在“选择函数(N)”中选择函数“SLOPE” ,然后点击“确定” ; ②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在 Excel 表中刷取 y 列数据,再点击“Known_x’s”输入栏后,在 Excel 表中刷取 x 列数据,然后点击“确定” 。 这时即在选定的单元格中出现直线斜率的计算结果 ? 2 ? 0.072876 ⑵应用统计函数“INTERCEPT”计算直线与 y 轴的截距――直线起点值: (截距 intercept ) ①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右 边的“”后,选择“其它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏 右边的“∨” ,选择“统计” ,再在“选择函数(N)”中选择函数“INTERCEPT” ,然后点击 “确定” ; ②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在 Excel 表中刷取 y 列数据,再点击“Known_x’s”输入栏后,在 Excel 表中刷取 x 列数据,然后点击“确定” 。 这时即在选定的单元格中出现直线斜率的计算结果 ? 1 ? 0.479775 于是,回归方程为Yi ? 0.479775 ? 0.072876 X i^(2)参数的经济意义是:当每股帐面价值增加 1 元时,当年红利将平均增加 0.072876 元。 (3) 序号 6 的公司每股帐面价值为 19.25 元, 若增加 1 元后, 每股帐面价值为 X=20.25 元,则当年红利估算为:^Yi ? 0.479775 ? 0.072876 ? 20.25 ? 1.955514 (元)33 ●4.美国各航空公司业绩的统计数据公布在《华尔街日报 1999 年年鉴》 (The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每 10 万名乘客投诉的次数的数据如下: 航空公司名称 航班正点率(%) 投诉率(次/10 万名乘客) 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22环球(TWA)航空公司 68.5 1.25 (1)画出这些数据的散点图; (2)根据散点图。表明二变量之间存在什么关系? (3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释; (5)如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数是多少? 解: (1)利用 EXCEL 制作数据散点图: 将已知表格的后两列复制到 Excel 中,选择该表格后,点击:图表向导→XY 散 点图→确定,即得散点图如下:投诉率(次/10万名乘客)1.4 1.2 1 0.8 0.6 0.4 0.2 0 65 70 75 航班正点率(%) 80 85(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明 航班整点率与投诉率两者之间,存在着一定的负相关关系。 [利用 Excel 的统计函数 “CORREL” 计算得到相关系数 r= -0.88261, 属于高度负相关] (3)求投诉率依赖航班正点率的估计的回归方程 设投诉率为 Y,航班正点率为 X 建立回归方程Yi ? ?1 ? ? 2 X i解法一:应用 Excel 函数计算: 应用统计函数“SLOPE”计算直线斜率为: ? 2 =-0.07041 应用统计函数“INTERCEPT”计算直线与 y 轴的截距为: ?1 = 6.017832 解法二:应用 Excel 列表计算: 作出 Excel 运算表格如下:34 航空公司名称航班正点率 投诉率(次 (%) /10 万名乘 客) x y 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 7.18 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 667.2x2xy西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 合 计7.56 0.49 2.84 2.64 90.4617.178 44.428 65.11 51.476 54.612 67.146 51.264 86.376 85.625 523.215得回归系数为:β2 ?n ? xy ? ? x ? y n? x 2 ? ? ? x)29 ? 523.215 ? 667.2 ? 7.18 2 9 ? 49590.46 ? (667.2) ?81.561 = = ―0.8.3 ?初始值β1 ? y ? β2 x ==? y ?β ? xn2n7.18 667.2 =6.01783 ? 0.0704144 ? 9 9于是得回归方程为Y i ? 6.0178 ? 0.07 X i(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10 万名 乘客)下降 0.07。 (5)航班按时到达的正点率为 80%时,估计每 10 万名乘客投诉的次数可能为:^? Yi ? 6.0178 ? 0.07 ? 80 ? 0.4187 (次/10 万)5. 表中是 1992 年亚洲各国人均寿命( y ) 、按购买力平价计算的人均 GDP( x1 ) 、成人识 字率( x2 ) 、一岁儿童疫苗接种率( x3 )的数据 序 国家和 平均寿命 人均 GDP 号 地区 y (年) x1 (100 美元) 1 2 3 4 日本 中国香港 韩国 新加坡 79 77 70 74 194 185 83 147 成人识字率 一岁儿童疫苗接种率x2 (%)99 90 97 92x3 (%)99 79 83 9035 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22泰国 马来西亚 斯里兰卡 中国大陆 菲律宾 朝鲜 蒙古 印度尼西亚 越南 缅甸 巴基斯坦 老挝 印度 孟加拉国 柬埔寨 尼泊尔 不丹 阿富汗69 70 71 70 65 71 63 62 63 57 58 50 60 52 50 53 48 4353 74 27 29 24 18 23 27 13 7 20 18 12 12 13 11 6 794 80 89 80 90 95 95 84 89 81 36 55 50 37 38 27 41 3286 90 88 94 92 96 85 92 90 74 81 36 90 69 37 73 85 35资料来源:联合国发展规划署《人的发展报告》(1)用多元回归的方法分析各国人均寿命与人均 GDP、成人识字率、一岁儿童疫苗接种 率的关系; (2)对所建立的回归模型进行检验。 解: 由 Excel 回归输出的结果可以看出: (1)回归结果为Yi ? 32.99309 ? 0.071619 X 2i ? 0.168727 X 3i ? 0.179042 X 3i^? (2) Excel 的计算结果已知: 1 , ? 2 , ?3 , ? 4 对应的 t 统计量分别为 0.51206、 由 4.853871、4..663731 ,其绝对值均大于临界值 t0.025 (22 ? 4) ? 2.101 ,所以各个自变量都对 Y 有明显影响。 由 F=58.20479, 大于临界值 F0.05 (4 ? 1, 22 ? 4) ? 3.16 ,说明模型在整体上是显著的。 6.表中给出 y 对 x2 和 x3 回归的结果: 离差来源 来自回归( ESS ) 来自残差( RSS ) 总离差( TSS ) 66042 14 平方和 SS ) ( 65965 自由度 df ) ( 平方和的均值 MSS ) ((1) 该回归分析中样本容量是多少? (2) 计算 RSS ;36 (3) ESS 和 RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数; (5) 怎样检验 x2 和 x3 对 y 是否有显著影响?根据以上信息能否确定 x2 和 x3 各自对 y 的贡献为多少? 解: (1)该回归分析中样本容量是 14+1=15 (2)计算 RSS==77 ESS 的自由度为 k-1=2,RSS 的自由度 n-k=15-3=12 (3)计算:可决系数 修正的可决系数R2 ? 6 ? 0.99881 5? 1 R2 ? 1 ? ?( 1 ? 0 . 9 9 8 8 ) ? 1 5? 30.9986(4)检验 X2 和 X3 对 Y 是否有显著影响F?ESS /(k ? 1) 65965 / 2 32982 ? ? ? 5140.11 RSS /(n ? k ) 77 /12 6.4166(5) F 统计量远比 F 临界值大,说明 X2 和 X3 联合起来对 Y 有显著影响,但并不能确 定 X2 和 X3 各自对 Y 的贡献为多少。 7. 在计算一元线性回归方程时,已得到以下结果:试根据此结果,填写下表的空格: 来 源 来自回归 来自残差 总离差平方和 解: 99.11
平方和 自由度 方差 2179.56来 源 来自回归 来自残差 总离差平方和平方和 .11 2278.67自由度 1 22 23方差 .5058. 表中为某企业近年来的总成本和产量的数据:37 年份总成本 y (万元)产量 x (件) 410 608 512 723 811年份总成本 y (万元)产量 x (件) 906 19 93 329 524 424 629 74199 863 48 178709
(1) 用已知数据估计以下总成本函数的参数:y t ? ? 1 ? ? 2 x t ? ? 3 x t2 ? ? 4 x t3 ? u t(2) (3) (4) (5) 检验参数的显著性; 检验整个回归方程的显著性; 计算总成本对产量的非线性相关指数; 评价此回归分析存在什么不足。2 3 2 3解: (1)用 Excel 输入 Y 和 X 数据,生成 X 和 X 的数据,用 Y 对 X、 X 、 X 回归, 估计参数结果为Yi ? ?1726.73 ? 7. X i ? 0.00895 X 2 ? 3.71249E ? 06 X 3t=(-1.9213) (2.462897) (-2.55934) (3.118062)^R2 ? 0.973669R 2 ? 0.963764(2)检验参数的显著性:当取 ? ? 0.05 时,查 t 分布表得 t0.025 (12 ? 4) ? 2.306 ,与 t 统计量对比,除了截距项外,各回归系数对应的 t 统计量的绝对值均大于临界值,表明 在这样的显著性水平下,回归系数显著不为 0。 (3)检验整个回归方程的显著性:模型的 R ? 0.973669 , R ? 0.963794 ,说明可决2 2系数较高,对样本数据拟合较好。由于 F=98.60668,而当取 ? ? 0.05 时,查 F 分布表 得 F0.05 (4 ? 1,12 ? 4) ? 4.07 ,因为 F=98.,应拒绝 H 0 : ? 2 ? ?3 ? ? 4 ? 0 , 说明 X、 X 、 X 联合起来对 Y 确有显著影响。 (4)计算总成本对产量的非线性相关系数:因为 R ? 0.973669 因此总成本对产量的223非线性相关系数为 R ? 0.973669 或 R=0.98674662(5)评价:虽然经 t 检验各个系数均是显著的,但与临界值都十分接近,说明 t 检验只 是勉强通过,其把握并不大。如果取 ? ? 0.01 ,则查 t 分布表得 t0.005 (12 ? 4) ? 3.3554 , 这时各个参数对应的 t 统计量的绝对值均小于临界值,则在 ? ? 0.01 的显著性水平下都 应接受 H 0 : ? j ? 0 的原假设。38 9. 研究青春发育与远视率(对数视力)的变化关系,测得结果如下表:年龄(岁) x 6 7 8 9 10 11 12 13 14 15 16 17 18 远视率(%) 63.64 61.06 38.84 13.75 14.50 8.07 4.41 2.27 2.09 1.02 2.51 3.12 2.98y对数视力 Y =ln 4.153 4.112 3.659 2.621 2.674 2.088 1.484 0.82 0.737 0.02 0.92 1.138 1.092y? 试建立曲线回归方程 y解:利用 Excel 输入 X、 y 和 Y 数据,用 Y 对 X 回归,估计参数结果为? Yi ? 5.73 ? 0.314 xit 值=(9.46) (-6.515)R 2 ? 0.794? 整理后得到: y ? 307 .9693 ? eR 2 ? 0.7 7 5?0.314x第9章时间序列分析――练习题●1. 某汽车制造厂 2003 年产量为 30 万辆。 (1)若规定
年年递增率不低于 6%,其后年递增率不低于 5%,2008 年该厂汽车 产量将达到多少? (2)若规定 2013 年汽车产量在 2003 年的基础上翻一番,而 2004 年的增长速度可望达到 7.8%,问以后 9 年应以怎样的速度增长才能达到预定目标? (3) 若规定 2013 年汽车产量在 2003 年的基础上翻一番, 并要求每年保持 7.4%的增长速度, 问能提前多少时间达到预定目标? 解:设 i 年的环比发展水平为 x i,则由已知得:x2003=30, (1)又知:x x2006 x x 3 2 ? ? ? 1 ? 6%), 2007 ? 2008 ? 1 ? 5%),求 x2008 ( ( x x x200739 由上得x x2008 ? ? ? (1 ? 6%)3 (1 ? 5%) 2 x x2007即为 得x2008 ? 1. ,从而 2008 年该厂汽车产量将达到 30x2008≥30× 1.06 × 1.05 = 30×1.3131 = 39.393(万辆)3 2从而按假定计算,2008 年该厂汽车产量将达到 39.393 万辆以上。 (2)规定9 x x2013 x =2 , 2004 =1+7.8% ,求
x 9由上得x2 0 1 3 9 x ? = x2 0 0 4 x=?92 ?1.078 ? 107.11%可知, 2004 年以后 9 年应以 7.11%的速度增长, 才能达到 2013 年汽车产量在 2003 年的基础上翻一番的目标。 (3)设:按每年 7.4%的增长速度 n 年可翻一番, 则有1.074n ?a03所以n ? log1.074 2 ?log 2 0.30103 ? ? 9.70939 (年) log1.074 0.031004可知,按每年保持 7.4%的增长速度,约 9.71 年汽车产量可达到在 2003 年基础上翻 一番的预定目标。 原规定翻一番的时间从 2003 年到 2013 年为 10 年,故按每年保持 7.4%的增长速度, 能提前 0.29 年即 3 个月另 14 天达到翻一番的预定目标。 ●2. 某地区社会商品零售额
年期间(1987 年为基期)每年平均增长 10%,1993 ―1997 年期间每年平均增长 8.2%,
年期间每年平均增长 6.8%。 2003 年与 1987 问 年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若 1997 年社会商品零 售额为 30 亿元,按此平均增长速度,2004 年的社会商品零售额应为多少? 解:设 i 年的环比发展水平为 x i,则已知的三段年均增长率表示为: ? 1988x x ? x1 9 8 7 x x x ? x1 9 9 2 x x x ? x1 9 9 7 x1989x 1 9x9 0 1 9 9 1 1 9 9 2 x x 5 ? ? ? 1? 1 0 % ,即为 1992 ? (1 ? 10%) x 1 9x8 9 1 9 9 0 1 9 9 1 x x ?19941 9 9?7 1 9 9 2 1993x 1 9x9 5 1 9 9 6 1 9 9 7 x x 5 ? ? ? 1? 8 . 2 % ,即为 1997 ? (1 ? 8.2%) x 1 9x9 4 1 9 9 5 1 9 9 6 x x ?1999 ? 1998x 2 0x0 0 2 0 0 1 x 2 0 0 2 2 0 0 3 x x 6 ? ? ? ? 1? 6 . 8 % ,即为 2003 ? (1 ? 6.8%) x x 9x 8 1 9x 9 9
2002 ?于是得:40 (1) 以 1987 年为基期,2003 年与 1987 年相比,该地区社会商品零售额的发展速度 为:x x = ? ? x x= (1 ? 10%) ? (1 ? 8.2%) ? (1 ? 6.8%)5 5 6? 3.5442736 ? 354.43%(原解答案中,03~97 为 5 年是错的,导致增长速度也是错的。下同) 从而得知,2003 年与 1987 年相比,该地区社会商品零售额共增长 254.43%。 (2)1987 年至 2003 年之间,年平均发展速度为:2 0 0?3 1 9 x2003 8716x1987= 3...23%可知,1987 年至 2003 年之间,年平均增长速度为 8.23%。 (3) 若 x1997=30 亿元,按平均增长速度 8.23%计算 x2004, 即由2 0 0?4 1 9 x2004 97x1997? 1 ? 8.23%(亿元)得x2004= 30 ? (1 ? 0.0823)7 ? 52.1867可知,按照假定,2004 年的社会商品零售额应为 52.1867 亿元 ●3.某地区国内生产总值在
年平均每年递增 12%,
年平均每年递 增 10%, 年平均每年递增 8%。试计算: (1)该地区国内生产总值在这 10 年间的发展总速度和平均增长速度; (2)若 2000 年的国内生产总值为 500 亿元,以后平均每年增长 6%,到 2002 年可达多少? (3)若 2002 年的国内生产总值的计划任务为 570 亿元,一季度的季节比率为 105%,则 2002 年一季度的计划任务应为多少? 解:设 i 年的环比发展水平为 x i,则已知的三段年均增长率表示为:1 9 9?3 1 9 x1993 90x19901 9 9? 1 9x? 1 ? 12% ,即x1993 3 ? 1 ? 12%) ( x 4 ? 1 ? 10%) ( x 3 ? 1 ? 08%) ( x1997x19932 0 0?0 1 9 x2000 97? 1 ? 10% ,即x1997? 1 ? 8% ,即(1) 该地区国内生产总值在这 10 年间的发展总速度为41 x 3 = (1 ? 12%) ? (1 ? 10%) ? (1 ? 8%) ? 2.59117 ? 259.12% x1990则平均增长速度为:102.59117 ? 1 ? 1.09989 ? 1 ? 9.989%(2) 若 x 亿元,以后平均每年增长 6%, 即由2002 ? 2000x2002 ? 1 ? 6% x2000得到x ? (1 ? 6%)2 ? 561.80 (亿元) ,可知,若 2000 年的国内生产总值为 500 亿元,以后平均每年增长 6%,到 2002 年可达 561.80 亿元。 (3) 若 2002 年的国内生产总值的计划任务为 570 亿元, 一季度的季节比率为 105%, 则 2002 年各季度的平均计划任务是 570÷4 亿元, 于是,2002 年一季度的计划任务为: 。 142.5 ?105% ? 149.625 (亿元) ●4. 某公司近 10 年间股票的每股收益如下(单位:元) : 0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50 (1)分别用移动平均法和趋势方程预测该公司下一年的收益; (2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向? 解: (1) *用移动平均法预测该公司下一年的收益: 在 Excel 中作出 10 年间股票的每股收益表,添加“五项平均”计算列,选定“五 项平均”列中的第三行单元格,点击菜单栏中“∑”符号右边的小三角“” ,选择点击: 自动求和→平均值, 用鼠标选定前五个数据(b2:b6), 回车, 即得到第一个五项平均值 “0.96” 。 选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右下方,当鼠标变 成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移 动平均法计算的趋势值,如下表: 年序 每股收益 五项平均 1 2 3 4 5 6 7 8 9 10 0.64 0.73 0.94 1.14 1.33 1.53 1.67 1.68 2.10 2.50― ―0.96 1.13 1.32 1.47 1.66 1.90― ―再利用上表的计算结果预测第 11 年的每股收益: 选定上 Excel 表中的全部预测值,并将鼠标移动到该选定区域的右下方,当鼠标变成42 黑“+”字时,压下左键并拉动鼠标到该列第 11 年对应的单元格处

我要回帖

 

随机推荐