用多样本卡方检验验推断两个样本率、多个样本率是否来自同一总体时,对理论频数分别有何要求?

1999――2015年山东大学卫生综合历年试题集锦_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
1999――2015年山东大学卫生综合历年试题集锦
&&山大卫生综合
阅读已结束,下载文档到电脑
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩20页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢山东大学2014年卫生综合考研真题
名词解释(10*10)
1.疾病监测
2.分子流行病学
4.决定系数
5.环境内分泌干扰物
6.有效温度
7.occupational tumor
8.静力作业
9.长链多不饱和脂肪酸
10.食品卫生监督,&
简答题(20'*10)
1.请举例说明在病因判断标准中如何看待暴露与疾病之间关联的合理性。
2.请简述传染病的潜伏期在传染病控制中的意义并举例说明。
3.用卡方检验推断两个样本率、多个样本率是否来自同一总体时,对理论频数分别有何要求?若不满足条件如何处理?
4.请解释检验假设中所得的概率P的意义,并说明为什么该概率≤α时拒绝H0,>α时不拒绝H0。
5.简述环境噪声污染对人群健康的危害。
6.试述环境影响评价的程序与方法。
7.我国工作场所有害因素职业接触限值有哪些表现形式?其制定的依据和原则是什么?
8.生产性毒物危害的控制原则有哪些?驱铅的首选药物是什么?.&
9.具有抗氧化作用的营养素有哪些(任选5个)?试述各自的抗氧化机理。
10.试述常见引起亚硝酸盐食物中毒的原因、诊断依据、发病机理和急救措施。
更多详细资料咨询QQ:
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。  卡方检验(chi-square test,chi-squared,test)也译为卡方检定,是参照来求取机率和的统计检定,是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论和实际频数的吻合程度或拟合优度问题。  它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。种类  根据不同的场合,有多种不同的卡方检定可运用。例如:  皮尔森卡方检定,是最有名的卡方检验,有两种用途,分别是“适配度检定”(Goodness of Fit test)以及“独立性检定”。科学文章中,当提到卡方检定而没有特别注明是哪一种时,通常便是指皮尔森卡方检定。  叶氏连续性修正:当用皮尔森卡方检定做独立性检定时,若任何一个字段的期望次数小于5,会使“近似于卡方分配”的假设不可信,统计值会系统性地偏高,导致过度地拒绝虚无假设,此时可以做叶氏连续性修正。  Cochran–Mantel–Haenszel chi-squared test。  McNemar's test,用于某些 2×2 表格的配对样本。  Tukey's test of additivity。  portmanteau test,用于时间数列分析里检定自我相关的存在。  似然比检验(英语:likelihood ratio test),在建立统计模型时,用于检定证据是否支持某个复杂的模型(使用变量较多)优于简单的模型(使用变量较少),其中简单模型所使用的变量全部包含于复杂模型中。运用  建立(Null Hypothesis),即认为观测值与理论值的差异是由于随机误差所致;  确定数据间的实际差异,即求出卡方值;  如卡方值大于某特定概率标准(即显着性差异)下的理论值,则拒绝零假说,即实测值与理论值的差异在该显着性水平下是显着的。基本思想  在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?处理发癌数未发癌数合计发癌率甲组52197173.24乙组3934292.86合计912211380.33  52、19、39、3是表中最基本的数据,因此,上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。类型四格表资料的卡方检验  四格表资料的卡方检验用于进行两个率或两个构成比的比较。  1)专用公式:  若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad - bc)2 n/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)  2)应用条件:  要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。行X列表资料的卡方检验  行X列表资料的卡方检验用于多个率或多个构成比的比较。  1)专用公式:  r行c列表资料卡方检验的卡方值=    2)应用条件:  要求每个格子中的理论频数T均大于5或1&T&5的格子数不超过总格子数的1/5。当有T&1或1&T&5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行X列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。列联表资料的卡方检验  同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。  1)R*C 列联表的卡方检验:  R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。  2)2*2列联表的卡方检验:  2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=(ad - bc)2 n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=( |b - c| - 1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。  列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。应用实例适合度检验  实际执行多项式试验而得到的观察次数,与虚无假设的期望次数相比较,称为卡方适度检验,即在于检验二者接近的程度,利用样本数据以检验总体分布是否为某一特定分布的统计方法。这里以掷骰子为例介绍适度检验的方法。  例1:  (1)假设掷一骰子120次,各点数共出现次数为a,b为各点数出现的期望值120x1/6=20,建立工作表文件,如图1所示。  (2)设置零假设Ho:观察分布等于期望分布。  (3)计算卡方检验统计量,如图2所示。  D2=(B2-C2)2/C2  D_8=SUM(D2:D7)  (4)确定自由度,(6-1)×(2-1)=5;选择显着水平α=0.05。  (5)利用Excel提供的CHIINV函数求临界值,在D9单元格中键入“=CHIINV(0.05,5),按回车键,得临界值11.07。  (6)比较临界值和统计量,11.07&2.3,即临界值大于统计量,故差异不显着,接受Ho。独立性检验  卡方独立性检验是用来检验两个属性间是否独立。一个变量作为行,另一个变量作为列。下面一例便是介绍卡方独立性检验的方法。  例2:  某机构欲了解现在性别与收入是否有关,他们随机抽样500人,询问对此的看法,结果分为“有关、无关、不好说,,三种答案,图3中县调查得到的数据。  下面是利用Excel解决此问题的步骤。  (1)零假设Ho:性别与收入无关。  (2)确定自由度为(3-1)×(2-1)=2,选择显着水平α=0.05。  (3)求解男女对收入与性别相关不同看法的期望次数,这里采用所在行列的合计值的乘机除以总计值来计算每一个期望值,如图4所示,在单元格B9中键入“=B5*E3/E5”,同理(第一个等于号理解为在单元格中键入):  B10=“=B5*E4/E5”,  C9=“=C5*E3/E5”,  C10=“=C5*E4/E5”,  D9=“=D5*E3/E5”,  D10=“=D5*E4/E5”。  (4)利用卡方统计量计算公式计算统计量,在单元格B15中键入“=(B3-B9)^2/B9”,其余单元格依次类推,结果如图5所示。  (5)利用Excel提供的CHIINV函数计算显着水平为0.05,自由度为2卡方分布的临界值,在Excel单元格中键入“=CHIINV(0.05,2)”按回车键,得临界值为5.9915。  (6)比较统计量度和临界值,统计量21.4675大于临界值5.9915,故拒绝零假设。统一性检验  检验两个或两个以上总体的某一特性分布,也就是各“类别”的比例是否统一或相近,一般称为卡方统一性检验或者卡方同质性检验。下面一例便是利用卡方统一性检验的例子。  例3:  某咨询公司想了解南京和北京的市民对最低生活保障的满意程度是否相同。他们从南京抽出600居民,北京抽取600居民,每个居民对满意程度(非常满意、满意、不满意、非常不满意)任选一种,且只能选一种。将统计结果键入Excel工作表中,如图6所示。  下面是利用Excel解决此问题的步骤。  (1)零假设H0:南京和北京居民对最低生活保障满意程度的比例相同。  (2)确定自由度为(4-1)×(2-1)=3,选择显着水平α=0.05。  (3)求解卡方检验的l临界值,在Excel单元格中键入“=CHIINV(0.05,3)”,按回车键得临界值为7.81。  (4)计算北京和南京不同满意程度的期望值,在单元格Bll和Cll中分别键入“=$B$7*D3/$D$7”和“=$C$7*D3/$D$7”,选中B11:Cll,按住C11右下角填充控制点,填充至C14。  (5)计算卡方统计量,在单元格B19中键入“=(B3-B11)2/Bll”,其余单元格依次类推,结果如图7所示。  (6)比较统计量和临界值,统计量1.3875小于临界值7.81,故接受零假设。
词条分类[]
按学科分类:
按行业分类:
按地域分类:
开放式分类:
注释信息[]
扩展阅读[]
相关词条[]
申明:1.中文百科在线的词条资料来自网友(一些人是某学科领域的专家)贡献,供您查阅参考。一些和您切身相关的具体问题(特别是健康、经济、法律相关问题),出于审慎起见,建议咨询专业人士以获得更有针对性的答案。2.中文百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将及时给予删除。3.如需转载本页面内容,请注明来源于www.zwbk.org
词条保护申请
* 如果用户不希望该词条被修改,可以申请词条保护
* 管理员审核通过后,该词条会被设为不能修改
注意:只有该词条的创建者才能申请词条保护
本条目由以下用户参与贡献
评论评论内容为网友展开的讨论,与本站观点立场无关[]《07卡方检验及秩和检验》
07卡方检验及秩和检验
●实际频数(actual frequency):即实际观察值。●理论频数(theoretical frequency):在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。●卡方界值表:将卡方分布右侧尾部面积等于a 时所对应的卡方值称为卡方分布的临界值,对于不同的自由度及a 有不同的临界值,由这些临界值构成的表即卡方界值表。拟合优度(goodness of fit):指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。●配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A 处理,另一个接受B 处理,每种处理的反应都按二项分类。全部n 对实验结果的资料以表8-12 表示,这样的表称为配对四格表双向有序分类资料:对于R? C 表资料,当两个定性变量都有序时,这样的资料称为双向有序分类资料,如“急性放射病分度与放射烧伤面积占不同体表面积的百分比”,这里的两个变量均为有序的。●率的标准误:用以衡量由于抽样引起的样本率与总体率之间的误差的统计量,记为,π为总体率,n 为样本容量;当总体率π未知时,以样本率P 作为π的估计值,率的标准误为●多个率的两两比较:指当假设检验确定了多个率之间存在差别后,检验哪两个两个样本率之间的差别具有统计学意义的方法。 ●Fisher 精确概率:指当四格表中出现理论数小于1 或n<40 时,用R.A.Fisher (1934)提出的方法直接计算出的有利于拒绝H0 的概率。●McNemar 检验:McNemar’s test for correlated proportions,是分析配对四格表资料的方法,其计算公式 ●Yates 校正:英国统计学家Yates F认为,由于卡方分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的卡方值不连续,尤其是自由度为1 的四格表,求出的概率P 值可能偏小,此时需对卡方值作连续性校正(correction of continuity),这一校正即所谓的Yates 校正(Yates’ correction)。●秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank )。●秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。★卡方检验的用途:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验★卡方检验的基本思想:1.卡方 检验的基本思想是以卡方 值的大小来反映理论频数与实际频数的吻合程度。在零假设H 0(比如H 0:p 1=p 2)成立的条件下,实际频数与理论频数相差不应该很大,即卡方值不应该很大,若实际计算出的卡方 值较大,超过了设定的检验水准所对应的界值,则有理由怀疑H 0的真实性,从而拒绝H 0,接受H 1。2. 基本公式:,A 为实际频数(Actual Frequency ), T 为理论频数(Theoretical Frequency )。四格表卡方检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的卡方 值是一致的★四格表的确切概率法当四格表有理论数小于 1 或n <40 时,宜用四格表的确切概率法。★卡方检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T 40 时,用连续性校正卡方检验;,或 时,用Fisher 精确概率法。2.对于R ? C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5 的格子数不应超过全部格子的1/5;(2)注意考察是否有有序变量存在。对于单向有序R ? C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ? C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ? C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。★参数统计与非参数统计1. 参数统计样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。2. 非参数统计样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametricstatistics ),或称为不拘分布(distribution-free statistics )的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数) 作出特殊假设。★非参数统计的特点和适用范围1.特点(1)样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。(2)收集资料方便,可用“等级”或“符号”来评定观察结果。(3)多数非参数方法比较简便,易于理解和掌握。(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。2.适用范围(1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容) 。(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法★“对某资料进行统计分析时,应尽量采用参数检验方法,一般不易采用非参数检验方法”,试评价这种说法正确否?答案:应根据设计的方案、资料性质和分析过程中所遇到的实际情况等来确定采用何种统计检验方法。当资料满足参数检验方法时,必须使用参数检验方法。反之,当资料不满足参数检验方法时,如资料分布不明、呈偏态分布、方差不齐、等级资料时,必须采用非参数检验方法。在实际工作中,许多资料不满足参数检验的条件,非参数检验并不比参数检验应用的场合少。所以,以上说法不正确。本文由()首发,转载请保留网址和出处!
免费下载文档:卡方检验_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
&&卡方检验是用途很广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
阅读已结束,下载文档到电脑
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩37页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢

我要回帖

更多关于 卡方检验 样本量 的文章

 

随机推荐