诊断试验样本量可研估算投资误差中的容许误差多少合适

概念:什么是诊断试验?;一、诊断试验研究意义和设计原则;(一)诊断试验的意义;?正确诊断是预防、治疗措施决策的基础;?创造新方法、淘汰旧方法势在必行;?诊断试验研究是临床常用的研究方法之一;也是方法;?诊断试验研究和评价是每个医务人员必备的基本知识;?基础研究也要做这方面的研究,如唾液酸、支原体试;诊断试验的应用:;?诊断试验应用非常广泛;?可应用于疾病诊断
概念:什么是诊断试验?
一、诊断试验研究意义和设计原则
(一)诊断试验的意义
?正确诊断是预防、治疗措施决策的基础。
?创造新方法、淘汰旧方法势在必行。
?诊断试验研究是临床常用的研究方法之一;也是方法学研究的常用方法。
?诊断试验研究和评价是每个医务人员必备的基本知识与技能。
?基础研究也要做这方面的研究,如唾液酸、支原体试剂盒、肿瘤标志物.
诊断试验的应用:
?诊断试验应用非常广泛。
?可应用于疾病诊断、病原学诊断、疗效和预后诊断、药物不良反应的检测、人群中的普查、
?预防医学新的检测方法、基础医学中新的检测方法、新的病理诊断方法、某种疾病的判断方
(二)诊断试验评价的设计要点:
诊断实验设计时要注意以下几点:
1.确定可靠的金标准:注意金标准的准确性和可行性。
2.选择合适的研究对象:金标准:有病、无病
实验组:应包括疑似病例、各种病情病程、易混淆病例。
3.诊断的可靠性:正式试验前先进行可靠性试验,计算变异系数和一致性,注意控制实验条件,
仪器、试剂、质量控制。
4.如实报告结果,盲法判断结果。
5.样本含量足够:
P-敏感度或特异度
δ-容许误差
α-第一类错误的概率
5、样本含量计算:
1)当灵敏度和特异度接近50%时,可用近似公式计算:
n=(uα/δ)p(1-p)
uα正态分布中累计概率为α/2时的u值
(如u0.05/2=1.96,u0.01/2=2.576),
δ-指允许误差,
p-预试验时的灵敏度或特异度。
2)当预期的灵敏度或特异度小于20%或
大于80%时,资料呈偏态分布,需要
对率采用平方根反正弦转换,
按下公式计算:
二、诊断试验的研究设计
(一)要求:理想的诊断方法应该是准确度高、精密度高、安全、无不适感、作用迅速、操作
简单易行、效率高、价格低廉。最重要的是准确度高。
(二)诊断试验设计步骤:
1.确定金标准(gold standard)
诊断试验的效果评价必须建立一个科学、可靠和公认的对比标准,即?°金标准?±,是
指当前医学界公认的、最可靠的、准确度高的诊断方法作为比照的统一标准。
金标准选择不当造成的偏移称为不完善金标准偏移(imperfect gold standard bias)
1.确定金标准(gold standard)
金标准要求:
1)针对性强:能够准确地区分有病无病(患者、非患者)、阴性阳性。
2)费用低,操作容易,可行性好:简便、实用、经济。
包括基因诊断、病理学诊断、冠状动脉造影、CT、磁共振(MRI)、放射标记扫描等。
3)金标准确定方法
?根据专业知识确定;
如:诊断恶性肿瘤:金标准是病理切片,深部组织癌症CT、核磁共振成像等
?查找相关的标准(GB);
如:水中汞、铅、镉测定,可查“饮用水水质卫生标准”配套的检测方法。
?如果没有金标准,可采用不完善参照试验作“金标准”。
4)金标准选择不当的影响
?产生金标准偏移:金标准选择不当影响了诊断试验的正确评价(不能正确区分患者与非患
者),称为金标准偏移。避免金标准偏移的办法:采用一系列的检查、化验的方法论证。
?产生合并偏倚:金标准选择不当,将假阳性判断为真阳性或将假阴性判断为真阴性,使诊断
的准确度高估,称为合并偏倚。
?产生证实偏倚:由于某些原因,部分采用金标准,部分使通过其他方法确诊,使诊断的准确
度产生的偏倚称为证实偏倚。
2.研究对象的选择
1)试验组:诊断试验研究的目的一般是要论证待研究的诊断方法是否具有诊断价值,所以选
择实验组研究对象选择应该具有代表性。症状和体征典型与不典型,不同临床病程早、中、晚
期,不同病情轻、中、重型。
2)对照组:具有鉴别诊断的意义。通常选用容易与该病混淆而又确实未患该病的其他病人或
正常人作为对照。
3)病例选择不当通常会产生选择性偏倚,选择性偏倚中最常见的是频谱偏倚。
3.诊断(试验)指标确定
?此处的诊断指标指的就是待研究的指标(或试验指标)。选择指标时尽可能地选择客观定量
?在进行待研究(试验)指标与金标准进行比较时,要尽可能采用盲法,特别是定性指标强调
盲法。以避免评阅偏依产生(review bias)。(已知金标准结果,在待测诊断指标测量时带有偏
向产生的偏依称评阅偏依)
?试验评阅偏倚:未采用盲法,研究者事先知道金标准的诊断结果所产生的偏倚叫试验评阅偏
?诊断评阅偏倚:未采用盲法,研究者在判断金标准结果时,事先知道诊断试验结果,所产生
的偏倚叫诊断评阅偏倚。
?诊断评阅顺序偏倚:研究者在评价两个诊断试验时,评价后一个实验结果受前一个试验结果
的影响,所产生的偏倚叫诊断评阅顺序偏倚。
4.截断点的选择(cut off point)
?诊断试验的截断点又称分界点、截割点、诊断界值(criticl value), 指诊断试验中用以划分阳
性与阴性的分界值。
临床上常用参考值范围(正常值)作为判断正常与否。
从下图可见如果截断点右移则会增加误诊率;截断值左移就会增加漏诊率。
1)实际工作重要根据不同资料、不同指标选择截断值。
上图说明:
?A图:体内毒物测定,N与Y没有重叠,应设a、b两个界点,a→b 间为可疑。
?B图:传染性疾病的指标,上限与下限在同一水平,只取1个界点,&C非病,≥C患者。
?C图:N与Y重叠面积较小,假阴性与假阳性面积接近5%,界点为d,如肿瘤标志物检测,
&d非病,&d患者。
?D图:N与Y有较大重叠面积,如激素及其他生物活性物的含量,应设两个界点e和f,&e
非病,&f患者, e →f间为可疑。
2)实际工作中还要考虑是减少漏诊率还是减
少误诊率为主?
?某些疾病发现后治疗无效,目的在于排除出病例,以减少误诊,需要较高的特异度,此时选
择较高的截断值。
?如果疾病早诊断早治疗可促进预后,目的在于早诊断,提高敏感度,减少漏诊率,可选择较
低的截断值。
?如果既要考虑灵敏度又要兼顾特异度,可选择Youden指数最大,或选择阳性似然比最大的
5.同步盲法测试:经金标准确定的试验组和对照组同步接受新的诊断试验方法盲法测定。
6.统计学分析与评价:
与金标准测定结果比较分析,统计学指标:敏感度、特异度、似然比、预测值、youden
指数等,同时还要进行统计学推断。
三、诊断试验的评价指标及其意义
诊断试验指标包括诊断试验特性指标和预断(值)指标;其中阳性预测值(PV+)和阴性预
测值(PV-)属于预断值。敏感度和特异度是任何诊断试验必须具备的两个基本特征指标。
新方法与金标准比较
新的诊断试验效果如何,只能与金标准比较,与金标准比较时,其结果数据可用2×2
四格表归纳比较分析。
比较有四种情况:
a?a金标准+,新方法+,真阳性数。
d?a金标准-, 新方法-,真阴性数。
b?a金标准-, 新方法+,假阳性。
c?a金标准+,新方法-,假阴性。
诊断试验的指标及其意义
(一)诊断试验的基本指标及其意义
1.灵敏度(sensitivity,Se)与漏诊率:指用金标准已确诊为病人的对象中,用该试验检查判断为
阳性者(效能)所占的百分比。真阳性率.
灵敏度与漏诊率互为补数,漏诊率=1-Se
2.特异度(specificity,Sp)与误诊率:指用金标准确诊的未患某病的对象中,用新诊断法为阴性的
的部分所占比例(正确鉴定非本病的效能),真阴性率。
特异度与误诊率互为补数,误诊率=1-Sp
灵敏度与特异度关系:
理想的诊断实验灵敏度与特异度都高,但一般不可能,灵敏度高时特异度就会低;
特异度高时灵敏度则会低。两者关系见下表。
灵敏度、特异度关系
2h后血糖mg/dl
灵敏度(%)
特异度(%)
诊断试验的指标及其意义
3. 假阴性率( ? ):指确有本病存在的患者中,用新方法检查结果呈阴性的频率,即漏诊率。
灵敏度=1- ?
4. 假阳性率( ? ):指确无本病存在时,该试验检查呈阳性的频率,即误诊率。特异度=1- ?
(二)正确度与Youden指数
?灵敏度和特异度分别从不同单方面考察了诊断试验的诊断准确度,而正确度和Youden指数可将灵敏度和特异度结合起来对诊断试验进行综合评价。
5. 正确度(accuracy)
?正确度又称总符合率,指诊断试验诊断正确的例数占总例数的百分比,诊断正确的例数包括患者中被检测为阳性的例数和非患者中被检测为阴性的例数。正确度的计算公式为:
?也可以表示为:
?可见,正确度为灵敏度和特异度的加权平均数,权重为患者与非患者占总例数的比例。因此,正确度受灵敏度和特异度影响;
?如果研究对象为病例和对照的随机样本,正确度与病例组和对照组的样本含量比例有关; ?如果研究对象为人群中的随机样本,正确度与人群患病率有关。
?如在患病率较低的人群中进行诊断试验,即使灵敏度很低的试验,也可获得较高的正确度。
6. Youden指数:又称正确诊断指数,是指诊断试验中真阳性率和真阴性率之和减去基数(1或100%)。
?Youden指数是评价检验效能综合指标之一。
?Youden指数的取值在-1~1之间,一般认为yi(J)要&0.5才有诊断价值,说明诊断试验的准确度越高。
?缺陷:α=0.3,β=0.7和α=0.7,β=0.3指数相同
?似然比也是综合灵敏度和特异度的评价指标。
7. 阳性似然比
阳性似然比(positive likelihood ratio,LR(+))定义为灵敏度和1-特异度之比,即真阳性率和假阳性率之比,表示患者检出阳性的概率是误诊率的多少倍。计算公式为:
?阳性似然比的取值在0~∞之间,其值越大,诊断试验越好。
8.阴性似然比(negative likelihood ratio,LR(-))定义为(1-灵敏度)和特异度之比,即假阴性率和真阴性率之比,表示患者检出阴性的概率是非患者的多少倍。计算公式为:
?阴性似然比的取值在0~∞之间,其值越小,诊断试验越好。
?例:以糖化血红蛋白(GHb):为金标准,正常值为4%-6%,研究用空腹血糖(FPG)诊断糖尿病,(≥5.6mmL/L为糖尿病患者),以金标准诊断的245例糖尿病患者为研究对象,45名正常人为对照结果如表。
=227/227+18=92.65%
=29/21+29=58.00%
?FNR = 1-Se = 1-92.65% = 7.35%
包含各类专业文献、行业资料、中学教育、应用写作文书、高等教育、文学作品欣赏、诊断试验28等内容。 
 (一)反应诊断试验的评价指标 临床上的诊断试验是要把患者与非患者区分开来, 但由于人为因素或者试验 环境的影响, 在诊断中出现误诊和漏诊是难免的,我们应该掌握...  Revman,Stata,Meta-disc 在诊断试验准确性(DTA) 系统评价中的应用文献数据摘自《ProGRP 与 NSE 对小细胞肺癌诊断价值的 meta 分析》 文中提取数据作者 国家 研究...  抗凝物质 筛检试验:bleeding time、toumequet test 诊断试验:vWF 抗原/活性、6-酮-前列腺素 F1 α 、thrombomodulin 测定 血小板检测数量、功能 筛检试验:计数、...  14页 20财富值 诊断学实验部分的总结 52页 20财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 ...  如唾液酸、 基础研究也要做这方面的研究 如唾液酸、支原体试剂盒、肿瘤标志物 诊断试验的应用: 诊断试验的应用: 诊断试验应用非常广泛。 诊断试验应用非常广泛。 ...  实验诊断学名词解释_临床医学_医药卫生_专业资料。实验诊断学名词解释 字母数字 ??C-肽:是胰岛素原在蛋白水解酶的作用下分裂而成的与胰岛素等分子的肽类物。 ...  诊断学实验室检查_临床医学_医药卫生_专业资料。血液 1、 血常规内容: 血红蛋白测定.红细胞计数.红细胞平均值测定和红细胞形态监测; 白细胞计数及其分类计数; 血小...  诊断学试验指导_医药卫生_专业资料。诊断学试验指导实验一、 实验一、活化凝血时间测定【实验原理 实验原理】 同试管法 CT 测定。 试验中加入白陶土-脑磷脂的悬液...  E 病毒性脑膜炎 17.诊断支原体肺炎,应选择哪种免疫学检查( )? A.肥达氏反应 B.酶联免疫吸附试验? C.胶乳凝集试验 D.冷凝集试验 ? E 荧光免疫技术 18....导读:我们已知实验研究的目的是获取处理因素作用于受试对象后产生的真实效应,下降的血压值为实验效应(e),但在临床实验中,我们统称为非处理实验效应(S),可示意如下:,若实验与“0”对照的非处理因素相同,以及被忽视了的非处理因素、实验对象的差异、测量误差等等,T+NT我们称这一模型为实际实验模型,实验效应e+E可由实验总效应差来求得,标准误的大小来估计,将要在以后介绍的各种设计方案都是基于实验设计的这
客观性:观察指标有主观指标和客观指标之分,主观指标是由病人回答或医生判断来描述观察结果;而客观指标则是借助仪器或试验等进行测量和检验来反映观察结果。特别是在临床试验中,主观指标易受心理因素影响,例如:“疼痛”这一指标就很难量化,若是用针刺深度来表示,还是要由受试者表达,仍然有很大的主观成分,因此尽量选用客观的、定量的指标。
特异性: 选择的指标应能反应处理因素的效应本质,特异性高的指标最易揭示处理因素的作用,不易受混杂因子所干扰,减少假阳性率。例如甲种胎儿球蛋白(AFP)对于原发性肝癌就是比较特异的指标,又如血糖高低是诊断糖尿病患者基本的依据,显然血糖在糖尿病研究中是特异性高的指标。
我们已知实验研究的目的是获取处理因素作用于受试对象后产生的真实效应,例如观察某降压药对高血压病人的降压效果,降压药为处理因素(T),下降的血压值为实验效应(e)。 但在临床实验中,获得血压下降值并非单纯是该药物的作用,往往病人的精神、环境、护理情况等非处理因素(NT)也会对高血压起干扰作用,我们统称为非处理实验效应(S),可示意如下:
高血压患者
下降的血压值
现采用“0”处理(即空白)对照来鉴别处理因素的效应:
此时,若实验与“0”对照的非处理因素相同,即NTT=NT0,那么它们产生的非处理的效应也相等, ST- S0 获得的下降血压值就是该药的真实效应e,若e?0, 处理因素有效。我们称这个模型为理想模型。但在实际情况下很难保证NTT和H0 完全相等,因为还存在现有科技水平尚未发现的因素影响,以及被忽视了的非处理因素、实验对象的差异、测量误差等等。这些都会使NTT与NT0不等。因此,我们在设置良好的对照、分层处理数据等等措施后仍不能达到NTT=NT0时,可以将非处理因素效应的差异看作是随机误差(E), 即 ST=S?T+E1和S0=S?0+E2, 则ST -S0=E0, 此时可建立如下模型:
我们称这一模型为实际实验模型。统计推断的基本思想就是以随机误差的产生为基础的,如何判断效应e+E是由T引起还是由NT引起的,这就是要看e与E的比重。一般来讲,实验效应e+E可由实验总效应差来求得;随机误差E可用
标准误的大小来估计,在S中,假定e+E不变,E愈小,这个比值就愈大,说明处理因素T产生的效应就愈明显,比较组的差异(e)就愈易显示出来。这种处理可以推广到多个处理间的比较中去。即方差分析问题,随着误差项离差平方和的进一步分解,各种因素的处理效应就能更好地显示出来。将要在以后介绍的各种设计方案都是基于实验设计的这一基本原理而建立的。
实验误差与控制
已知医学实验研究中“处理”具有真实效应,同时受非实验因素的干扰,使其真实效应不能准确地反映出来,这样获得的观测值既包含处理的真实效应,又包含这些非处理因素的作用效应,以及其他未知的偶然因素的作用,加之生物具有的变异性特征,使得所获取的观测值出现变查差。上述这些因素使观测值偏离实验处理的真值,我们将这些偏差称为实验误差(experiment error). 弄清产生
实验误差的来源,控制误差的来源是实验设计的重要任务。
(一)系统误差和随机误差
实验误差的控制
实验设计的主要作用是减少误差,提高实验的精确度,使研究者能从实验结果中获得无偏的处理统计量及实验误差的估计值,从而进行正确地分析和比较。
(一) 对照(control)
在确定处理因素的实验组时,要同时设立不加处理的对照组,这是非常重要的。因为只有设立了对照,才能消除非处理因素对实验的影响,从而把处理因素的效应充分显示出来,这是控制各种混杂因素造成的系统误差的基本措施。在医学研究中,不乏这样的实例。例如20世纪20-30年代,治疗结核病的金制剂疗法长达15年之久,印度名医为此发表论文数以白计,并作为定论编入医学院的讲义。在沿用15年后,由于采用了有效的临床试验 (controlled clinical trails), 才对它作了否定的评价。
(二) 随机化分组
随机化(randomization)是将实验对象的实验顺序及分组进行随机分配。这是保证非处理因素均衡一致的另一重要手段。随机分组的实质就是要使每个受试对象分到实验组和对照组的机会相等。这已成为实验设计中的一项重要原则。
(三) 重复
重复(replication)是指处理组与对照组的受试者要有一定数量,也就是一个样本含量(sample size)大小问题。“重复最主要的是估计实验误差,我们已知实验误差客观存在,只有重复测量实验效应的指标,才能通过观测值的差异计算出误差的大小,并降低实验误差。
正确估计观察例数的标准应该是保证研究课题具有一定代表性与可靠性
的条件下所必须具有的最少例数,要符合这一标准,必须具备以下条件:
1、 具有研究指标的总体均数?、总体?的估计值――样本均数、标准差及
样本率,这些值来源于以往的实验,通过查阅文献资料提供,或从研究者所作的预备实验结果中获取。
2、 确定的容许误差, 即相比较的两总体参数的差值?,如
,?=?1-?2,
3、 第一类错误的概率?,?越小,需要的例数越多,一般取?=0.05,可根
据具体情况进行调整。
4、 第二类错误的概率?, 1-? 又称统计效能,1-? 越大,需要的例数越
多,一般取1-?=0.8 或0.9,否则易出现假阴性结果。
5、 明确单侧或双侧。
具备以上条件后,再按不同研究设计所确定的统计检验,选择相应的公式来计算样本例数。
包含总结汇报、专业文献、资格考试、应用文书、考试资料、旅游景点、出国留学、人文社科以及实验设计及样本量的估计等内容。本文共2页
相关内容搜索关注今日:1 | 主题:89978
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】求助样本量计算?
页码直达:
这个帖子发布于5年零53天前,其中的信息可能已发生改变或有所发展。
本人准备做关于高血压的社区干预试验,需要算样本量,准备分干预和对照组(1:1),两组均是高血压患者,假设alpha=0.05, beta=0.2 ,SBP平均下降5mmHg认为有效,已经做了基线调查,获得了高血压在社区患病率。求助各位懂统计的大大,上述样本量的估计方法,样本量怎么计算?感激涕零!
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
怎么没有人帮忙看下啊。。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园版主
临床试验样本量计算工具 - 在线计算样本量临床研究中,由于总体或对照组效应值的取得并不容易,一般情况下也只是近似值;而界值的确定,涉及统计和医学专业知识,不同的界值将得出不同的结果,因此,样本量的计算结果,仅作为参考。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园版主
临床医学研究没有绝对的样本量标准,不同的研究方法、研究目的,研究要求和研究资料决定了样本量。一般而言,样本越小,结果的估计越精确。但样本过大或过小均可影响研究的可行性。因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。1.估计样本量的决定因素[1]1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。1.4 显著性水平即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。1.7 总体标准差(s)一般因未知而用样本标准差s代替。1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。表1 标准正态分布的分位数表a(或)β U2a (单侧检验) Ua(双侧检验)U2β(单侧和双侧)0.001 3.092 3.2900.002 2.878 3.0900.005 2.576 2.8070.010 2.326 2.5760.020 2.058 2.3260.025 1.960 2.2420.050 1.645 1.9600.100 1.282 1.6450.200 0.842 1.2822. 样本量的估算方法由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。2.1 现况研究现况研究包括普查和抽样调查两类。抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,在设计中要考虑样本含量问题。2.1.1 首先确定样本量的估算的参数容许的误差(δ):如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少;在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。显著性水平(容许误差的概率α):一般取0.05或0.01。总体标准差(s):根据以往的资料或小规模预调查的结果进行估计。2.1.2 计量资料2.1.2.1 对总体平均数m做估计调查的样本估计公式: n=(Uασ/δ) (式2.1.2.1)式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时, U0.05=1.96,a=0.01时,U0.01=2.58;s为总体标准差;δ为容许的误差。例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/ mm ,允许误差不超过100个/mm ,应调查多少人?N=3500 d=100个/mm s=950个/mma=0.05(双侧) Ua=1.96n=(1.96×950/100) ≈3472.1.2.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2α+ U2β)s/δ](式2.1.2.2-1)双侧检验用:n=[(Uα+ U2β)s/δ](式2.1.2.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值 。2.1.3 计数资料2.1.3.1 对总体率π做估计调查的样本大小公式: n=(Uα/δ) /P(1-P) (式2.1.3.1)式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人? (规定a=0.05)已知:δ=0.02, P=0.14,a=0.05 , Ua=1.96n=(1.96/0.02)2/×0.14(1-0.14) =1156需调查约1160人.2.1.3.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。单侧检验用:n=(U2α+ U2β/δ2) (式2.1.3.2-1)双侧检验用:n=(Uα+ U2β/δ ) (式2.1.3.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值 。2.1.3.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2α+ U2β)s/δ] P(1-P)式2.1.3.3-1)双侧检验用:n=[(Uα+ U2β)s/δ] P(1-P)(2.1.3.3-2)式中: Uα、 U2α、U2β分别为α、2α、2β检验水准的U值 。2.2 病例对照研究的样本量估计选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。2.2.1设置估算样本量的相关值①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);②比值比 (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)③α值,检验的显著性水平,通常取α=0.01或0.05;④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。根据以上有关参数查表或代公式计算公式为:n=(U +U ) /(p1-p0)2 (式2.2.2)p1=p0×OR/1-p0+OR×P0=1/2(p1+p0) =1-q1=1-p1 q0=1-p0式中:U U 分别为a与β检验水准的U值 。p0与P1分别为对照组及病例组人群估计的暴露率;OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。q0=1-P0, q1=1-P1;为两组暴露史比例的平均值,既 =(P1+P2)/2, Q1=1-P1;例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。估计孕妇有30%暴露于此因子。现要求在暴露造成相对危险度为2时,即能在95%的显著性水平以90%的把握度查出,病例组和对照组各需多少例?p0=0.3 OR=2,设α=0.05, β=0.10,用双侧检验Uα=1.96 Uβ =1.282p1=(0.3×2)/[1+0.3(2-1)]=0.46q0=1-0.3=0.7 =1/2(0.3+0.46)=0.38q1=1-0.46=0.54 =1-0.38=0.62n=(1.96 +1.282 )2/(0.46-0.3)2≈192 ,即病例组与对照组各需192人.2.3实验研究的样本量计算2.3.1 计量资料: 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。估计公式为:n=2(Uα+Uβ)2δ2/ d2 (2-3-1)n为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为2n;Uα为显著性水平相应的标准正态差;Uβ为β相应的标准正态差;δ为估计的标准差,δ2=(δ12+δ22)/2;d为两组数值变量均值之差,例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。假设:a=0.05, β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。查表:zα=1.96,zβ=1.282(双侧检验),需要多大样本。2.3.2 计数资料:即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时,按下式计算样本大小:n=[U +U ] /(P -P ) (2.3.2)P :对照组发生率P :实验组发生率:(P + P )/2U 、U 和n所示意义同上。例:假设对照组发病率40%,通过干预措施发病率下降到30%。α水平为5%,1-β为90%,本研究为双侧检验,问二组要观察多少人?=(0.4+0.3)/2=0.35代入公式(16-8):n=[1.96 +1.282 ] /(0.4-0.3)≈476即各组需476人。2.4 诊断试验的样本量估计2.4.1 设置估算样本量的相关值①灵敏度60%;②特异度60%;③α值,检验的显著性水平,通常取α=0.01或0.05;④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。2.4.2 计算公式公式: n=(Uα/δ) /P(1-P) (式2.4.2)式中:Uα为显著性水平相应的U值,通常取α=0.01或0.05;δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为诊断试验的灵敏度或特异度;例:预计所评价的诊断试验的灵敏度为90%,特异度85%;δ=0.025,规定a=0.05,病例组和对照组应调查多少人? ()已知:δ=0.02, a=0.05 , Ua=1.96n=(1.96/0.025)2/×0.85(1-0.85) =783n=(1.96/0.025)2/×0.90(1-0.90) =553对照组需783人, 病例组需553人。参考文献[1] 胡修周.医学科学研究学[M].北京:高等教育出版社.2006,76.
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
学习下,很好的总结!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
asdf159jkl 临床医学研究没有绝对的样本量标准,不同的研究方法、研究目的,研究要求和研究资料决定了样本量。一般而言,样本越小,结果的估计越精确。但样本过大或过小均可影响研究的可行性。因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。1.估计样本量的决定因素[1]1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。1.3 研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。1.4 显著性水平即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。1.5 检验效能检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。1.7 总体标准差(s)一般因未知而用样本标准差s代替。1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。表1 标准正态分布的分位数表a(或)β U2a (单侧检验) Ua(双侧检验)U2β(单侧和双侧)0.001 3.092 3.2900.002 2.878 3.0900.005 2.576 2.8070.010 2.326 2.5760.020 2.058 2.3260.025 1.960 2.2420.050 1.645 1.9600.100 1.282 1.6450.200 0.842 1.2822. 样本量的估算方法由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。2.1 现况研究现况研究包括普查和抽样调查两类。抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,在设计中要考虑样本含量问题。2.1.1 首先确定样本量的估算的参数容许的误差(δ):如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少;在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。显著性水平(容许误差的概率α):一般取0.05或0.01。总体标准差(s):根据以往的资料或小规模预调查的结果进行估计。2.1.2 计量资料2.1.2.1 对总体平均数m做估计调查的样本估计公式: n=(Uασ/δ) (式2.1.2.1)式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时, U0.05=1.96,a=0.01时,U0.01=2.58;s为总体标准差;δ为容许的误差。例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/ mm ,允许误差不超过100个/mm ,应调查多少人?N=3500 d=100个/mm s=950个/mma=0.05(双侧) Ua=1.96n=(1.96×950/100) ≈3472.1.2.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2α+ U2β)s/δ](式2.1.2.2-1)双侧检验用:n=[(Uα+ U2β)s/δ](式2.1.2.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值 。2.1.3 计数资料2.1.3.1 对总体率π做估计调查的样本大小公式: n=(Uα/δ) /P(1-P) (式2.1.3.1)式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人? (规定a=0.05)已知:δ=0.02, P=0.14,a=0.05 , Ua=1.96n=(1.96/0.02)2/×0.14(1-0.14) =1156需调查约1160人.2.1.3.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。单侧检验用:n=(U2α+ U2β/δ2) (式2.1.3.2-1)双侧检验用:n=(Uα+ U2β/δ ) (式2.1.3.2-2)式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值 。2.1.3.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2α+ U2β)s/δ] P(1-P)式2.1.3.3-1)双侧检验用:n=[(Uα+ U2β)s/δ] P(1-P)(2.1.3.3-2)式中: Uα、 U2α、U2β分别为α、2α、2β检验水准的U值 。2.2 病例对照研究的样本量估计选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。2.2.1设置估算样本量的相关值①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);②比值比 (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)③α值,检验的显著性水平,通常取α=0.01或0.05;④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。根据以上有关参数查表或代公式计算公式为:n=(U +U ) /(p1-p0)2 (式2.2.2)p1=p0×OR/1-p0+OR×P0=1/2(p1+p0) =1-q1=1-p1 q0=1-p0式中:U U 分别为a与β检验水准的U值 。p0与P1分别为对照组及病例组人群估计的暴露率;OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。q0=1-P0, q1=1-P1;为两组暴露史比例的平均值,既 =(P1+P2)/2, Q1=1-P1;例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。估计孕妇有30%暴露于此因子。现要求在暴露造成相对危险度为2时,即能在95%的显著性水平以90%的把握度查出,病例组和对照组各需多少例?p0=0.3 OR=2,设α=0.05, β=0.10,用双侧检验Uα=1.96 Uβ =1.282p1=(0.3×2)/[1+0.3(2-1)]=0.46q0=1-0.3=0.7 =1/2(0.3+0.46)=0.38q1=1-0.46=0.54 =1-0.38=0.62n=(1.96 +1.282 )2/(0.46-0.3)2≈192 ,即病例组与对照组各需192人.2.3实验研究的样本量计算2.3.1 计量资料: 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。估计公式为:n=2(Uα+Uβ)2δ2/ d2 (2-3-1)n为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为2n;Uα为显著性水平相应的标准正态差;Uβ为β相应的标准正态差;δ为估计的标准差,δ2=(δ12+δ22)/2;d为两组数值变量均值之差,例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。假设:a=0.05, β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。查表:zα=1.96,zβ=1.282(双侧检验),需要多大样本。2.3.2 计数资料:即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时,按下式计算样本大小:n=[U +U ] /(P -P ) (2.3.2)P :对照组发生率P :实验组发生率:(P + P )/2U 、U 和n所示意义同上。例:假设对照组发病率40%,通过干预措施发病率下降到30%。α水平为5%,1-β为90%,本研究为双侧检验,问二组要观察多少人?=(0.4+0.3)/2=0.35代入公式(16-8):n=[1.96 +1.282 ] /(0.4-0.3)≈476即各组需476人。2.4 诊断试验的样本量估计2.4.1 设置估算样本量的相关值①灵敏度60%;②特异度60%;③α值,检验的显著性水平,通常取α=0.01或0.05;④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。2.4.2 计算公式公式: n=(Uα/δ) /P(1-P) (式2.4.2)式中:Uα为显著性水平相应的U值,通常取α=0.01或0.05;δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为诊断试验的灵敏度或特异度;例:预计所评价的诊断试验的灵敏度为90%,特异度85%;δ=0.025,规定a=0.05,病例组和对照组应调查多少人? ()已知:δ=0.02, a=0.05 , Ua=1.96n=(1.96/0.025)2/×0.85(1-0.85) =783n=(1.96/0.025)2/×0.90(1-0.90) =553对照组需783人, 病例组需553人。参考文献[1] 胡修周.医学科学研究学[M].北京:高等教育出版社.2006,76.非常感谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
受用,谢谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pass软件计算
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园

我要回帖

更多关于 特征值分析容许误差 的文章

 

随机推荐