求有用的植物 案例到统计学分析方法的案例分析的管理定量分析论文 ,不能普遍使用过。请发至,感谢!

念 面对现实中复杂的问题怎样处理? 医学统计学的地位 医学文章中统计分析的应用现状? 中国医学杂志的调查结果 ? 中华系列医学期刊的调查结果 ? 国外权威医学期刊调查结果 ? 国内外调查结果显示? 误用统计分析方法的原因 ? 医学论文中常用的统计分析方法误用辨析 ? 减少医学论文中统计学错误的对策 现代统计学的观念统计学是“对令人困惑费解的问题做出数字设想的艺术。” ---David Freedman “在终极的分析中,一切知识都是历史;在抽象的 意义下,一切科学都是数学;在理性的基础上,所有的判断 都是统计学。” 《统计与真理――怎样运用偶然性》―― C.R.劳 先生 “科学试验做完后再找统计学家分析数据,如同病人死了找 医生进行尸体解剖,医生会告诉你病人死的原因。同样,统计 学家会告诉你试验失败的原因。” ---英国 Ronald Fisher() 面对现实中复杂的问题怎样处理?“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。---英国著名遗传学家GaltonFrancis Galton (~)统计学是处理复杂问题 的工具 医学统计学的地位? 医学统计学如今是热门科学。美国食物和药品管理局 (Food andDrug Administration, FDA )和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制 定有关政策的民意调查、数据分析、决策预测等都需要统计 学家的直接参与。由统计学家指导研究设计、数据分析乃至 准备呈递给FDA的报告。 ? 在我国,医学统计学也越来越受到学术界和有识之士的重视。 医学统计学的地位据调查,柳叶刀(The Lancet)、新英格兰医学杂志(New England J. Medical)、美国医学杂志(JAMA) 、英国医学杂志(British J.Medical) 等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。? “统计学是现代医学大厦的一个重要支柱”。 ---美国医学会杂志(JAMA)主编 ? 统计学能使数据变成信息。数据 data≠information信息对统计学的一知半解常常会造成一些不必要的上当受骗 对统计学的一概排斥往往会造成某些不必要的愚昧无知---《统计与真理》 医学论文中统计分析的应用现状? 在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。但医学论文中尚存在各种统计分析方法应用上的问题, 统计学缺陷涉及面:国外约50%,国内80%以上。主要有:研究设计不合理(设计水平低下); 分析方法选用不得当(方法使用错误);应用条件不遵循;样本含量不满足统计学要求; 结果解释不合理(推断过于肯定);统计报告(报告项目不全)。 医学论文中统计分析的应用现状? 由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机 统计软件现象。 ①不管统计分析方法的前提条件是否鹤悖葜苯哟 入计算机软件中,使得出的结果与实际相差甚远。 ②现有的统计软件使用不太方便,造成用户的误用。 ? 作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。 中国医学杂志的调查结果? 中国医学杂志近800种,其中代表医学最高水平的中华、中国 系列杂志近百种。 ? 据统计:? 中华系列医学杂志发表的论文中有统计问题或错误的达到70%。? 国际著名医学杂志有统计问题或错误也达50%。----&医学统计学基础与典型错误辨析&(胡良平 主编 军事医科院出版2003年) 国外权威医学期刊调查结果Glantz调查了1977年《Circulation Research》和《Circulation》杂志中发表的文章,在使用统计学方法的文章中具有统计学问题或错误的分别有61%和44%。 Kanter等调查了1992年至1993年《Transfusion》杂志发表 的文章,发现75%的文章至少存在一处统计问题或错误。 国内外调查结果显示? 30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文 作者统计知识和统计水平低下”。 ? 近30年来,临床医学论著中统计应用缺陷没有发生根本改善, 误用率仍很高。统计学中特别强调,有缺陷的数据得不出明确的结论!――皮尔逊 (英国统计学家,) 误用统计分析方法的原因1.对统计学的作用重视不够、统计教育的普及不够。我国很多企业投入上千万资金进行计算机数据平台建设, 但投入数据统计分析方面很少。其结果是获得的只是一些简 单的报表,有价值的信息很少。 ------中科院张永光教授 要提高统计信息的科学和真实性,必须在人力、资金财 力、法律上对统计切实加以重视,不只是口头上,以统计P 值来做装饰。 误用统计分析方法的原因2. 统计学教学观念和方法落后? 教学与实际应用结合少;? 教学中结合软件授课少;? 教学人员较少参与医学研究设计、质控、数据管理和分析等;? 教学难以紧跟上统计分析方法与统计软件的发展速度。 误用统计分析方法的原因3.计算机统计软件应用问题? “计算机软件给统计学带来了革命性的变化”,但对于同一份 数据资料,统计学可提供多种不同的分析方法,应用各种分析 方法都有一定的前提条件,采用不同方法所得到的结果不完全 相同。 ? 对于研究者来说,重要的是明确研究设计的类型、判别数据资料的分类、选择恰当的统计分析方法、遵循统计分析方法的应用条件、应用软件实现统计分析、对分析结果的正确解释和表达,则完全依赖于应用者所掌握的统计知识。 误用统计分析方法的原因4.《医学统计学》的学习和应用能力有待提高?不少研究者曾多次学习《医学统计学》课程,但仍然对统计学知识理解很模糊。?有的学生《医学统计学》成绩很好,但是遇到很简单的实际问题也不会解决。 医学论文中常用的统计分析 方法误用辨析一、实验设计存在的典型错误 二、计量资料分析常见的统计问题 三、计数资料分析常见的统计问题四、直线相关与回归分析常见统计错误五、统计分析方法表述问题 六、统计表与统计图方面的问题 七、多元回归分析 一、实验设计存在的典型错误1.1 没有遵循随机原则 1.2 缺乏对照组1.3 对照不全1.4 实验分组不合理 1.5 没有按设计类型进行实验和收集数据 1.6 组间基线资料的均衡性检验 1.7 用“重复取样”替代“独立重复实验” 1.8 样本含量过少 1.1没有遵循随机原则问题: 某研究者人为地选择发病在5d以内的病人进入治疗组,而对照组则没此限制。 辨析: 根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治 愈率和较低的病死率。治疗组和对照组由于人为因素的干扰和影响,在 “病程”这一重要的非实验因素上并没有达到均衡,不具有可比性。 在制定实验设计方案时,应将重要的非实验因素考虑在内,用随机化 法使各组病人在重要的非处理因素方面尽量达到均衡一致,以便提高组间 的可比性。 正确的做法:对病程不做限制或均选择发病在5d之内的病人,在实验分组时遵 循随机的原则,减少人为因素的影响,使入选的任何一个病人有相同的机 会进人治疗组和对照组。 1.2 缺乏对照组问题:辨析:某作者对64例银屑病患者进行血型观 察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没 有进行统计分析,仅正常人群中的血型构成存在较大差异,AB 型的比例为最少,作者没有对正常人群的血型 分布情况进行调查,仅根据自己调查的银屑病 人血型构成相差悬殊的情况,并不能说明银屑 病人与正常人群在血型构成上存在差异,作出 结论也是没有说服力的。正确的做法:凭数字大小,认为银屑病的发病与血型有 明显的关系,同时也证实了遗传致病的决定意义。应设正常对照组,调查正常人群的血 型分布情况,并与银屑病人的血型分布情况对 照不全进行比较,如果存在差异,则为银屑病 的发病因素提供了某种线索,如果没有差异, 则可以认为银屑病发病与血型构成没有关系。 1.3 对照不全文题:姜黄素抑制晶状体上皮细 胞增殖的信号转导机制。 设计:3个实验分组: 1.模型组加入50μ g/L重 组人表皮生长因子(rhEGF); 2.姜黄素(Cur)组加入终浓 度为10μ g/L的Cur和50μ g/ LrhEGF;辨析:本实验实际上涉及了“rhE GF用否”、“Cur用否”两个 实验因素。正确的实验设计应 是这两个实验因素的全面组合, 所以应设4个组(2×2析因设 计)。 作者仅设立3个组,缺了1 个单用10μ g/LCur的实验组, 犯了“对照不全”的错误。3.空白对照组加入等体积 硝酸盐缓冲液。请问:此设计正确吗? 1.4 实验分组不合理文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。问题:作者选取2002年12月~2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄26~69岁,平均53岁; 其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵 巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例 患者随机等分成A、B两组。 请问:此设计正确吗? 1.4 实验分组不合理辨析:? 作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个总体。 ? 把他们随机分入试验组和对照组参加试验,两组之间的可比性可 能很差,其结论的可信度很低。正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。 1.5 没有按设计类型进行实验和收集数据文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。请问:这样做正确吗? 1.5 没有按设计类型进行实验和收集数据辨析:? 作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而是简单地将试验组第1周期的数据和对照组第2周 期的数据合并成试验周期(A为:参芪扶正注射液联合化疗所得的数据),将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所得的数据),并按照化疗后的5个时间点将数据 列表。 ? 这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体 间可能存在的差异,也就达不到交叉设计的目的。 ? 事实上,该文中的试验设计类型更像重复测量设计。 1.6 组间基线资料的均衡性检验文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两组基线特征均衡性好,具有可比性,见表2。 请问:下表是否有不妥之处? 1.6 组间基线资料的均衡性检验辨析: 1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级 资料,这个转化过程损失样本信息。可直接根据资料是否满足参数 检验的条件,可用参数检验,如不满足则用非参数检验。 2.没有提供假设检验的统计量和P值。 3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。 4.当样本较少的成组设计资料比较时,若检验结果为P&0.05时,可能 是由于样本量不满足统计学的要求,而导致检验效能低下。最好的 办法是增加样本量。 1.7用“重复取样”替代“独立重复实验”文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:此设计正确吗? 1.7 用“重复取样”替代“独立重复实验”辨析:? 文章中没有描述实验采集了多少只健康小牛。? 如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用“重复取样”替 代“独立重复实验”的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,亦属重复取样。 ? 只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随 机分配至3组中,进行有关实验处理,才是正确运用了重复原则。 1.8 样本含量过少文题:芪众颗粒预防老年人上呼吸道感染临床研究 问题:三组之间证型分布比较,经R×C卡方检验,无统计学意义,具有可比性 (χ 2=0.809,P&0.05),排前三位的证型依次为:脾肺气虚(62.42%), 脾肾阳虚(17.45%),心脾两虚(6.71%),见表3。表3 三组证型之间比较组别芪众颗粒组(A) 玉屏风颗粒组(B)例数50 49脾肺 气虚 43 32脾肾 阳虚 3 5心脾 肺肾 两虚 阴虚 1 5 1 3心肾 肝肾 阳虚 阴虚 1 3 1 1空白对照组(C)合计 %5014932107 62.421018 17.451737371(0.98)36.71 6.045.37 2.01 1.8 样本含量过少辨析:? 本资料中有一个格子的理论数小于1,说明本资料不可以做R×C卡方检验, 而应该做R×C的fisher’s确切概率法。本资料很多格子的实际数小于5, 应增加样本量。 ? 作者设空白对照组(即观察期间忌服任何预防药物或采用任何预防方法), 这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求, 临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗 法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。? 设置空白对照组只有在动物研究中。 二、计量资料分析常见的统计问题2.1 忽视t检验的前提条件 2.2 误用成组设计资料的t检验分析配对设计资料2.3 忽视方差分析的前提条件2.4 误用t检验分析等级资料 2.5 误用t检验处理重复测量的两因素试验设计 2.6 误用配对设计资料的t检验处理单因素k(k&3)水平设计的资料 2.7 多因素非平衡组合设计的统计错误2.8 正确处理析因设计或嵌套设计定量资料 2.1 忽视t检验的前提条件文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?辨析: 1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验, 否则,采用非参数检验。 2.给出确切的统计量和P值。 2.2 误用成组设计资料的t检验分析配对设计资料 2.2 误用成组设计资料的t检验分析配对设计资料辩析:1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。但本研究是配对设计,如果采用成组t检验,会降低检验效 率。应该采用配对t检验进行分析。注意配对t检验的条件:要 对每对数据的差值(d)进行正态性检验。如果不满足,改用 Wilcoxon符号秩检验。2.应给出确切的统计量和P值。 2.3 忽视方差分析的前提条件文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。 问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代 培养,取第三代细胞进行实验。 实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。 请问:采用方差分析正确吗?均数± 标准 差??确切的统计量和P值 2.3 忽视方差分析的前提条件辨析: ★ 此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P&0.05,则进行多组均数间的多重比较。 ★ 给出确切的统计量和P值。 2.4 误用t检验分析等级资料文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验表4 两组临床主要症状和结肠镜肠粘膜病变评分( x ? s ) G1组(n=60) G2组(n=60) 治疗前 2.01+0.68※ 治疗后 0.85+0.56△▲ 治疗前 1.98+0.72 治疗后 1.29+0.69△症状 腹痛腹泻脓血便 下坠感 充血、水肿 粘膜糜烂 粘膜溃疡 总评分2.09+0.82※1.82+0.42※ 2.22+0.57※ 1.89+0.37※ 1.58+0.60※ 1.81+0.62※ 15.76+3.11※1.26+0.75△▲0.51+0.32△▲ 1.41+0.65△▲ 1.11+0.41△▲ 0.50+0.49△▲ 0.59+0.56△▲ 6.87+3.08△▲2.11+0.731.91+0.41 2.29+0.62 1.92+0.42 1.62+0.62 1.79+0.59 15.98+2.981.56+0.68△1.02+0.39△ 1.67+0.59△ 1.59+0.38△ 1.01+0.48△ 1.21+0.60△ 8.87+3.21△※:与对照组(G2)比较,P&0.05,组间差异无统计学意义;△:与治疗前比较,P&0.05,组内 差异有统计学意义;▲:与对照组(G )比较,P&0.05,组间差异有统计学意义; 2.4 误用t检验分析等级资料中医证候计分 症状 发作次数 0分 1分(+) 2分(++) 3分(+++)腹痛持续时间 疼痛程度腹泻 脓血便 下坠感充血、水肿 粘膜糜烂粘膜溃疡 2.4 误用t检验分析等级资料辨析:? 对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续 的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。? 分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t 检验或秩和检验。? 与对照组(G2)比较,P&0.05,组间差异无统计学意义,不必在备注中表示。 ? 应写出确切的统计量和P值。 2.5 误用t检验处理重复测量的两因素试验设计1文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成 统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。 在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及 进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析 该资料是不妥的。 2.5 误用t检验处理重复测量的两因素试验设计2? 文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影 响。 ? 设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗 的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10 d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。 ? 请问:统计分析方法选用t检验正确吗?确切的统计量和P值。 2.5 误用t检验处理重复测量的两因素试验设计2辨析:1.统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复 测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这 种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。 正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用 与之对应的方差分析进行数据处理。 2.6 误用t检验处理单因素k(k&3) 设计的资 料原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观 察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对 照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25 % 、50% 、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面 积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理, 资料见表4。 表 莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差) 峰面积(mW?ms) 142.65±34.64 持续时间(s) 3.50±1.32 爆发波个数 0.54±0.10剂量(g/kg) 02.55.0 7.5337.74±250.91449.50±154.45 651.08±98.208.82±2.789.82±2.89 13.07±1.881.06±0.341.42±0.47 1.40±0.25 2.6 误用配对设计资料的t检验 处理单因素k(k&3)水平设计的资料辨析:? 没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。? 本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设 计或配对设计的t检验。 ? 措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计 定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。? 如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料 的三元方差分析对资料进行处理。 2.7多因素非平衡组合设计的统计错误1? 文题:某研究者研究A药对高脂血症性脂肪肝大鼠的作用? 设计:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大 鼠血脂的影响。 ? 结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较 差异有显著性意义(P&0.05)。? 结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。 2.7多因素非平衡组合设计的统计错误1表1 各组大鼠血清脂质比较(均数±标准差) mmol?L-1组别 自然恢复 A药低剂量 A药中剂量 A药高剂量 甲硫氨酸片与自然恢复组比较,TC 2.10±0.15 2.01±0.10 1.82±0.17 1.68±0.18 1.95±0.13★P&0.01,☆TG 2.32±0.31 2.12±0.18 1.82±0.13 1.72±0.21 2.06±0.16HDL-C 0.933±0.070 0.979±0.070 1.040±0.080 1.065±0.067 0.963±0.072P&0.05,与甲硫氨酸片组比较,●P&0.01 ,○P &0.05;n=10? 本设计方案,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复 组按多因素一水平的统计方法进行方差分析。其各处理组间关系的实质是两 个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3 个水平,而不是与甲硫氨酸片平等的3个因素。 2.7多因素非平衡组合设计的统计错误1辨析1:? 统计学上所讲的“因素” 是指“同质的实验条件”,“水平”则是在“量” 上有一些差异。将水平与因素混合进行分析是完全错误的。? 注意:在进行多重比较时,由于比较的组数不同,SNK-q检验的q值、卡方检 验的χ 2值、秩和检验的u值会得到不同的结果。尤其是χ 2检验和秩和检验, 其多重比较的检验水准α ′的取值为 α ′=α /K(K为比较的次数) ,将水 平与因素混合进行分析必然会增多比较的次数,α ′取值过小,导致本来有 统计学意义的两组比较则可能会没有统计学意义。? 本实验设计是一个不标准的设计类型。但是,不标准的设计类型并不是不科 学的设计方案,经过梳理,可以进行适当的重新组合,进行统计分析。当然, 按照统计学的要求,这种组合设计应该确立在实验的设计阶段,而不是在实 验数据得出之后。 2.7多因素非平衡组合设计的统计错误1辨析2: ? 如果研究者的目的是为了考察A药高、中、低3个剂量组是否有效,及确定最 佳治疗剂量。实验设计仍按上述方案分为5组,而统计设计可按如下组合进 行分析: 组合1:A药低剂量组、甲硫氨酸片组、自然恢复组组合2:A药中剂量组、甲硫氨酸片组、自然恢复组组合3:A药高剂量组、甲硫氨酸片组、自然恢复组 组合4:A药低剂量组、A药中剂量组、A药高剂量组? 组合1、2、3的目的是观察A药高、中、低3个剂量组是否有效,及其与甲硫氨酸片组阳性对照组的相对疗效。 ? 组合4的目的是通过A药高、中、低3个剂量组之间的疗效差异比较,考察是否可以筛选出最佳治疗剂量。 2.7多因素非平衡组合设计的统计错误2某研究者欲研究乳宁方及其拆方药物血清对体外细胞侵袭能力的影响, 选用SD大鼠24只,等分成6组:正常对照组、乳宁方治疗组(可拆解为温肾方+ 疏肝活血方)、温肾方治疗组、疏肝活血方治疗组、三苯氧胺治疗组、环磷酰 胺治疗组,分别接受相应药物的灌胃或注射,然后在末次给药后进行主动脉 采血,制成相应药物的血清。进行体外MDA-MB-435细胞侵袭能力试验,见表6。 若采用单因素六水平定量资料方差分析处理此资料正确吗? 2.7多因素非平衡组合设计的统计错误2辨析1:? 表6中“组别”看上去像一个试验因素,共有6个水平,其实是错误的。? 因为乳宁方可拆解为温肾方+疏肝活血方,所以试验涉及到“温肾方用 否”、“疏肝活血方用否”、“三苯氧胺用否”、“环磷酰胺用否”这样 4个试验因素,而表6中的6个组并非是这4个试验因素的全面组合。 ? 本资料应为多因素非平衡组合试验下的定量资料,直接使用单因素多水平设计定量资料方差分析对其进行处理是错误的,应根据专业知识和统计知识对“组别”进行合理拆分。 2.7多因素非平衡组合设计的统计错误2辨析2:? 本资料可拆分为:组合1:正常对照组、乳宁方治疗组、温肾方治疗组、疏肝活血方治疗组; 组合2:正常对照组、乳宁方治疗组、三苯氧胺治疗组、环磷酰胺治疗组。组合1为2×2析因设计,可根据资料是否满足方差分析的前提条件选用两因素析因设计定量资料方差分析或对原始定量资料进行变量变换或直接采用 两因素析因设计定量资料秩和检验。 组合2为单因素同水平设计,可根据资料是否满足方差分析的前提条件, 选用单因素同水平设计定量资料方差分析处理或对原始定量资料进行变量变 换或直接采用单因素同水平设计定量资料秩和检验。 2.7多因素非平衡组合设计的统计错误3文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理 盐水,其余各组用大黄水造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第3~5组给含1 0%炭末的不同剂量的开胃理脾口服液,第6 组给含10%炭末的开胃理脾丸剂, 第7 组给含有10%炭末的儿康宁。给药30min 后处死小鼠,测量并计算炭末 在小肠内的推进百分率。具体剂量和推进率见下表。 2.7多因素非平衡组合设计的统计错误3原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品 具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。辨析:(1)实验设计各对比组间混乱。?各剂量组、儿康宁组与空白组是否具有可比性??不同剂量的口服液、丸剂和儿康宁之间是否具有可比性? (2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。(3)确切的统计量和P值。 2.7多因素非平衡组合设计的统计错误3改进措施: (1)在分析时将实验拆分为: 组合1:空白组与模型组[说明造模成功] 组合2:模型组+低剂量组+中剂量组+高剂量组[各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较]组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁[在相同剂量的情况 下,口服液比丸剂和儿康宁都好](2)第一组采用成组t检验分析。其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采 用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。 2.8 正确处理析因设计或嵌套设计定量资料文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学 的影响 设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹 参组各30只,此两组造模后分别取l0、20、40、60、90 min 5个时点进行 观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌 注损伤肌肉肿胀系数的影响见表8。n=30,各时点ni=6 2.8 正确处理析因设计或嵌套设计定量资料辨析:? 对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。 ? 表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。? 若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条 件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进 行变量变换或采用秩和检验。 ? 若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主 次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条 件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进 行变量变换或采用秩和检验。 三、计数资料分析方法的常见问题3.1 计算相对数时分母太小 3.2 误用χ2检验分析结果变量为有序变量的资料3.3 误用χ 2检验回答相关性问题 3.4 多值有序变量的高维列联表资料 3.5 不满足连续性χ 2检验条件时未做校正 3.6 十一种形式的列联表3.7 误用χ 2检验取代Fisher精确检验(未举例说明)3.8 对R×C表直接分割进行两两比较(未举例说明) 3.1 计算相对数时分母太小文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。 请问:在表达资料方面有何不妥之处?辨析:确切的统计量和P值。? 计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事 实真相,还往往会造成错觉。? 在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例 数就可以。 3.2 误用χ2检验分析结果变量为有序变量的资料? 某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、 好转、无效,见表4。经R×C表χ 2检验,χ 2=53.33 ,P &0.01 ,认为两组疗 效之间的差异有统计学意义。确切的统计量P值。辨析:? 本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用R idit分析或秩和检验。而不应用R×C的χ 2检验,R×C表χ 2 检验只能检验两 组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难 看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ 2值仍为53.33, 不会有改变。 3.3 误用χ 2检验回答相关性问题表年龄不同年龄冠状动脉粥样硬化程度的分布冠状动脉硬化等级 正常 轻度 中度 高度50~60~ 70~ 合计431 6 5018896 17 3011472 55 141245169 78 492? 上述资料用χ 2检验得:χ 2 =163.01,P&0.005,结论为:可认为冠状动 脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄 增高而增加的趋势。 ? 问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处? 3.3 误用χ 2检验回答相关性问题辨析1:? 本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个 目的,因此,就对应着3套不同的统计分析方法。 ? 分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资 料,选用秩和检验。? 分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。? 分析两者间是否存在线性变化趋势则应用线性趋势检验。 ? 作者欲考察“两个有序变量之间是否呈相关关系”,而χ 2检验结果是P&0.0 5,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。 ? 事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ 2检验的统计量数值是不会变化的,说明χ 2检验用于处理有序变量形成的二 维列联表资料是不合适的。 3.3 误用χ 2检验回答相关性问题辨析2:? 欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相 关分析或典型相关分析。 ? 本例采用Spearman秩相关分析,得:rs=0.53215,P&0.0001。 ? 结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增 加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计 学意义。 3.4 多值有序变量的高维列联表资料? “创伤性上颈椎损伤早期漏诊 原因分析”中对1994年至2003 年治疗的58例上颈椎患者进行 回顾性分析,男35例,女23例, 接受手术治疗或非手术治疗, 假设两治疗组患者在年龄、性 别、损伤类型构成无统计学差 异。治疗结果见表l1。? 请问:能否以“损伤类型”为 依据,将此资料切割成多个二 维列联表,一一采用秩和检验 进行分析?或者通过求和,将 “损伤类型”这个变量合并掉, 采用秩和检验进行分析? 3.4 多值有序变量的高维列联表资料辨析:? 该资料原因变量有两个,分别为“损伤类型”和“治疗方式”,均为名义变 量,结果变量为“疗效”,因此该资料属于结果变量为多值有序变量的三维 列联表资料。? 以“损伤类型”为依据,人为地将此资料切割成多个二维列联表,一一采用 秩和检验进行分析,这是用单因素分析法来处理同时受多个因素影响的定性 资料,割裂了多因素之间的相互联系,易得出错误的结论。通过求和,将 “损伤类型”这个变量合并掉,采用秩和检验进行分析,这是对高维列联表 的“压缩”。但这种“压缩”不是总可套用的,仅当被合并掉的那个变量与 保留下来的变量之间都是相互独立的关系时,才不会得出错误的结论。? 正确做法:本资料应采用CMH校正的秩和检验,此法通过加权的方法消除掉一 个原因变量,着重研究另一个原因变量取不同水平条件下有序结果之间的差 别是否具有统计学意义;若希望将两个原因变量对有序结果变量的影响都明 确地显示出来,建议选用有序变量的多重logistic回归分析。 3.5 不满足连续性χ 2检验条件时未做校正 会得出完全相反的 结论 11种形式的列联表无序(成组)2×2表有序(配对)2×C表无序 有序 无序 R×2表无序有序分组变量有序R×C表 有序 多维列联表单向有序双向有序指标变量有序属性相同 属性不同 四、直线相关与回归分析常见错误(1)脱离专业知识,盲目进行直线相关与回归分析;(2)对资料中因“过失误差”造成的错误视而不见,盲目进行统计计算得出违背专业知识的结论; (3)将数据直接录入计算机,调用统计软件快速得出计算结果, 作出结论; (4)对于仅在统计学上有意义的计算结果,盲目给出专业上的 “肯定结论”,但结论经不起实践的检验。 五、统计分析方法表述问题1在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?辨析: 从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。 五、统计分析方法表述问题2在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗? 辨析: ? 从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。? 通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的 t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。? 在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验 设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。 五、统计分析方法表述问题3定性资料一律采用χ 2检验,对吗?辨析:事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的 和资料实际具备的前提条件,选用相应的统计分析方法,不 可随意盲目选用,更不应将χ 2检验视为处理定性资料的万能 工具。 五、统计分析方法表述问题4原文题目:补肾中药对去势后大鼠雌激素受体作用的实验研究。 设计与分析:作者将45只4月龄雌性SD大鼠随机分成正 常对照组、模型组和补肾中药组,每组15只,观察补肾中药 对血脂和雌二醇水平的影响,作者对同一组计量资料用均数±标准差表达其分布,在未说明资料是否满足方差分析的情况下,直接用Wilcoxon检验作两组间比较,用Kruskal-wall is检验作多组间比较。 请问:这样做正确吗? 辨析:五、统计分析方法表述问题4? 原实验资料属单因素三水平设计定量资料,如资料符合方差分析的3个前 提条件“独立性”、“正态性”和“方差齐性”,可采用单因素三水平设 计定量资料的方差分析进行处理。如果3个条件不全满足,可采用非参数 检验方法进行统计分析。 ? 在资料符合方差分析3个条件时,一般不用非参数检验方法,因为可能会 丢失很多有用的信息。 ? 原作者没有说明资料是否符合方差分析的3个条件,就直接用Wilcoxon检 验和Kruskal-Wallis检验等非参数方法,且在资料表达上,分布趋势用 “均数±标准差”形式表示,前后不吻合。? 若资料不符合方差分析的3个条件,需采用非参数检验方法时,则在资料表达上,最好应采用“中位数(四分位间距)”的方式,保持资料表达与统 计分析方法的一致。 五、统计分析方法表述问题5? 许多论文中,当统计数据经假设检验后,P值仅仅列出P &0.05或P&0.05 、P&0.01便称结果无显著差异,或结果非常显著。? 假设检验结果正确的表达方法是:应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统 计量,如χ 2、t、u、F 值等)、P值;然后根据P值大小作出 统计学推断,并作出相应的医学专业结论。 五、统计分析方法表述问题6 五、统计分析方法表述问题7? 北京血液中心XXX主任介绍:香港医务人员用已康复者血浆治 疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。---摘自&北京日报& ? 用康复病人血浆治疗非典病人真有效吗? 六、统计表与统计图方面的问题6.1 统计表存在的问题 6.2 统计图存在的问题 6.1 统计表存在的问题1文题:电针对大鼠不稳定膀胱逼尿肌及膀胱颈氮能神经递质的影响。 实验数据见表2 。这张统计表编制得正确吗?确切的统计量和P值。统计表纵横标目设置不正确 6.1 统计表存在的问题2文题:原发性肝癌患者和健康人“正常舌象”的对比研究。原作者对原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞 进行比较,研究结果见表3。这张统计表编制正确吗?确切的统计量和P值。 6.1 统计表存在的问题2辨析:? 表中角化前细胞、角化细胞和超角化细胞的含义似乎应为其各自的细胞数占每个个体脱落细胞染片中细胞总数的百分比,原表题目应改为:原发性肝癌 组和健康人组“正常舌象”舌苔脱落细胞的构成及成熟指数的比较,这样才能使表中数据的具体含义看起来清晰明了。? 原表在3种细胞后加上%,似乎想告诉读者下面的数据含义是个比,实际上不 但没有起到辅助说明数据含义的目的,反而“画蛇添足”,让人更加不理解。因为各细胞所占的百分比合计应为100%,而原表中原发性肝癌组和健康人组中各细胞的均数之和确实为1,但原作者在3个细胞变量之后加上%,反而使 各细胞所占的百分比都成了实际的1%,可去掉上面变量之后的%或将表中3个细胞变量下的数据同乘100。 6.2 统计图存在的问题辨析: 1.两幅统计图的纵轴刻度值并不是从“0”开始标刻度的,这违反了绘制统计图 的数学原则。应改成图域或将纵轴从“0”开始标注。2.原图中横轴的数字没有标注在刻度线正下方。3.两图中纵横坐标轴上也有“用不等长的间隔表示相同的数据长度”的问题,不 符合数学要求,曲线的变化趋势不正确。 七、多元回归分析? 在疾病预后因素的研究中,往往涉及到多个因素。结局的产生不是孤立的, 各因素之间往往相互影响,可以相互协同或拮抗。通常需要进行单因素的分 析,从许多的临床指标中筛选出若干个真正与预后相关的因素。 ? 预后因素的研究,如果只用单因素分析,往往会产生混杂偏倚。所以应该采 用多因素分析的方法,以校正各因素之间的相互混杂。? 不少发表的论文,只用χ2检验进行单因素分析,虽然没有犯原则性的错误,但如果能用多因素分析的方法进行筛选,校正混杂因素的影响,结果将会可 靠得多。? 由于多因素之间的相互混杂,在单因素分析中,一些有意义的因素可能无统计学意义,而另一些没有意义的因素却有统计学意义。 七、多元回归分析Logistic回归与COX比例回归模型? 如果时间因素不重要时,可以建立Logistic回归模型。? COX回归与Logistic回归的主要区别:? COX回归与时间有关, Logistic回归与时间无关? COX回归计算RR值, Logistic回归计算OR值 七、多元回归分析在建立回归模型时:? 要先对各个研究因素进行单因素分析。①初步筛选出可能与预后有关的因素;②去除那些根本不可能相关的因素,以减少建立多元回归模型时自变量的个数。 ? 对于连续性的数值变量和有明确等级关系的有序分类变量,可以直接进行回归分析;? 无序分类变量和等级关系不太明确的有序分类变量,则须采用分层回归分 析的方法。 ? 在建立多元回归方程时,结合专业知识将可能有关的因素,均可作为自变 量引入回归方程中筛选。待选变量的标准应该放宽一些,以免遗漏那些由 于混杂的影响,导致在单因素分析中无统计学意义的有意义因素。 七、多元回归分析分析协同时:? 分析某两个或多个因素对结局的影响有无协同。可以将两个变量相乘合并为一个变量,与原来的两个变量一起放入回归方程中去筛选,如果方程能接受这个新的变量,则提示这两个变量具有协同作用。 七、多元回归分析回归系数、标准偏回归系数、RR值和95%可信区间? 建立COX回归模型后,应该将相关强度值写到研究论文中去。? 回归系数表示控制其他因素条件下,各个因素对回归方程的独立贡献。 根据回归系数写出COX回归模型。? 根据标准偏回归系数相对值,可以比较自变量对模型的贡献大小。? RR值表示该因素的存在与否,阳性结局的危险性增加几倍。? 标明RR值的95%可信区间,因为范围的估计比有统计学意义提供更多实际意义的信息。 七、多元回归分析预后研究所需要的资料和数据库的建立? 预后因素分析的研究资料需要三大要素:研究因素、时间和 结局。 ? 研究因素应根据专业知识确定,计算机统计软件和回归分析筛选的方法,为资料分析提供了许多的便利,因此研究变量可以多一些,以免遗漏重要的因素。 建立数据库如下:病例序号 outcome time 年龄 性别 HBP ??12 3 ??01 1 ??2625 17 ??5348 62 ??10 1 ??01 0 ?????? ??? 具体的运算方法,可以请教统计学的老师,或参考有关的统 计学和统计软件的教科书。 ? 但是,作为临床医生搞科研,至少必须知道该研究需要记录哪些资料,和如何建立数据库。 减少医学论文中统计学错误的对策1.正确分析医学研究资料①明确研究设计和各个研究指标的类型; ②弄清研究因素、水平及其各因素之间的水平组合;③找出与设计类型所对应的真正的资料原形;④考察统计分析方法所具备的前提条件;⑤正确运用统计分析软件实现统计计算;⑥结合统计学知识和专业知识做出合理的解释和规范表达。 减少医学论文中统计学错误的对策2.掌握运用统计方法的注意事项①学习、应用统计学推断的逻辑方法;②了解变量间的关联性和相关性; ③在研究设计阶段应精心思考运用的统计分析方法; ④遵循各种统计分析方法的应用条件; ⑤正确理解和运用统计学结论;⑥统计学只能帮助研究者发现规律,而不能创造规律;记住:统计不是万能的,它只是解决具体专业问题的辅助工具, 不能替代专业思考或创造真实。 减少医学论文中统计学错误的对策3.提高医学研究人员的统计学知识①建立一支高素质的期刊统计编辑队伍,减少统计应用问题, 提高期刊质量。 ②加强医学统计学专家对科研人员的统计学指导与论文审稿。③提高作者的统计学知识和精品意识。④为研究人员举办科研课题的设计方法、科研论文的撰写技巧、统计学方法的正确运用等培训班。
论文中统计错误辨析报告学号 姓名 专业1.论文题目;期刊名称;XX期XX卷;页码。 2.存在问题(1)设计 ? 统计研究设计的类型 ? 研究对象的来源和选择方法 ? 实验、试验或调查资料的搜集过程等 (2)统计分析方法应用问题(应用条件是否遵循?方法选用是否恰当?。。。) (3)结果解释存在问题(是否结合专业下结论?结论是否符合专业理论?。。。)3.正确的统计设计与分析方法 组长的工作职责? 统筹安排小组各成员的工作?查阅文献?筛选文献?确定汇报的统计错误 ?对统计错误进行纠正 ?制作PPT(制作PPT同学不可作为主要汇报人) ?汇报(组长介绍每个成员的专业、所做的具体工作。每组选派1~2名学生为主要汇报人,其余成员作补充。) 辨析报告汇报要求?每组全体成员到前面,面向同学。?每组15分钟,其中汇报10分钟,提问5分钟。?PPT中需简单介绍各组员的专业背景及分工情况。?周四下午上课学生,周四下午汇报;周五下午上课学生, 周五下午汇报;两个班级合并汇报。 ?教室待定。 ?汇报时将每组的所阅文献、报告及PPT拷至电脑桌面。 辨析报告的评价标准基础分20分;以下每条为10分,总分为100分。序号 内容 得分 2分 4分 6分 8分 10分12 3 4 5 6 7 8组长是否合理分配小组成员的工作量?报告过程中组员间的协调性是否好? 汇报同学表达是否清晰流利? 汇报的统计问题辨析是否清晰明了? 汇报的统计问题难易程度如何? 汇报的统计问题是否结合组内某个成员的专业? 评价小组汇报的综合认真程度如何? PPT制作是否精美?合计
中医药论文中常见统计学分析方法应用错误辨析―汇集和整理大量word文档,专业文献,应用文书,考试资料,教学教材,办公文档,教程攻略,文档搜索下载下载,拥有海量中文文档库,关注高价值的实用信息,我们一直在努力,争取提供更多下载资源。}

我要回帖

更多关于 统计学 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信