请问谁有〈试验设计与数据处理题 〉 胡传荣 第 三版资源?麻烦有的话发一份给我😊,

《 试验设计与数据处理(李云雁)(第三版) 》【摘要 书评 试读】- 京东图书
客户服务
试验设计与数据处理(李云雁)(第三版)
与行业相比
该商品已下柜,非常抱歉!
规格与包装
商品介绍加载中...
下载客户端,开始阅读之旅
著者李云雁,胡传荣
包装平装-胶订
出版社化学工业出版社
权利声明:京东上的所有商品信息、客户评价、商品咨询、网友讨论等内容,是京东重要的经营资源,未经许可,禁止非法转载使用。
注:本站商品信息均来自于合作方,其真实性、准确性和合法性由信息拥有者(合作方)负责。本站不提供任何保证,并不承担任何法律责任。
印刷版次不同,印刷时间和版次以实物为准。
价格说明:
京东价:京东价为商品的销售价,是您最终决定是否购买商品的依据。
划线价:商品展示的划横线价格为参考价,该价格可能是品牌专柜标价、商品吊牌价或由品牌供应商提供的正品零售价(如厂商指导价、建议零售价等)或该商品在京东平台上曾经展示过的销售价;由于地区、时间的差异性和市场行情波动,品牌专柜标价、商品吊牌价等可能会与您购物时展示的不一致,该价格仅供您参考。
折扣:如无特殊说明,折扣指销售商在原价、或划线价(如品牌专柜标价、商品吊牌价、厂商指导价、厂商建议零售价)等某一价格基础上计算出的优惠比例或优惠金额;如有疑问,您可在购买前联系销售商进行咨询。
异常问题:商品促销信息以商品详情页“促销”栏中的信息为准;商品的具体售价以订单结算页价格为准;如您发现活动商品售价或促销信息有异常,建议购买前先联系销售商咨询。
价 格: 到
   
iframe(src='//www.googletagmanager.com/ns.html?id=GTM-T947SH', height='0', width='0', style='display: visibility:')试验设计与数据处理韩京龙 试验设计与数据处理参考资料 1,实验设计与数据处理(第二版) 李云雁 胡传荣 编著化学工业出版社2,实验设计与数据处理 罗传义 时景荣吉林人民出版社编著 0.1 试验设计与数据处理的发展概况? 20世纪20年代,英国生物统计学家及数学家费 歇(R.A.Fisher)提出了方差分析 ? 20世纪50年代,日本统计学家田口玄一将试验 设计中应用最广的正交设计表格化 ? 数学家华罗庚教授也在国内积极倡导和普及的 “优选法” ? 我国数学家王元和方开泰于1978年首先提出了 均匀设计 0.2 试验设计与数据处理的意义0.2.1 试验设计的目的:? 合理地安排试验,力求用较少的试验次数获得较好结果例:某试验研究了3个影响因素:A:A1,A2,A3B:B1,B2,B3 C:C1,C2,C3 全面试验:27次 正交试验:9次 0.2.2 数据处理的目的?? ?通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾, 提高试验效率; 确定试验因素与试验结果之间存在的近似函数 关系,并能对试验结果进行预测和优化;? ?试验因素对试验结果的影响规律,为控制试验 提供思路; 确定最优试验方案或配方。 实验设计与数据处理应用对象科研工作者 企业管理人员 工程技术人员 大学生 硕士研究生 毕业论文设计 毕业论文写作博士研究生 试验设计是根据试验目的所定单因素试验设计 多因素试验设计 随机试验设计 正交试验设计确定? 试验目的 科技论文?科研报告?毕业论文写作全过程 试验目的 试验设计 取得数据数据处理得出结论完成论文 统计分析数据处理方法 图像处理音像处理 表 数据处理形式 图 图像音像 科研论文 学术发表 数据处理用途开发新技术 行政部门提供依据 学术研讨会(举例说明)热量 1 2 3 4 5 6 7反应速 度0.5 0.7 0.9 1.1 1.2 1.2 0.9 学术研讨会(举例说明1)化学反 应 速度与 热 量 关 系1.5 1.0 0.5 0.0反 应 速度01234热量5678 学术研讨会(举例说明2)降雨量与硝态氮流失情况调查日期6/5 6/106/156/206/256/307/57/10降雨量 硝态氮2053200 28030100 18020 250 硝酸態窒素 200降水量(mm)300 250 降水量 200硝酸態(ppm)150 150 100 100 50 0 6/4 6/8 6/12 6/16 6/20 6/24 6/28 7/2 7/6 7/10 50 0月   日  降雨量と溶脱硝酸態窒素との関係 科技论文?科研报告?毕业论文题目 目的 写 作 流 程 实验材料与分析方法 结果与考查 结论 第一章 误差理论误差:由于受主客观因素的影响,实验中测得的值与真实 值并不完全一致。这种差异在数值上的表现即为误差。研究误差的目的: 1.正确处理实验数据。得到更接近真实值的最佳结果。2.合理选取所得结果的误差。减小主观因素的影响,以免 对生产造成危害。也不能算得过份大,以免造成人 力物力的浪费。3.合理选择实验仪器、条件和方法,以便降低系统误差。确保实验的准确度和精密度。 真值与试验数据的位置特征参数 真值: 理论上说,真值是指测定次数无限多时求得 的平均值叫真值。1.理论真值:理论设计和理论公式表达值等。 真值 2.计量学约定真值:国际会议或国际组织上公认的 量值。 3.相对真值:国家标准样品的标准值或用标准仪器 测定的值。 真值与试验数据的位置特征参数试验数据的位置特征参数是表示试验数据的集中性的指标? 2.试验数据的位置特征参数 ? 2.1算数平均值(arithmetic mean)适合: ? 等精度试验值?x1 ? x2 ? ... ? xn x? ? n?xi ?1nin试验值服从正态分布算数平均值的一个重要性质,就是若测定值的分布服从 正态分布,则算数平均值即为一组等精度测量中的最佳值, 或称为最可信赖值。 真值与试验数据的位置特征参数2.2加权算数平均值(weighted mean)w1 x1 ? w2 x2 ? ... ? wn xn xW ? ? w1 ? w2 ? ... ? wnwi——权重?w xi ?1 nn加权和i i?wi ?1i权可以理解为测定值Xj在很大的测量总数N中出现的频率 nj/N,如代之以概率Pj来表示,则加全算数平均数可改写为xw ? ? pi xii ?1n? 适合不同试验值的精度或可靠性不一致时 真值与试验数据的位置特征参数2.3对数平均值(logarithmic mean) 在化学反应,热量传递及质量传递中,其分布曲线多具有 对数的特性。在这中情况下表征平均值的量就应该用对数 平均值来表示。设两个数:x1>0,x2 >0 ,则说明:x1 ? x 2 x1 ? x 2 xi ? ? x1 ln x1 ? ln x 2 ln x2? 若数据的分布具有对数特性,则宜使用对数平均值? 对数平均值≤算术平均值 ? 如果1/2≤x1/x2≤2 时,可用算术平均值代替,误差不超过4% 2.4 几何平均数几何平均值是将n个测定值相乘后在开n次方所得的值。 设有n个正试验值:x1,x2,…,xn,则xG ?nx1 x2 ...xn ? ( x1 x2 ...xn )1 n●当一组试验值取对数后所得数据的分布曲线更加对称时, 宜采用几何平均值。●几何平均值≤算术平均值 2.5 调和平均值(harmonic mean)设有n个正试验值:x1,x2,…,xn,则:1 1 1 ? ? ... ? x1 x2 xn 1 ? ? H n1 ? i ?1 xi nn●常用在涉及到与一些量的倒数有关的场合●调和平均值≤几何平均值≤算术平均值 误差的表示方法1.绝对误差(absolute error)(1)定义 绝对误差=试验值-真值 或?x ? x ? xt可以估计出绝对误差的范围:(2)说明 ? 真值未知,绝对误差也未知??x ? x ? xt ? ?x max或绝对误差限或绝对误差上界xt ? x ? ?x max误差的绝对值愈小,则测定值与真值愈接近,测定值的准确度愈高, 反之相反。绝对误差是反应测定值偏离真值的大小。 误差的表示方法1.绝对误差(absolute error)例:用标准仪器测得某物理量为1.728(g)(可看作是真值A),而一台 普通仪器测得该物理量为1.730(g),则测量值的绝对误差为 Δx=1.730-1.728=0.002(g) 若另一次测量值为1.725(g),其绝对误差为Δx=1.725-1.728=-0.003(g)我们经常用的分析天平等都有本身的仪器所允许的最大误差范围。 如分析天平的允许误差范围是±0.0001(g),我们把这个误差范围又称最大绝对误差。最大绝对误差的量值前面一般都加“±”号,这是与 绝对误差的定义是不同的。 误差的表示方法2.相对误差(relative error)是指绝对误差在真值中所占的百分率,既?x Ex ? ? 100% A误差较小时,测定值x与真值A接近, 用绝对误差与测定值之比作为 相对误差。?x Ex ? ? 100% x最大相对误差:最大绝对误差计算出的相对误差。 ? 真值未知,常将Δx与试验值或平均值之比作为相对误差:?x Ex ? x或?x Ex ? x 误差的表示方法2.相对误差(relative error)例:用分析天平测得土壤样品为4.1854(g),而半微量天平测得的量 为4.18544(g)(可看作是真值A),求相对误差和最大相对误差?解: 相对误差: Ex=(Δx/A)*100% Δx=x-A=4.44=-0.00004(g) Ex=(-0.44 )*100%=-0.001%当x接近于A时, 用x代替真值A Ex=(-0.4 )*100%=-0.001% 最大相对误差:分析天平的最大误差范围为±0.0001(g) 最大相对误差=(±0.4)*100%= ±0.0025% 误差的表示方法2.相对误差(relative error) **同一仪器的被测量的最大绝对误差是相同的。但是,被测量的相对 误差是不同的。 例:测得一物理量分别为102(g)和5(g),天平的最大绝对误差为±1(g),而相对误差分别为E102={(±1)/102}*100%=±1%E5={(±1)/5}*100%=±20%为了获得更准确的结果,在相同条件下需要进行多次重复测定。这 叫平衡测定或等精度测定。 误差的表示方法3.极差(range)一组测定值中最高值和最低值之差,叫极差。R ? xmax ? xminR↓,精密度↑虽然用极差反映随机误差的精度不高,但由于它是计算方便, 在快速检验中仍然得到广泛的应用 误差的表示方法4.算术平均误差(average discrepancy) 算术平均误差(或称为平均偏差)简称为平均误差。 其定义为???xi ?1ni?x ??di ?1ninn之间的偏差di —— 试验值 xi 与算术平均值 x● 可以反映一组试验数据的误差大小 误差的表示方法5.标准差(standard error)标准差是标准误差的简称,又称为标准偏差。当测定值的次数无 穷时,其定义为■当试验次数n无穷大时,总体标准差:2 ( x ? x ) ? i i ?1 n 2 2 x ? ( x ) ? i ? i /n i ?1 i ?1 n n??nn n?n2 2 x ? ( x ) ? i ? i /n i ?1 i ?1 n n■ 试验次数为有限次时,样本标准差:2 d ? i i ?1 2 ( x ? x ) ? i i ?1s?n ?1?n ?1?n ?1● 表示试验值的精密度,标准差↓,试验数据精密度↑ 误差的表示方法5.标准差(standard error) 标准偏差与所测定值中的每一个数据有关,而且 对其中较大误差或较小误差敏感性很强。能明显反 映出较大的个别误差。实验愈精确标准误差愈小。 反映相对于平均值的离散程度。一般统计分析中经 常用到标准差S。 误差的来源及分类我们在做科学研究的时候,得到准确数据是非常重要的一个科研环节。实验工作始终不能做到没有误差,测定值永远是真值的近似值。误差根据其性质可分为系统误差、随机误差和过失误差。1, .随机误差(偶然误差) :由于很多无法估计的,各种各样 的随机原因所引起的误差。随机误差量值的大小,往往 用标准差S来表示。 2, 过失误差:实验工作中粗枝大叶,操作不正确所引起的 误差。 误差的来源及分类3, 系统误差:由于实验过程中某些经常发生的原因造成的。在同一 条件下重复测定时,它会重复出现。方法误差(理论误差`):这是由于测量方法本身形成的误差,或者由于 测量所依据的理论本身不完善等原因而导致的误差。 例:土壤有效磷的测定有两种方法第一种方法为0.5M NaHCO3浸 提-钼锑抗比色法,第二种方法为0.3N NH4F-0.025N HCl浸提-钼锑抗 比色法 两种浸提剂测得的土壤有效磷指标 系统误差 有效磷指标 0.3N NH4F-0.025N HCl法 0.5M NaHCO3法低中 高0-1516-30 &300-50-6 &10仪器误差:仪器本身不够准确或未经校准所引起的误差。(仪器的 零点不准,精密度不高,磨损等原因引起的误差) 操作误差:由于操作人员的主观原因所造成的误差。 误差的来源及分类1 随机误差 (random error )(1)定义:以不可预知的规律变化着的误差,绝对误 差时正时负,时大时小 (2)产生的原因:偶然因素(3)特点:具有统计规律? ? ? ? ? 小误差比大误差出现机会多 正、负误差出现的次数近似相等 当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差 随机误差不可完全避免的 误差的来源及分类2 系统误差(systematic error)(1)定义: 一定试验条件下,由某个或某些因素按照某 一确定的规律起作用而形成的误差 (2)产生的原因:多方面(3)特点:? 系统误差大小及其符号在同一试验中是恒定的 ? 它不能通过多次试验被发现,也不能通过取多次试验 值的平均值而减小 ? 只要对系统误差产生的原因有了充分的认识,才能对 它进行校正,或设法消除。 误差的来源及分类3 过失误差 (mistake ) (1)定义:一种显然与事实不符的误差(2)产生的原因:实验人员粗心大意造成(3)特点: ? 可以完全避免 ? 没有一定的规律 实验数据的精准度1.精密度(precision) :表示在等精度的重复测定中,各测 定值与其平均值接近的程度,或者说各测定值相互接近的程度。 精密度通常用标准差S和相对标准差C?V=S/x (变异系数)来 量度。精密度一般用来表示随机误差的大小。 (1)含义: ? 在一定的试验条件下,多次试验值的彼此符合程度 例:甲:11.45,11.46,11.45,11.44 乙:11.39,11.45,11.48,11.50 (2)说明: ? 可以通过增加试验次数而达到提高数据精密度的目的? 试验数据的精密度是建立在数据用途基础之上的? 试验过程足够精密,则只需少量几次试验就能满足要求 实验数据的精准度 1.精密度(precision)(3)精密度判断①极差(range)R ? xmax ? xmin②标准差(standard error)2 ( x ? x ) ? i i ?1 n nR↓,精密度↑??n2 ( x ? x ) ? i i ?1 n?2 2 x ? ( x ) ? i ? i /n i ?1 i ?1nn2 2 x ? ( x ) ? i ? i /n i ?1 i ?1 n ns?n ?1?n ?1标准差↓,精密度↑ 实验数据的精准度 1.精密度(precision) (3)精密度判断③方差(variance)标准差的平方:? 样本方差( s2 )? 总体方差(σ2 )方差↓,精密度↑ 实验数据的精准度2 正确度(correctness)(1)含义:大量测试结果的(算术)平均值与真值或参照值之间的一 致程度。它反映系统误差的大小。(2)正确度与精密度的关系:(a)? ?( b)( c)精密度高并不意味着正确度也高精密度不好,但当试验次数相当多时,有时也会得到 好的正确度 实验数据的精准度3 准确度(accuracy)表示所得测定结果与真值或标准值接近的程度。在多次等精 度测定中,测定结果一般用平均值来表示。这时准确度就表示平 均值与真值的接近程度。准确度一般用绝对误差或相对误差来 表示。三者关系●无系统误差的试验精密度 :A>B>C 正确度: A=B=C 准确度: A>B>C 实验数据的精准度 三者关系●有系统误差的试验精密度 :A' > B' > C' 准确度: A '> B '> C ' ,A >B,C 实验数据的精准度准确度与精密度的关系 准确度与精密度是不同的。准确度指测定值与真值接近 的程度。精密度指测定值与平均值接近的程度。测定的精 密度不好,就不可能有良好的准确度。精密度好的测定,即 使准确度不高,但能找到系统误差产生的原因并加以校正, 就能得到准确的结果。 随机误差的统计分布1.频数分布 随机误差是具有统计规律的,服从一定的统计分布规律。 例:通过实验测得113个数据,经整理得以下频数分布表。 表 频数分布表 分组 频数 73 0 74 3 74 3 74 12 75 25 75 38 76 25 76 3 76 3 77 其他 0 1直方 图40 35 30 25 20 15 10 5 0 73.1 73.5 73.9 74.3 74.7 75.1 75.5 75.9 76.3 76.7 其他频数频率分组 随机误差的统计分布 2.随机误差的特性 若测定中不存在系统误差,则测定的平均值可作为被测 量的真值的估计值。同样条件,同样方法进行很多次的测定 时,随机误差有以下特性:(1)对称性:绝对值相等的正误差和负误差出现的次数大 致相等。 (2)单峰性:绝对值大的误差出现的次数少,而绝对值小的误 差出现的次数多。 (3)有界性:在一定试验条件下的有限测定中,其误差的绝 对值不会超过一定的界限。 (4)抵偿性:在同一条件下对同一个量进行测定,其误差的 算术平均值随着测定次数的无限增加而趋于零,既误差 平均值极限为零。 随机误差的统计分布3.1 随机误差的正态分布 随机误差的出现是遵循正态分布规律的。各个测得值出现的概率密 x:表示测量值 度分布可以用正态分布函数来表达。f ( x) ?1( x?? )2? 2?e2? 2μ:总体均值,既无限次测定数据 的平均值σ:正态分布的总体标准差 σ2:正态分布的方差f(x)σ=1σ=2正态分布密度函数 随机误差的统计分布3.2 正态分布曲线的特性 (一)正态分布曲线是以 fN(x) 算数平均数μ为原点, 向左右 68.26% 两側作对称分布, 所以它是一 个对称曲线。 95.46% (二)从原点μ=0所竖立的 μ-3σ μ-2σ μ-1σ μ μ+1σ μ+2σ μ+3σ 纵轴是最大值(y0) 。 (三)正态分布的多数测定值集中于算术平均数μ附近, 离平均 数越远, 其相应的次数越少; 且在 x ? ? 相等处具有相等次 数;在 x ? ? ? 3? 以上其次数极少。 σ 处有“拐点”曲线两尾向左右 (四) 正态分布曲线在 x ? ? ? 1 伸展, 永不接触横轴, 所以当x→±∞时, 分布曲线以x轴为渐 进线, 因之曲线全距从-∞到+∞ 。 随机误差的统计分布3.2 正态分布曲线的特性 (五)正态分布曲线是以参数μ和σ的不同而表现为一系列曲线, 所以它是一个曲线系统而不仅仅是一个曲线。μ确定它在x轴上的 位置, 而σ确定它的变异度, 不同μ和σ的正态总体具有不同的曲 线位置和变异度, 所以仸何一个特定正态曲线必须在其μ和σ确定 后才能确定。 σ= 1σ= 2 σ= 3-3 -2 -1 0 1 2 3 4 5 0μ=0、μ=1、μ=2的正态分布σ=1、σ=2、σ=3的正态分布(六)正态分布曲线与x轴之间的总面积等于1, 因此在曲线下x轴 的仸何定值, 例如从x=x1到x=x2之间的面积, 等于x落在这个区间内 的概率。 随机误差的统计分布4.随机误差的区间概率 正态分布曲线和横轴所夹的面积表示全部数据出现概 率的总和显然应当是100%,既为1。记为p(?? ? x ? ?) ?1?? 2?b???e?( x?? )2 2? 2dx ? 1(4.1)测定值x出现在区间[a,b]的概率P(a≦x≦b)就等于直线 x=a,x=b与正态分布曲线,坐标横轴所包围的面积 ,即P(a ? x ? b) ?1?e ? 2?a?( x?? )2 2? 2dxa b(4.2) 随机误差的统计分布4.随机误差的区间概率P(a ? x ? b) ?1?e ? 2?ab?( x?? )2 2? 2dx上式公式中的横坐标x改用u表示, u定义为u?x???u2 ? 2(4.3)这便是均值为μ,标准差为σ的正态分布变成了均值为0, 标准差为1的标准正态分布,其分布密度涵数变为f (u ) ?1 2?e(4.4) 随机误差的统计分布在本书附录B-1列有正态分布表,计算出不同u值的f(u)曲线所包 围的面积的值。表中给出的积分值为P(u ? k a ) ?? 2?1?kaeu2 ? 2du ? ?(4.5)例:某测定值的误差服从正态分布,以知测定标准差σ=2.5,求测定 值的误差位于区间(-3,3)的概率。 x?? 解:由题意,xa-μ=-3, xb-μ=3 。按式 u ? 进行变换ua ?(x ? ?)ub ?? (x ? ?)(?3) ? ? ?1.2 2.5??3 ? ? 1.2 2 .5 随机误差的统计分布于是原题化为求u处于区间(-1.2,1.2)的表准正态分布的概率。σ= 1-1.21.2由附录B-1查得ka=1.2的概率α, P(u≧1.2)= α=0.1151 由于正态分布的对称性P(u≧1.2)和P(u≦-1.2) 的概率是相同的。所以, u处于区间(-1.2,1.2)的标准正态分布的概率是:1-2*0.8 随机误差的统计分布例:求测定值的误差位于区间(-σ, σ)的概率。解:由题意,|x-μ|= σ 。|u|=(|x-μ|)/ σ=1于是原题化为求u处于区间(-1,1)的标准正态分布的概率。 由附录B-1查得ka=1的概率α, P(u≧1)= α=0.1587 所以, u处于区间(-1,1)的标准正态分布的概率是:1-2*0.8 同样,误差位于区间(-2σ, 2σ), (-3σ, 3σ)的概率分别为 P(|u|≦2)=1-2 P(u≧2)=1-2*0.4 P(|u|≦2)=1-2 P(u≧3)=1-2*0.03 随机误差的统计分布 从以上的结果可以看出,测定值的误差落在区间 (-3σ,3σ)的概率是很大的,接近于1。而落在这个 区间以外的概率是1-0.7,就是说1000次 测定中,出现误差的绝对值大于三倍标准差的机会 不超过三次。所以,把误差的绝对值等于三倍表准 差称为最大误差。 随机误差的统计分布例:假设x乃一随机变数具有正态分布,平均数μ=30,标准差σ=5,试计 算X小于26,小于40的概率,区间(26,40)的概率以及大于40概率。 解:1.首先计算小于26的概率。P( x ? 26) ?1?? 2?26??e?( x?? )2 2? 2dx必须先将x转换为u值,把本例的正态分布转换成标准正态分布。由 公式(4.3) u=(x-μ)/ σ得 u=(x-30)/5=(26-30)/5=-0.8;这样原题化为 求u处于区间(-∞,-0.8)的概率。因为正态分布的对称性, P(u ≦-0.8) 的概率等于P(u ≧0.8)的概率。查附录B-1正态分布表0.8可得 P(x≦26)=0.2119-0.8μ= 0μ= 00.8 随机误差的统计分布解:2.小于40的概率,同样u=(x-30)/5=(40-30)/5=2.0。 P(u≦2.0)=1- P(u≧2.0)查附录B-1,u=2.0时P(u≧2.0)=0.0228 P(u≦2.0)=1- P(u≧2.0)=0.9772,所以小于40的概率 P(x≦40)=0.9772。2.0 μ= 0 3.处于区间(26,40)的概率 P(26&x&40)=P(-0.8&u&2.0)=0.9=0.76544.大于40的概率P(x&40)=1-P(x&40)=1-0.8-0.8μ= 02.0μ= 02.0 有效数字可靠的几位数字再加上可疑的一位数字統称为 有效数字。有效数字是指一个近似结果具有实际 意义的数字。? 1 2 30cm在图中三角形所指的长度为1.28cm,其中1.2cm为至可靠的数字,0.08cm为估计值也就是可疑数字。把长度写成1.286cm是错误的。因为,0.006cm是没有什么实际意义的数字。 有效数字用台称称量某一物体时重量为12.0(g),该称量 的最大绝对误差为±0.1(g),因此这个量的记录结 果应当是 12.0(g)或写成12.0 ±0.1, 12.0的最 后一位是有误差的,其真实重量在11.9~12.1(g)之 间。若将这个测量结果写为12.01或11.99等都是 没有意义。2.50有三位有效数字 2.5有二位有效数字 0.025有二位有效数字 0.0250有三位有效数字 1.00有三位有效数字 54000取三位有效数字时写成5.40×104 有效数字当一个近似值的有效数字的位数确定后,其余数字应按照“四舍 六入五单双”的原则。大于五,前进1 。 小于五,舍下去。 恰好是五要考虑, 五后非零前进一; 若是五后全为零, 要看五前是偶奇; 五前为偶则舍弃, 五前为奇前加一。例:下面数字取三位有效数 28.748→28.7 28.381 → 28.4 28.750 →28.8 28.650 →28.6在计算平均值时, 若为4个或多于4个数取平均数, 则平均数的有效数字位数可 增加1位。 在多数情况下,表示误差的有效数字最多可取两位。 有效数字1、加减运算时,其结果小数点后的位数,应与参与运算 的近似值小数点后位数最少的项相同。18.69 ? 0.7 ? 31.467318.69 ? 0.7? 31.47?2、乘除运算时,其结果的有效数字应与近似值中有效数 字位数最少者相同。87.38 ? 6.7867 ? 593 .02184687.38? 6.8968 .8 ? 362 .1 ? 24.8 .8 ? 362 .1 ? 24 .77?? 有效数字3、乘方、开方运算中, 原近似值有几位有效数字,计算结 果就保留几位有效数字。8.768 ? 2.9618.7682 ? 76.884、在对数计算中,所得结果小数点后位数与真数的有效 数字的位数应相同。lg 3682.87 ? 3.566186 有效数字5、在计算平均值时,若为4个或多于4个数取平均数,则 平均数的有效数字位数可增加1位。?82.37 ? 82.39 ? 82.78 ? 82.88? / 4 ? 82.6056、常数的有效数字位数可以认为是无限的,实际运算中 需要几位就取几位。7、一般在工程计算中,取2~3位有效数字。 间接测定的误差估计对测量精密度较高,且容易测量的量我们可以进行直接测量。而对 于那些不能直接测量或不太容易测量的量,就借助于已知的函授关 系来计算。这样,从测得数据到计算结果,就存在着误差传递问题。 1.误差传递的基本公式 如果间接测定量y是各直接测定量x1,x2,?????,xm的函授,即y ? f ? x1 , x 2 ,? ? ?, x m ?且各直接测定量相互独立,则对上式求全微分得? ?f dy ? ? ? ?x ? 1? ? ?f ? ?dx1 ? ? ? ?x ? ? 2? ?f ? ? ?dx 2 ? ? ? ? ? ? ? ?x ? ? m? ? ?dx m ?误差传递的基本公式 ???????????????????????( 1)这个式表示,当x1,x2,??????,xm有微小改变量dx1, dx2,???dxm时,函 授y的改变量为dy。若把dx1, dx2,???dxm看做各直接测定量的误差, ?f ?f 其中 ?f , ,? ? ?, 叫做误差传递系数。 总误差的大小取决于每个测量误差的大小,还取决于误差传递系数。?x1?x 2?x m 间接测定的误差估计2.误差的方和根合成公式 当各直接测定量的误差为纯粹的误差,且标准差为已知是,我们 可以推导出误差的方和根公式。设为了求间接测定量的结果,对各 直接测定量分别进行了N次等精度测定。由误差传递的基本公式 (1)可知,第j次测量得间接测定量的误差为? ?f ? ? ?f ? ? ?f ? dy j ? ? ? ?x ? ?dx1 j ? ? ? ?x ? ?dx 2 j ? ? ? ? ? ? ? ?x ? ?dx mj ????(2) ? 1? ? 2? ? m?两边平方,得j?dy ?2? ?f ? ? ?f ? ? ?f ? 2 2 ?? ? ?x ? ? dx1 j ? ? ? ?x ? ? dx2 j ? ? ? ? ? ? ?x ? ? dxmj ? 1? ? 2? ? m? ? ?f ? ? ?f ? ? ? ? ? ? 2? ??? (3) ? ?x ? ?? ? ?x ? ? dx1 j dx 2 j ? ? ? ? ? 1 ?? 2 ?2??2??2??2????如果x1,x2,??????,xm是相互独立的量,当n→∞时,右边的非平方项的 加和为零。于是 间接测定的误差估计?f 2 N ?f 2 N ?f N 2 2 2 ( dy ) ? ( ) ( dx ) ? ( ) ( dx ) ? ? ? ? ? ( ) ( dx ) ? ? ? ? i 1i 2i mi ?x1 i ?1 ?x 2 i ?1 ?x mi i ?1 i ?1N 2上式两边除N,再结合标准差的定义2 2??1 n 2 ( x ? x ) ? i n i ?12有? ?f ? 2 ? ?f ? 2 ? ?f ? 2 ?y ? ? ? ?x ? ? ? x1 ? ? ? ?x ? ? ? x2 ? ? ? ? ? ? ? ?x ? ? ? xm ??????(4) ? 1? ? 2? ? m?这就是误差的方和根公式,又称随机误差传递公式。? ?f ? ? ?f ? ? ?f ? dy ? ? ? ?x ? ?dx1 ? ? ? ?x ? ?dx 2 ? ? ? ? ? ? ? ?x ? ?dx m ? 1? ? 2? ? m??y ?函授y求 全微分,然 2 2 2 后d 改为 ? ?f ? 2 ? ?f ? 2 ? ?f ? 2 σ、右边各 ? ? ?x ? ? ? x1 ? ? ? ?x ? ? ? x2 ? ? ? ? ? ? ?? ? ? ? xm 项分别 ? 1? ? 2? ? xm ? 平方再加和并开平方,这就是求一个函授的方和根合成公式的全过程。 间接测定的误差估计 例1.求对数函授y=lnx的随即误差传递公式。 解: 求微分得 dy ? 1 dxx1 2 2 ( dy ) ? ( ) ( dx ) 两边平方得 x21 2 dy ? ( ) (dx) 2 xd改为σ得1 ? y ? ( )? x x例2.求函授y=x/w的随即误差传递公式。(方和根合成公式) 解:两边取对数 lny=lnx-lnw, 求全微分dy 1 1 ? dx ? ( ? )dw 两边平方得 y x wdy 2 1 2 1 2 y 2 y 2 2 2 2 ( ) ? ( ) (dx) ? (? ) (dw) ? dy ? ( ) (dx) ? ( ) (dw) 2 y x w x wd改为σ所以得2 2 ? y? ? y? ? y ? ? ? ?x ?? ? ?w ? x? ?w?22 间接测定的误差估计3. 误差的算数合成公式 当直接测定量的误差主要是系统误差, 而其正负号又不可能确定, 或假定随即误差在极端的条件下合成时, 可将误差传递基本公式? ?f ? ? ?f ? ? ?f ? dy ? ? ? ?x ? ?dx1 ? ? ? ?x ? ?dx 2 ? ? ? ? ? ? ? ?x ? ?dx m ? 1? ? 2? ? m?中的记号“d”改为“Δ”, 并将右端各项取绝对值相加, 即可得到误 差的算数合成公式:?f ?f ?y ? ?x1 ? ?x 2 ? ? ?x1 ?x 2??f ?? ?x m ?x m间接测量中, 有两个问题是经常碰到:第一, 已知直接测定量的测 定值及其误差, 计算间接测定量的误差。第二, 预先给定间接测定 量所允许的误差, 计算各直接测定量所允许的误差。 间接测定的误差估计4. 误差估计的应用 1) 求间接测定量的误差 例1. 用流体重力称衡法测固体密度的公式为m ?? ?0 m ? m1已知: m=27.06±0.02(g) m1=17.03±0.02(g) ρ0=0.3(g/cm3) 求 : ρ及 σ ρ 解: 两边求对数 ln ρ =ln m – ln(m – m1) + ln ρ0 求全微分 整理得dm dm ? dm1 d? 0 d ln ? ? ? ? ? ? m m ? m1 ?0 d?d?m1 1 1 ?? dm ? dm1 ? d? 0 ? m?m ? m1 ? m ? m1 ?0 间接测定的误差估计4. 误差估计的应用 所以有?? ? m1 ? ? ? m ? ? ? m 1 ? ? ? ? ? ? ? ? ? ? ?? ? ? ?? ? ? ? ? ? ? ? m ? m m m ? m ? ? ? ? 1? ? 1? ? 0 ?2 2 202代入已知数据2 2 2 2 ?? 17 . 03 0 . 02 0 . 02 0 . 0003 ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ?? ? ? 0.0024 ? ? 27.06 ? 17.03 ? ? 17.03 ? ? 27.06 ? 17.03 ? ? 0.9997 ?27.06 ? ? ? 0.9997 ? 2.697? g / cm 3 ? 27.06 ? 17.03已知数据代入原公式得??? ? 2.697 ? 0.006?g / cm?? ? ?? ? ? ?? ? ? ? 0.0024 ? 2.697 ? 0.006? g / cm 3 ? ? ?3? 间接测定的误差估计4. 误差估计的应用 例2: 间接测量一圆柱的体积V, 测得直径和高分别为 D=0.80±0.01(cm) H=1.02±0.01(cm) 求间接测定量体积V及按误差方和根合成公式计算的误差σv 按算数合成公式计算的ΔV。 解: 圆柱体体积的计算公式为D H 4 ?? ? 取对数 lnV ? ln? ? ? 2 ln D ? ln H ?4?V ??2dV ? dD ? ? dH ? 求全微分 d lnV ? ? 2? ??? ? V ? D ? ? H ?所以有?VV??? D ? ?? H ? 4? ? ?? ? ? D ? ? H ?22 间接测定的误差估计4. 误差估计的应用 代入已知数据?VV?? 0.01 ? ? 0.01 ? 4? ? ?? ? ? 0.027 ? 0.80 ? ? 1.02 ?22V ??4? 0.080 ? 1.02 ? 0.51( cm )2 3? ?V ? 3 ? V ? ? ?V ? 0.027 ? 0.51 ? 0.01(cm ) ?V ?用误差算术合成公式计算, 得 ?V ? ?D ? ? ?? ? ? 0.01 ? ? 0.01 ? ? 2? ? ? 2 ? ? ? ? ??? ? ? 0.035 V ? D ? ? ? ? ? 0.80 ? ? 1.02 ?? ?V ? 3 ? ?? ? ?V ? ? V ? 0 . 035 0 . 51 ? 0 . 02 ( cm ) ? ? V ? 间接测定的误差估计例3:实验测得盐溶液中盐的浓度C=172.4±0.3(kg/m3),容积 V=0.825±0.005(m3),试求溶液中盐的重量W及误差σw。 解: W=C × V=172.4×0.825=142 两边取对数 lnW=lnC+lnVdW dC dV ? ? 求全微分 W C V所以?WW??? C ?C22??? V ?V220.32 0.0052 ? W ? 142? ? ? 0.90 2 2 172.4 0.825 间接测定的误差估计例4:已知间接测定量 4m N? 由实验测得 2 ?D H m ? 236.124? 0.002( g ), D ? 2.345? 0.005(m), H ? 8.21? 0.01(m) 求N的结果及其误差σN。4m 4 ? 236.124 解: N ? ?D 2 H ? 3.14? 2.3452 ? 8.21 ? 6.66两边取对数 ln N ? ln(4M ) ? ln? ? ln D 2 ? ln H 求全微分 dN ? dm ? 2 dm ? 1 dH N m D H2 2 2所以 ? N?1? 2 ? 2? 2 ? 1 ? 2 ? N ? ? ? ? m ? ? ? ? ? D ? ? ? ? ? H ? ? 0.030 ?m? ? D? ? H? 间接测定的误差估计4. 误差估计的应用 上面例子中的σV和ΔV都是表示间接测定量的误差的。由计算的结果可以看出, 由于采用误差合成公式的不同, 得到误差的结果也不同。当直接测定量仅有一个时, 用误差的方和根合成和算术合成公式计算, 所得到的间接测定量误差的大小是相同的。当直接测定量是两个或两个以上时, 算术合成得到的误差偏大, 而方和根合成得到的误差则小一些。 间接测定的误差估计 4. 误差估计的应用 直接测定量的误差主要是系统误差, 其正负号不能确定, 或在要求不太严格的情况下, 可用误差的算术合成来估计 总误差。若直接测定量的误差主要是随即误差, 特别是在 直接测定量较多时, 最好采用误差方和根合成来估计总误 差。 间接测定的误差估计4. 误差估计的应用2)直接测定量所允许的测定误差 按一定的研究方案进行实验时, 怎样选取仪器的精 密度。就是求直接测定量所允许的测定误差的问题。很多时, 常用等效法。这一方法假定各个直接测定量对间接测定量的误差贡献均相等, 即假定各分误差项相等。 间接测定的误差估计4. 误差估计的应用 根据常用等效法, 把随机误差传递(误差的方和根)公式? ?f ? 2 ? ?f ? 2 ? ? f ? 2 ?y ? ? ? ?x ? ? ? x1 ? ? ? ?x ? ? ? x 2 ? ? ? ? ?? ? ?x ? ? ? xm ? 1? ? 2? ? m?中右边各分误差项, 可以用2222?f ? x1来代替, ?x 1得?y ? ?f ? 2 ?f ?f ? y ? m? ? ?x ? ? ? x 1 ? m ?x ? x 1 ? ?x ? x 1 ? m ? 1? 1 1?y ?f ?f ?f ? x1 ? ? x2 ? ? ? ? ? ? xm ? ? ? xm ? ?x1 ?x 2 ?x m m计算出各直接测定量所允许的误差 由各分误差相等的假设, 可以得?y?f m ?x m 间接测定的误差估计4. 误差估计的应用 例1: 在用图解积分法作吸收塔计算时, 三角形的 面积S要用两边及其所夹的角来计算。这些量的近 b 似值分别为 a=12cm, b=10cm, A=38°若要求间 A a 接测定量三角形的面积准确到0.5(cm3), 试计算各 直接测定量所允许的误差。(求σa, σb, σA) 解: 以题意1 1 S ? ab sin A ? ?12??10??sin 38? ? ? 37?cm 2 ? 2 2三角形的面积函授取对数? 1? ln S ? ln? ? ? ln a ? ln b ? ln?sin A? ? 2? 求全微分, 得 dS da db cos A d ?ln S ? ? ? ? ? dA S a b sin A 间接测定的误差估计4. 误差估计的应用 所以有?SS???A ? ??a ? ??b ? ? ? ? ?? ? ?? ? a ? ? b ? ? tgA ?2 22采用等效法, 令?a1 ?? S ? ? ? ? ? ? a b tgA 3? S ??b?A代入已知数据得? a ?? ? S ? ? 12 ?? 0.5 ? ?a ? ? ??? ?? ?? ? ? 0.094?cm ? ? 3 ?? S ? ? 3 ?? 37 ?? b ?? ? S ? ? 10 ?? 0.5 ? ?b ? ? ??? ?? ?? ? ? 0.078?cm ? ? 3 ?? S ? ? 3 ?? 37 ? 间接测定的误差估计4. 误差估计的应用? tgA ?? ? S ? ? tg 38? ?? 0.5 ? ?A ?? ?? ? ? ? ?? ? ? 0.35? ? 3 ?? S ? ? 3 ?? 37 ?结果表明, 当边长a, b 及其夹角A的测定误差分别不大于0.094(cm),0.078(cm), 和0.35°时, 可保证所得面积S的误差不超过0.5(cm2)。 对于技术上困难大, 经济上耗费大的测定项目, 其测定精 度的要求可降低一些。而对于容易测定的量, 其测定精度在实际测定中, 对各测定量的实际误差还可以进行调整。可以适当高一些, 即要求其误差小一些。 只要满足间接测定量的误差不大于所给定的误差就可以了。 4. 误差估计的应用间接测定的误差估计例2:在用图解积分作吸收塔计算时, 三角形的面积S要用 两边及其所夹的角来计算。这些量的近似值分别为a=12±0.01 (cm), b=10±0.01 (cm), A=38°若要求间接 度A所允许的误差。(求σA)1 解: 由 S ? ab sin A 的随即误差传递公式知: 2测定量三角形的面积准确到0.5(cm3), 试计算间接测定量角?SS???A ? ??a ? ??b ? ? ? ? ?? ? ?? ? a ? ? b ? ? tgA ?2 22 间接测定的误差估计4. 误差估计的应用所以有?? S ? ??a ? ??b ? ? ? ? ?? ? ?? ? tgA ? S ? ? a ? ? b ??A2220.5 ? 0.5 ? ? 0.01 ? ? 0.01 ? ? ? ? 0.0135 ? ?? ? ?? ? ? 37 ? 37 ? ? 12 ? ? 10 ?222? ?A ? ?A ?? ? tgA ? ?tgA ? 0.0135? tg 38? ? 0.6? ? ?要使减小总误差, 必需减小各项分误差, 即提高各项测定量的精度。单个项分误差精度再高也不能减小总误差。 实验数据整理1. 数据处理中常用的几个概念 总体:研究对象的全体, 即具有共同性质的个体所 组成的集团。 个体:研究对象的一个单体称为个体。 在实际研究工作当中对某一量进行测量时, 一般只做有限的几次测量。即在总体中抽取部分 个体, 用以研究总体的性质。抽选的个体的集合 体, 在数理统计中称为子样(或样本) 。每个字样 所包含的个体数目, 通常称为容量。字样中的个 体称为元素。 实验数据整理2. 子样的均值与标准差我们可以用从总体抽取的子样去研究该总体, 利用子样的信息来作出关于总体的推断。一般来说,通过子样来要推断总体。①首先要有较好的抽样方法,使抽得的一些个体,能很好地反映总体的情况。 这就要贯彻随即抽样的原则, 即各次抽取应该是彼此独立的,总体 中的每个个体被抽到的机会是均等的。同时,子样的容量也不能太少。②其次,要计算出子样的特征数,用它们去推断总体的特征数。常用的特征数有两类,一类是表示数据集中性的特征数,常用的有算 术平均值。另一类是表示数据离散性的特征数.常用的有方差。即 子样元素值与子样平均值之偏差的平方和的平均值。1 n 算术平均值 x ? ? x j n j ?11 n 2 ? ? 子样方差 ? ? ? x j ? x n j ?12 实验数据整理2. 子样的均值与标准差 子样方差的开平方为子样标准差,? ?1 n 2 ? ?x ? x? n j ?1为了得到总体方差的无偏估计量,必须对子样方差作点修改,即n-1 来代替子样方差中的n,并记为S2,1 n 2 S ? ? ?x j ? x ? n ? 1 j ?12S2称为子样修正方差。相应地有子样修正标准差。即S?1 n 2 ? ?x ? x? n ? 1 j ?1经常把S2和S分别叫做子样方差和子样标准差(或简称标准差) 实验数据整理3. 均值与方差的点估计 在实际问题中,根据子样的数据,计算出的子样特征数x与S2,通常用来作为相应总体特征数的估计量。对于服从正态分布的总体而言,均值为μ,方差为σ2 。当子样是从一正 态分布的总体中随即抽出的一部分时,可用子样平均值 x 去估计该总体的均值μ,而用于子样方差S2去估计总体方差σ2 ,这在数理统计中称为点估计,即 实验数据整理1 n ? ? x ? ? xj ? n j ?11 n 2 ? ?S ? ? ? ?x j ? x ? n ? 1 j ?12 2其中“^”为估计量的符号。当我们用 x 作为总体估计量μ 或用S2作为总体估计量σ2时 ,子样特征数应满足这样的要 求,即它的数学期望(统计平均)应当等于它所估计的参数本 身 ,即E( x ) ? ? , E ( S 2 ) ? ? 2 这个要求称为无偏性。 实验数据整理3. 均值与方差的点估计 所谓无偏估计, 当然不是说用无偏估计量来估计不产生偏离,只是说由于子样数据算出的估计值离被估计值很近,由不同子样得到的估计值在被估计值附近波动,大量估计值的平均值能够消除估计值对被估计值的偏离。正是根据子样平均值是总体均值的无偏估计值这一观点, 如测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值或最可信赖值。换句话说,算术平均值很接近真值μ(总体均值) 。 实验数据整理3. 均值与方差的点估计证明算术平均值与测定值偏差的平方和最小。即设有一不等于算术平均值 的任一数A,则必有j ?1? xj ? xn?? ? ? ?x2 n j ?1j? A?2解: 由左边得j ?1? xj ? xn??2? ? ? x j ? A? ? ? x ? A?n j ?1??2 实验数据整理3. 均值与方差的点估计? ? ? x j ? A? ? 2? x ? A? ? ? x j ? A? ? n? x ? A?n 2 n j ?1 j ?1n 22n n 2 ? ? ? ? ?x j ? A? ? 2? x ? A?? ? x j ? ? A? ? n? x ? A? j ?1 j ?1 ? ? j ?1? ? ? x j ? A? ? 2? x ? A??nx ? nA ? ? n? x ? A?n 2 j ?12? ? ?xn j ?1nj? A?22 2 ? ? ? ? ? 2n x ? A ? n x ? A? ? ? x j ? A ? ? n? x ? A ?2 j ?12 实验数据整理3. 均值与方差的点估计j ?1? xj ? xnn??2? ? ? x j ? A? ? ? x ? A?n j ?12 2??2? ? ? x j ? A ? ? n? x ? A ?j ?1移项得j ?1? xj ? An??2? ? ? x j ? x ? ? n? x ? A ?n 2 j ?12 实验数据整理3. 均值与方差的点估计 因A≠x , 又n是正整数, 则必有 2 n? x ? A? ? 0即j ?1? xj ? Ann??2? ? ?x j ? x ? ? 0n 2 j ?1 n所以j ?1? xj ? x ? ? xj ? Aj ?1??2??2已得证算术平均值与测定值偏差的平方和最小。 实验数据整理3. 均值与方差的点估计 介绍平均值的标准差。算术平均值的标准差常用下式表示, 即S Sx ? n这个公式表明了平均值 的标准差 S x 与子样标准差S的关系。 当标准S不变时, n增大, 算术平均值的标准差减小,亦即用 作为? ? 估计的精度高。在分析测定时,测定次数n(子样容量)不能太小,否则算 术平均值的误差将增大。S不变时,n&5以后,子样均值的标准差随n的 增大而减小得很慢。这就是说,单靠增加观测次数来提高实验的精密 度 是不够的。这就意味着, 要把更多的精力用来改进测试技术, 往往比重 复老一套的测试精度不高的测量更有意义。因此, 在实际测定某一量 时, 由于多方面条件的限制, 重复测定的次数n很少超过50次, 一般在xx 实验数据整理4. 平均值与标准差的基本性质 性质1. 对子样的每一个值同乘以一常数a,由此得到的平均值或标准差要 相应地除以这个常数a, 才是原子样的平均值或标准差。 对性质1的证明如下: 设 x?=ax j , 证明1 ? 1 x ? x , S ? S? a a证明: 因为1 n 1 n x ? ? ? x ?j ? ? ax j ? ax n j ?1 n j ?1所以1 x ? x? a 实验数据整理4. 平均值与标准差的基本性质1 证明 S ? S ? a因为1 n 2 ? ? ? S ? ? ?x j ? x ? n ? 1 j ?1 1 n 2 ? ? ?ax j ? ax ? n ? 1 j ?11 n 2 ?a ? ?x j ? x ? ? aS n ? 1 j ?1所以1 S ? S? a 实验数据整理4. 平均值与标准差的基本性质 性质2.对子样的每一个值同加一个常数b, 由此得到的标准差与原子样的 标准差相同, 而得到的平均值要减去这个常数b, 才是原子样的平均值对性质2的证明如下: 设 x?=x j ? b , 证明证明: 因为x ? x ? ? b, S ? S ?1 n 1 n 1 n 1 x ? ? ? x ?j ? ? ? x j ? b ? ? ? x j ? ?nb ? ? x ? b n j ?1 n j ?1 n j ?1 n所以x ? x? ? b 实验数据整理4. 平均值与标准差的基本性质 证明 S=S` 证明: 因为1 n 2 S? ? ? ?x ?j ? x ? ? n ? 1 j ?11 n 2 ? ? ?x j ? b ? ? ? x ? b ? n ? 1 j ?1??1 n ? ? ?x j ? x ? n ? 1 j ?1所以根据子样平均值与标准差的上述性质, 我们 对一些太大,太小或有小数的测定值进行有 2 关变换,可使子样平均值与标准差的计算简 化。常用的变换公式为:x?j ? a?x j ? b?S? ? S1 x ? x? ? b a相应地有1 S ? S? a 实验数据整理5. 平均值与标准差的算法 由于算术平均值与标准差在数据处理中占有特殊的地位, 所以在实 际运算中碰到计算算术平均值与标准差的机会特别多。介绍几种算法1) 直接公式法 按算术平均值的原始定义式和标准差的原始定义式计算的方法。例: 分析容渣中二氧化硅的含量, 4次测定值分别为28.5, 28.6, 28.2, 28.3。求测定结果的平均值与标准差。1 n 1 解: x ? ? x j ? ?28.5 ? 28.6 ? 28.2 ? 28.3? ? 28.40 n j ?1 41 n 1 2 2 2 2 2 ? ? ? ? ? ? S? x ? x ? 0 . 1 ? 0 . 2 ? ? 0 . 1 ? ? 0 . 2 ? 0.18 ? j n ? 1 j ?1 3?? 实验数据整理5. 平均值与标准差的算法 2)计算标准差的导出公式法 为了提高计算精度和简化计算其间,我们可以导出以下公式S?1 n 2 ? ?x j ? x ? ? n ? 1 j ?11 n 2 2 ? ?x j ? 2 x j x ? x ? n ? 1 j ?1?n 1 ? n 2 2 ? x ? 2 x x ? n x ? ? ? ? j j j ?1 n ? 1 ? j ?1 ???1 ? n 2 2? ? ? x j ? 2 x ? ?nx ? ? nx ? n ? 1 ? j ?1 ?1 ? n 2 2 ? ? ? x j ? nx ? n ? 1 ? j ?1 ?代入1 n x ? ? xj n j ?12 n n ? 1 1? ? ? 2 或者写成 S ? ? ? xj ? ? ? xj ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 实验数据整理5. 平均值与标准差的算法 例: 分析容渣中而氧化硅的含量, 4次测定值分别为28.5, 28.6, 28.2, 28.3。求测定结果的标准差。2 n n ? ? 1 1? ? 2 解: 利用公式 S ? ? ? xj ? ? ? xj ? ? n ? 1 ? j ?1 n ? j ?1 ? ?j ?14? x j ? 28.5 ? 28.6 ? 28.3 ? 28.2 ? 113.64j ?12 2 2 2 2 x ? 28 . 5 ? 28 . 6 ? 28 . 3 ? 28 . 2 ? 3226.34 ? jS?1 ? 1 2? ? ? 3226 . 34 ? 113 . 6 ? 0 . 18 ? 4?1? 4 ? ? 实验数据整理5. 平均值与标准差的算法 3) 平均值与标准差的简易算法当原始数据有效数字位数很多时, 一种简便的计算方法是将原始数据 按 x?j ? a x j ? b 进行变换,计算出变换后数据的平均值和标准差 1 1 ,最后按比例 和 x ? x ? ? b 分别将平均值和标准差还原。 S ? S???aa选择b的原则是测定量的数据中出现频率最多的数或是接近平均 值的一个仸意数。选择a的原则是使变换后的数据为有效数字最少的 整数。例: 测得某污水样的pH值如下表所示。求这组数据的平均值与标准差 实验数据整理5. 平均值与标准差的算法 3) 平均值与标准差的简易算法 x ?j ?x?j ?2 序号 x j ( pH )1 2.71 -5 25解: b=2.76, a=100, 即 x? j ? 100 x j ? 2.76j ?12 ? ? x ?j ? 4, ? ? x j ? ? 86??nnj ?123 42.762.79 2.7803 209 4S? ?2 n ? 1 ? n 1 2 ? ? ? ? ? ? ?x j ? ? ? ? x j ? ? n ? 1 ? j ?1 n ? j ?1 ? ?56 7 8 92.762.82 2.78 2.74 2.7606 2 -2 0036 4 4 0?1 ? ? 1 ? 2 ? 86 ? ? ? ?4 ?? ? 3.1 ? 10 ? 1 ? ? 10 ? ?S?1 ? 1 ? S? ? ? ??3.1? ? 0.031 a ? 100 ?10Σ2.74-244861 n 4 x ? ? ? x ?j ? ? 0.4 n j ?1 10求 : x和S1 0.4 x ? x? ? b ? ? 2.76 ? 2.764 a 100 实验数据整理6. 均值的置信区间 用相同的方法重复测定某一量,在消除系统误差的情况下,测定值 ? 。测定次数愈多, ? 的算术平均值,可作为这个量的真值μ的估计值 即子样容量n愈大,平均值与真值就越接近。当测定次数无穷时,平均 值就是这个量的真值。当然,实际上测定无穷多次是做不到的。我们 x值 去估计真值μ 。但毕竟是 可以根据有限次测定数据的平均 x ? ? 。那么子样平均值与总体平均值到底相差多少呢?这就需 x 的误差的绝对值为 要估计其误差。我们令均值μ的估计量? ? x??我们给出一个置信概率(或称置信度),求总体均值在这个置信概率 下的所在范围(区间),这个范围称为置信区间。 可以用下式表示μ的估计量 p? x ? ? ? ? ? ? ? 或等价地写成 p x ? ? ? ? ? ? 1 ? ? 这个公式表示估计量的误差落在区间(-ε,ε)中的概率为(1-α) 。 再进一步写成 p?x ? ? ? ? ? x ? ? ? ? 1 ? ? 公式表示在置信概率为(1-α)时的均值μ的置信区间是 ? x ? ? , x ? ? ? 置信区间表示估计结果的精确程度,置信概率则表示结果的可靠程度。? 实验数据整理p?x ? ? ? ? ? x ? ? ? ? 1 ? ? 中的ε。这里需要引入一个新的变量。 ?x ? ?? t ? S/ n随机变量t有如下的概率密度函授6. 均值的置信区间 为了确定均值μ在某一置信概率下的置信区间,需要计算? t2 ? ? ? ? ?t ? ? 1? ? ? n ? 1 n ? 1 ? ?? ? ?n ? 1?? ?? ? ? 2 ?n ? 2?n 2这个分布叫做具有自由度为f=n-1的t分布。 t分布对于t=0是对称的, t分布的概率密度取决于子样的容量n和t 的值。利用t 分布可以导出? ? p? x ? ? ? ? ? ? ? ?? x?? ? ? p? ? ? ? p?t ? t a , f ? ? 1 ? ? ?S / n S / n ? 实验数据整理6. 均值的置信区间 即式中p?t ? t? , f ? ? 1 ? ?p?x ? ? ? ? ? x ? ? ? ? 1 ? ?p?x ? S x ? t? , f ? ? ? x ? S x ? t? , f ? ? 1 ? ?对应置信概率(1-α)的均值μ的置信区间 如下: 得将式 ? ? S x ? t? , f 代入下式t? , f ??S/ n所以S ?? ? t? , f nSx ? n?x ? Sx? t? , f , x ? S x ? t? , f ?常把置信区间表示为结合算术平均值的标准差 S 的计算式 所以上式可写成? ? x ? S x ? t? , f利用附录B-2,可以查到对应已给的置信 概率(1-α),自由度f=n-1的ta,f的值,从而求 得均值μ的置信区间。? ? S x ? t? , f 实验数据整理6. 均值的置信区间求得均值μ的置信区间的最体做法如下: (1)问题的给出:原始数据, 子样容量n, 置信概率(1-a)。 (2)由a, f=(n-1)查附录B-2, 得ta,f (3)有原始数据计算平均值 x 和标准差S (4)计算ε (5)写出置信区间 ? x ? ? , x ? ? ? ,或者写成 ? ? x ? ? ,并表示置 信概率 。例1. 在指定条件下,对某物理量测定得数据:11, 12, 12, 8, 8, 13, 13, 14, 14, 15, 试分别求出置信概率为0.90和0.99时均值的置信区。 解: 已知 n=10, 1-α1=0.90、1-α2=0.99, 则f=n-1=9, α1=1-0.90=0.10, α2=1-0.99=0.01 查附录B-2得t 0.10, 9 ? 1.83,t 0.01, 9 ? 3.25 实验数据整理6. 均值的置信区间由原始数据, 得j ?1? x j ?120, ? x ? 1492,j ?1 2 j10102 n n ? ? 1 1? ? 2 S? ? ? x ?j ? ? ? x ? ? n ? 1 ? j ?1 n ? j ?1 ? ?1 n ?1? x ? ? x j ? ? ??120? ? 12.0 n j ?1 ? 10 ? 1? ?1? 2? ? ?1492 ? ? ??120? ? ? 2.40 9? ? 10 ? ?? 2 ? S x ? t 0.01,9 ? ?0.76??3.25? ? 2.5S 2.40 Sx ? ? ? 0.76 n 10 ? 1 ? S x ? t 0.10,9 ? ?0.76??1.83? ? 1.4当置信概率分别为90%和99%时, 该物理量的置信区间分别为? ? x ? ? 1 ? 12.0 ? 1.4, ? ? x ? ? 2 ? 12.0 ? 2.5 实验数据整理6. 均值的置信区间 例: 为检验某一河流中鱼被汞污染的情况, 从一些鱼中随机抽取一 些鱼样,测定鱼组织中的汞含量,得到测定结果如下(ppm): 2.06, 1.93, 2.12, 2.16, 1.89, 1.95, 试从测定数据估计这批鱼汞含量在置信概率 为0.95的范围( x ? ? )。解: 已知条件1-a=0.95, a=0.05, f=n-1=6-1=5 查附录B-2 得 t 0.05, 5 由原始数据得6? 2.57n 2 jj ?1? x j ? 12.11, ? x ? 24.5031,j ?11 n ? 1? x ? ? x j ? ? ??12.11? ? 2.018 n j ?1 ? 6? 实验数据整理2 1 ? n 2 1? n ? ? 1 ? ?1? 2? ? S? 24.5031 ? ? ??12.11? ? ? 0.11 ? ? xj ? ? ? xj ? ? ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 6?1? ? 6? ?S 0 ?11 Sx ? ? ? 0.049 n 5? ? Sx ? t0.05,5 ? ? 0.049?? 2 ? 57 ? ? 0 ?13所以,这批鱼的汞含量范围位为x ? ? ? 2.02 ? 0.13我们可以说“根据这次试验, 有95%的把握说, 这批鱼的汞含量在 1.89~2.15ppm之内”。79 7. 异常数据的取舍实验数据整理当我们着手整理实验数据时, 必须先解决一个重要问题,那就是异 常数据取舍的问题。整理实验数据时往往会遇到这种情况,即在一组 实验数据里发现少数几个偏差特别大的数据,如果这些数据是因为读 错,记错,算错,仪器震动等等因素影响而造成的坏值可以有充分的理 由将其舍弃。但是,如果为了得到精度更高的结果,而人为地舍掉一 些偏差大一点,但不是属于坏值的值,这是错误的。那么这样处理这 些数据呢?一般要用统计判别法。统计判别法是建立在测定值遵从 正态分布与随机抽样理论基础之上的。统计判别法要舍弃的坏值的 数目,相对于子样的容量是极少数。如果需舍弃的异常数据较多时, 那就要对测定的正确性提出怀疑。下面介绍几种统计判别法的准则。 1) 拉依达准则 拉依达准则又可称为3S准则。根据拉依达准则,在一组等精度独立 测定值中,若某个值xd的偏差 ? x d ? x ? 的绝对值大于三倍标准差,即 x d ? x ? 3 S 则可以认为xd是坏值,需舍弃之。 在实际判断中,只要可疑数据xd是在区间 x ? 3 S 以外,则舍弃xd 。?? 实验数据整理7. 异常数据的取舍 1) 拉依达准则 例:测量某溶液中某一物理量,整理测量数据如下102, 98, 99, 97, 100, 140, 95, 100, 98, 96, 102, 101, 101, 102, 102, 99试用拉依达准则检验测定值140是否为坏值?。 即 140是否在 ( x ? 3 S , x ? 3 S ) 以外。 解: 由标准差的公式S?162 n n ? 1 1? ? ? 2 ? ? xj ? ? ? xj ? ? n ? 1 ? j ?1 n ? j ?1 ? ?根据原始数据计算得j ?1? x j ? 1632,j ?12 ? x j ? 168078,161 n ?1? x ? ? x j ? ? ??1632? ? 102.0 n j ?1 ? 16 ? 实验数据整理7. 异常数据的取舍 1) 拉依达准则2 n n ? 1 1? 1 ? 1 2? ? ? 2 S? 168078 ? ?1632? ? ? 10.37 ? ? xj ? ? ? xj ? ? ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 15 ? 16 ?x ? 3S ? 102.0 ? 3 ? 10.37 ? 70.9 x ? 3S ? 102.0 ? 3 ? 10.37 ? 133.1由于测定值140在区间(70.9, 133.1)以外, 故应舍弃之。 拉依达准则使用方便,当测定次数较多,即子样容量较大时,或对检 验的精度要求不高时,可以用它。但当测定次数较少时,如n≦10,一组 测定值中即使有坏值也无法剔除。当精度要求较高时,可用2S准则。 证明n≦10时,用拉依达准则是无法剔除坏值。 证明: 当n≦10时 1 n 1 10 1 10 2 2 2 S? x ? x ? x ? x ? x ? x ? j ? j ? j n ? 1 j ?1 10 ? 1 j ?1 3 j ?1?????? 实验数据整理7. 异常数据的取舍 1) 拉依达准则3S ?因为j ?1? xj ? x10??2?j ?1 j?d? xj ? x10?? ? ?x2d? x?2j ?1 j ?d?10?xj? x? ? 02所以3 S ? x d ? x 所以n≦10时,用拉依达准则是无法剔除坏值。根据拉依达准则,测定值中,若某个值xd的偏差 ? x d ? x ? 的绝对值大 于三倍标准差,即 x d ? x ? 3 S 则可以认为xd是坏值,需舍弃之。 实验数据整理7. 异常数据的取舍 2) 肖维特(Chauvent)准则 在一组等精度测定数据中,若可疑数据xd的偏差满足下面的不等式, ? x ? Wn ? S , x ? Wn ? S ? 即xd ? x ? Wn ? S 或等价地有,当xd在区间 1. 肖维特系数表 以外,则可认为xd是坏值表 ,应 舍弃之。 Wn的值取决于子样容量n 。n3 4WnnWnnWn1.38 1.5313 142.07 2.1023 242.30 2.3156 7 8 91.651.73 1.80 1.86 1.921516 17 18 192.132.15 2.17 2.20 2.222526 27 28 292.332.39 2.49 2.58 2.711011 121.962.00 2.032021 222.242.26 2.283031 322.813.02 3.20 实验数据整理7. 异常数据的取舍 2) 肖维特(Chauvent)准则例: 测得某品位的矿石中铁含量的数据如下 1.52, 1.46, 1.61, 1.55, 1.49, 1.68, 1.46, 1.83, 1.50, 1.54试用肖维特准则判断1.83是否应当 舍弃。 解: 查肖维特系数表n=10时, W10=1.96, 由原始数据计算得10 2 j1 n ?1? ? x j ? 15.64, ? x ? 24.581, x ? ? x j ? ? ??15.64? ? 1.564 j ?1 j ?1 n j ?1 ? 10 ? 2 n n ? 1 1 ? ?1? 2? ? ? 2 1? S? 24.581 ? ? ??15.64? ? ? 0.12 ? ? xj ? ? ? xj ? ? ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 10 ? 1 ? ? 10 ? ?10x ? Wn ? S ? 1.564 ? 1.96 ? 0.12 ? 1.329 x ? Wn ? S ? 1.564 ? 1.96 ? 0.12 ? 1.799由于1.83在区间(1.329, 1.799)以外, 故测定值1.83是坏值, 应当舍弃。 实验数据整理7. 异常数据的取舍 3) 格拉布斯(Grubbs)准则 考虑到置信概率(置信度),格拉布斯严格地推导出, 当 xd ? x ? Ga ,n ? S 或等价地有,当xd落在区间 ( x ? Ga ,n ? S , x ? Ga , n ? S ) 以外,则可认为xd 是坏值,应当舍弃之。G a , n 取决于子容量n和小概率事件的概率 。 格拉布斯 G a , n数值表 在用格拉布斯准则时,通常取? ? 0.05或0.01 。?n a 3 4 5 6 70.01 1.15 1.49 1.75 1.94 2.10.05 1.15 1.46 1.67 1.82 1.94na 12 13 14 15 160.01 2.55 2.61 2.66 2.70 2.740.05 2.29 2.33 2.37 2.41 2.44n a 21 22 23 24 250.01 2.91 2.94 2.96 2.99 3.010.05 2.58 2.60 2.62 2.64 2.6689 10 112.222.32 2.41 2.482.032.11 2.18 2.241718 19 202.782.82 2.85 2.882.472.50 2.53 2.562627 28 293.103.18 3.24 3.342.742.81 2.87 2.96 实验数据整理7. 异常数据的取舍 3) 格拉布斯(Grubbs)准则 对某一物理量进行15次等精度测定,其结果如下: 0.60, 1.56, 1.70, 1.76, 1.78, 1.87, 1.95, 2.06, 2.10, 2.18, 2.20, 2.39, 2.48, 2.63, 3.01 使用格拉布斯准则判断其中有无坏值,3.01是不是坏值。 解: 选定α=0.05,查格拉布斯数值表得: Ga ,n ? 2.411 n 1 ?30.27? ? 2.018 x ? ? xj ? n j ?1 152 1 ? n 2 1? n ? ? 1 ? ?1 2 ?? ? ? S? x ? x ? 65 . 3345 ? 30 . 27 ? ? ? ? ? ? 0.55 ? ? j j? ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 15 ? 1 ? ? 15 ??j ?1? x j ? 30.27,15j ?12 ? x j ? 65.334515x ? Ga ,n ? S ? 2.018 ? 2.41? 0.55 ? 0.692 x ? Ga ,n ? S ? 2.018? 2.41? 0.55 ? 3.344由于测定值0.60落在区间(0.692, 3.344)以外, 故根据格拉布斯准则,可将0.60舍弃。 实验数据整理7. 异常数据的取舍 3) 格拉布斯(Grubbs)准则 求x15=3.01是不是坏值。 解: 剔除0.60以后,则子样容量变为n=15-1=14,查格拉布斯数值表得G0.05,14 ? 2.37j ?1 14? x j ? ? x j ? x d ? 30.27 ? 0.60 ? 29.671415?x ??xj ?1 2 j j ?1j ?1 152 j? x ? 65. ? 64.972 d 21 n ?1? x ? ? x j ? ? ??29.67? ? 2.119 n j ?1 ? 14 ?S?2 1 ? n 2 1? n ? ? 1 ? 1 2? ? ? x ? x ? 64 . 9475 ? 29 . 67 ? 0.40 ?? j? ? ?? j ? ? n ? 1 ? j ?1 n ? j ?1 ? ? 14 ? 1 ? 14 ? 实验数据整理7. 异常数据的取舍 3) 格拉布斯(Grubbs)准则由于可疑数据3.01在区间(1.171, 3.067)以内, 故不能作为坏值剔除。 8. 整理实验数据 对实验数据按有效数字计算规则记录,并对其中的可疑数据进行恰 当的取舍后,还需要进一步整理。首先要求出子样的平均值和标准 差,然后用数值表示对总体均值的估计结果。有两种表示形式,一种 ? ? x ? S x , 另一种是 ? ? x ? t a , f ? S x 是 测定某一热交换器里水垢中的Fe2O3的含量,在相同条件下测定6次的 数据如下:79.58, 79.45, 79.47, 79.50, 79.62, 79.38, 写报告实验结果 解: 在这组数据中没有异常数据,直接对原始数据进行处理。 计算得 x ? 79.50, S ? 0.09, S x ? 0.04, x ? S x ? 79.50 ? 0.04 另一种 t 0.05, 5 ? 2.57 S x ? t 0.05,5 ? 0.10, x ? S x ? t a , f ? 79.50 ? 0.10置信概率为95%x ? Ga ,n ? S ? 2.119 ? 2.37 ? 0.40 ? 1.171 x ? Ga ,n ? S ? 2.119 ? 2.37 ? 0.40 ? 3.067 试验数据的表图表示法 2.1 列表法?将试验数据列成表格,将各变量的数值依照一定的形式和 顺序一一对应起来(1)试验数据表 ①记录表? ? ? ? ?试验记录和试验数据初步整理的表格 表中数据可分为三类: 原始数据 中间数据 最终计算结果数据 原始数据番号 試料名 アンモニア態 硝酸態窒 素 無機態窒素12 3 4 5 6 7吹込1年 0~20cm吹込1年 20~40cm 吹込1年 40~60cm 無吹込1年 0~20cm 無吹込1年 20~40cm 無吹込1年 40~60cm 吹込2年 0~20cm22.420.3 19.3 37.8 29.8 25.8 25.7364.9239.4 129.0 300.2 177.7 110.5 326.8387.3259.7 148.3 338.1 207.5 136.3 352.589 10 11 12 13 14 15 16 17吹込2年 20~40cm吹込2年 40~60cm 無吹込2年 0~20cm 無吹込2年 20~40cm 無吹込2年 40~60cm 吹込3年 0~20cm 吹込3年 20~40cm 吹込3年 40~60cm 無吹込3年 0~20cm 無吹込3年 20~40cm20.220.8 33.0 23.2 22.4 23.9 23.5 21.5 33.7 24.6220.1165.0 289.0 140.7 94.8 256.7 238.8 219.3 247.4 165.1240.3185.8 322.1 163.9 117.2 280.6 262.3 240.7 281.1 189.7 中间数据 深度(cm) 20 40 60 深层吹入法 25.7 20.2 20.8 对照 33.0 23.2 22.4 最终计算结果数据Table 2. Physicochemical Property of Saline soils.Particle density (Mg/m3) M1 Ap B C M2 Ap 2.58 2.57 2.58 Bulk density (Mg/m3) 1.45 1.46 1.48 Organic matter (g/kg) 8.0 7.2 6.3 7.0 14.3 12.9 17.1 23.1 Total N (g/kg) 1.1 1.0 1.5 1.2 Availability P (mg/kg) 87.7 32.3 26.6 84.7Sample NoHori zonPorositypH(%) 43.8 43.2 42.6B7.513.10.823.6 试验数据的表图表示法(2)说明:? ? ?三部分:表名、表头、数据资料 必要时,在表格的下方加上表外附加表名应放在表的上方,主要用于说明表的主要内容,为了 引用的方便,还应包含表号表头常放在第一行或第一列,也称为行标题或列标题,它 主要是表示所研究问题的类别名称和指标名称 数据资料:表格的主要部分,应根据表头按一定的规律排 列???表外附加通常放在表格的下方,主要是一些不便列在表内 的内容,如指标注释、资料来源、不变的试验数据等 Table 2. Physicochemical Property of Saline soils.(表名)表头Sample No Hori zon Particle density (Mg/m3) M1 Ap B C M2 Ap 2.58 2.57 2.58 Bulk density (Mg/m3) 1.45 1.46 1.48 Organic matter (g/kg) 8.0 7.2 6.3 7.0 14.3 12.9 17.1 23.1 Total N (g/kg) 1.1 1.0 1.5 1.2 Availability P (mg/kg) 87.7 32.3 26.6 84.7PorositypH(%) 43.8 43.2 42.6数据资料B 7.5 13.1 0.8 23.6注:Ap深度为15cm,B深度为8cm,C深度为20cm。 表外附加 Fig. 1. Sampling sites in Northeastern Part of China① Sample ② Sample ③ Sample ④ Sample M3~M5, M8, M10~M12 was collected M7 and M9 was collected M1 and M2 was collected M6 was collected 试验数据的表图表示法②结果表示表??表达试验结论应简明扼要 试验数据的表图表示法(3)注意 :?表格设计应简明合理、层次清晰,以便阅读和使用;?? ?数据表的表头要列出变量的名称、符号和单位;要注意有效数字位数; 试验数据较大或较小时,要用科学记数法来表示,并记入 表头,注意表头中的与表中的数据应服从下式:数据的实 际值×10±n = 表中数据; 数据表格记录要正规,原始数据要书写得清楚整齐,要记 录各种试验条件,并妥为保管。? 试验数据的表图表示法 2.2 图示法2.2.1 常用数据图(1)线图(line graph/chart)? ? ?表示因变量随自变量的变化情况线图分类: 单式线图:表示某一种事物或现象的动态?复式线图:在同一图中表示两种或两种以上事物或现象的 动态,可用于不同事物或现象的比较 试验数据的表图表示法图1高吸水性树脂保水率与时间和温度的关系 试验数据的表图表示法100 80 30 25效率 η (%)60 40 20 0 0 5 10 15 20 25 30 35 流量qv(L/s)15 η H 10 5 0图2 某离心泵特性曲线压头H(m)20 试验数据的表图表示法(2)XY散点图(scatter diagram)?表示两个变量间的相互关系?散点图可以看出变量关系的统计规律2.5 2.0 1.5 1.0 0.5 0 2 4 x 6 8 10y图3 散点图 试验数据的表图表示法(3)条形图和柱形图12提取率(%)10 8 6 4 2 0 湿浸法 碱提法 醇提法 提取方法 超声波法图4 不同提取方法提取率比较?用等宽长条的长短或高低来表示数据的大小,以反映各数 据点的差异 两个坐标轴的性质不同? ??数值轴 :表示数量性因素或变量 分类轴 :表示的是属性因素或非数量性变量 试验数据的表图表示法? ? ?分类: 单式:只涉及一个事物或现象 复式:涉及到两个或两个以上的事物或现象超声波法醇提法 植物2 植物1 碱提法湿浸法 0 2 4 6 8 10 12 14 16 18 20提取率(%)图5 不同提取方法对两种原料有效成分提取率效果比较 试验数据的表图表示法(4)圆形图和环形图 ①圆形图(circle chart)??也称为饼图(pie graph)表示总体中各组成部分所占的 比例 只适合于包含一个数据系列的 情况 饼图的总面积看成100% ,每 3.6°圆心角所对应的面积为 1% ,以扇形面积的大小来分 别表示各项的比例??图6 全球天然维生素E消费比例 试验数据的表图表示法②环形图(circular diagram)图7 全球合成、天然维生素E消费比例比较??每一部分的比例用环中的一段表示 可显示多个总体各部分所占的相应比例 ,有利于比较 试验数据的表图表示法(5)三角形图(ternary) 常用于表示三元混合物各组分含量或浓度之间的关系?? ? ?三角形:等腰Rt△、等边△、不等腰Rt△等顶点:纯物质 边:二元混合物 三角形内:三元混合物A●xB=1- xA- xSM●xABSxS图8 等腰直角三角形坐标图 试验数据的表图表示法A0.00 1.00xB0.25xC0.75xBE0.750.50xA●0.50MF0.25xA1.00 CxxB0.25 0.50 0.75xA0.00B0.00C1.00xC图9 等边三角形坐标图 试验数据的表图表示法(6)三维表面图(3D surface graph)?三元函数Z=f(X,Y)对应的曲面图,根据曲面图可以看出因 变量Z值随自变量X和Y值的变化情况图10 三维表面图 试验数据的表图表示法(7)三维等高线图(contour plot)?三维表面图上Z值相等的点连成的曲线在水平面上的投影图11 三维等高线图 试验数据的表图表示法绘制图形时应注意 :(1)在绘制线图时,要求曲线光滑,并使曲线尽可能通过较多 的实验点,或者使曲线以外的点尽可能位于曲线附近,并 使曲线两侧的点数大致相等; (2)定量的坐标轴,其分度不一定自零起;(3)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表 的变量名称、符号及所用的单位,一般用纵轴代表因变 量; (4)坐标轴的分度应与试验数据的有效数字位数相匹配; (5)图必须有图号和图题(图名),以便于引用,必要时还 应有图注。 试验数据的表图表示法2.2.2 坐标系的选择?坐标系(coordinate system)笛卡尔坐标系(又称普通直角坐标系)、半对数坐 标系、对数坐标系、极坐标系、概率坐标系、三角形 坐标系 …...?对数坐标系(semi-logarithmic coordinate system)? ?半对数坐标系 双对数坐标系 试验数据的表图表示法(1)选用坐标系的基本原则: ①根据数据间的函数关系? ? ?线性函数:普通直角坐标系 幂函数:双对数坐标系 指数函数:半对数坐标②根据数据的变化情况? ?两个变量的变化幅度都不大,选用普通直角坐标系; 有一个变量的最小值与最大值之间数量级相差太大时,可以选用半对 数坐标; 两个变量在数值上均变化了几个数量级,可选用双对数坐标;??在自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引起因 变量极大变化时,此时采用半对数坐标系或双对数坐标系,可使图形 轮廓清楚 试验数据的表图表示法例:x y 10 2220 200 180 160 140 120y20 440 1460 6080 80100 100100 80 60 40 20 0 0 500 00 00
x图12 普通直角坐标系 试验数据的表图表示法1000100y10 1 10 100 x图13 对数坐标系 试验数据的表图表示法1.80 1.60 1.40 1.201.60 1.50 1.40 1.30 1.20 1.10吸光度A1.00 0.80 0.60 0.40 0.20 0.00 7.0 8.0 9.0 10.0 11.0 12.0吸光度A7.08.09.0 pH10.011.012.0pH图14 坐标比例尺对图形形状的影响 试验数据的表图表示法 2.3 计算机绘图软件在图表绘制中应用2.3.1 Excel在图表绘制中的应用(1)利用Excel生成图表的基本方法(2) 对数坐标的绘制 (3) 双Y轴(X轴)复式线图的绘制 (4) 图表的编辑和修改2.3.2 Origin在图形绘制中的应用(1) 简单二维图绘制的基本方法(2)三角形坐标图的绘制 (3) 三维图的绘制 统计检验 1) 统计检验的几个基本概念 ①统计检验的内容 统计检验又称假设检验或检验假设,它是统计推 断的一个重要组成部分。其重要内容是,对总体某 个参数给定一个值,即提出一个假设,然后对用子样 算出的相应的统计量加以检验。 统计检验 ②统计检验的推理方法 统计检验的推理方法的基本特点是用了反证 法的思想。先假定一个假设是成立的,从子样出发 进行推导,如果导致一个不合理的现象出现,那么就证明原先的假设是不能成立的,因此拒绝这个假设。否则,就接受原假设。 统计检验③统计检验的几个概念统计检验中,可以提出一项假设H0:μ=μ0,这里叫原假设 或零假设。与H0相反的假设叫做相反假设或择一假设,记 作Hα:μ≠μ0 。 显然,接受或否定一个假设,都不可能有百分之百的把握。 在检验过程中,我们要先给出小概率α,若计算的统计量的 出现是一个小概率事件,则否定原假设,否则接受原假设。这里的小概率α,在统计中,一般称做检验的显著水平。而(1- α)为可靠性,常称为置信度或置信概率。 统计检验 1) 统计检验的几个基本概念 ③统计检验的几个概念 在统计检验中可选择一个适当的常数ε,这时小概率事件 的概率是p? x ? ?0 ? ? ? ? ?如果 x ? ? 0 ? ? ,就否定原假设。否定原假设H0的区域, 称为检验的拒绝域,或称为临界域。 我们自然希望将α的值取小一点,把它控制在一定的限度 以内。如取α=0.05, 0.01, 0.10 等。 统计检验 统计检验需要搜集子样数据来计算有关检验统计量。再用这些统计量的值和给定的显著性水平α来决定接受或否定原假设H0 。 根据H0和Hα的具体情况,检验可分为单边检验或双边检 验。当检验假设形如 H0:μ=μ0; Hα:μ>μ0(或μ<μ0)称为单边检验。 当检验假设形如H0:μ=μ0; Hα:μ≠μ0 称为双边检验。双边检验的Hα可略不写。 统计检验2) u检验 已知σ2(总体方差),检验均值μ0。这将需要用u检验法。检验统计量为x?? u? ?/ nH0μ=μ0 μ=μ0 μ=μ0u检验表Hαμ≠μ0 μ&μ0 μ&μ0在显著性水平α下的拒绝域Ⅰ Ⅱ Ⅲu ? ka / 2 u ? ka u ? ? ka例: 某糖厂用自动打抱机包装糖,每包标准重量为50(kg),根据长期的 经验知道,其重量的标准差σ=0.6(kg)。某一天,从糖包中随即抽取9包 ,重量为49.65, 49.35, 50.25, 50.60, 49.15, 49.85, 49.75, 51.05, 50.25, 试问这一天包装机工作是否正常。 统计检验2) u检验 解: 这是一个双边检验问题。具体检验步骤如下 (1)假定数据来自正态分布, 且方差为已知; (2)建立假设H0: μ=μ0=50(kg); Ha:μ≠50(kg); (3)指定显著水平α,本例取α=0.05; (4)检验的拒绝域为 u ? k a / 2 , k a / 2 ? k 0.025 查附录B-1,得ka / 2 ? k0.025 ? 1.96(5)计算统计量u, 由原始数据得1 n ? 1? x ? ? x j ? ? ??449.9? ? 49.989 n j ?1 ? 9? x?? 49.989 ? 50 u? ? ? ?0.055 ?/ n 0.6 / 9(6)下结论。由于 u ? 0.055 ? ka / 2 ? 1.96 ,故接受原假设,即可以认为 糖包的重量为50(kg),包装机的工作正常,作出这中判断的置信度为 95%。 统计检验2) u检验 例: 某炼钢厂根据积累的经验知,在正常情况下,铁水的含碳量服从正 态分布,总体平均数为4.55,总体方差 ? 2 ? 0.1082 。现在又测5炉铁水 其含碳量分别为 4.28, 4.40, 4.42, 4.35, 4.37 。如果标准差没有改变 问平均含碳量有无显著变化? 解: 作假设H0: μ=μ0=4.55; Ha:μ≠4.551 5 x ? ? x j ? 4.364 5 j ?1x ? ? 4.364 ? 4.55 u? ? ? ?3.85 ?/ n 0.108 / 5取显著性水平α=0.05,查附录B-1得由于 u ? 3.85 ? k? / 2 ? 1.96 ,故应拒绝H0,接受择一假设H α ,即平 均碳含量比原来有显著变化,作出这种判断的置信度为95%。k? / 2 ? k0.025 ? 1.96u检验一般用于大子样 进行统计推断,t检验适 用于小子样(n&30)。 3) t 检验(单个子样的t 检验) u检验需要知道总体方差,而实际上总体方差往往是不知道的。在不 知道总体方差时,检验H0: μ=μ0用t 检验。统计量为统计检验x?? t ? S/ nH0t 服从自由度f =n-1的t 分布。t 检验如下:Hα μ≠μ0 在显著性水平α下的拒绝域 |t|〉tα,f Ⅰ μ=μ0ⅡⅢμ=μ0μ=μ0μ>μ0μ<μ0t>t2α、ft<-t2α、f例: 用某仪器间接测量温度,重复5次所得数据为 , , 1275(k), 而用别的比较精确的方法测得该温度为1277(k)。试 问用此仪器间接测温度有无系统误差? 3) t 检验 解:这是一个双边检验问题。假定总体服从正态分布,当不知其方差, 用t 检验。 (1)建立假设 H 0 : ? ? ?0 ? 1277(k ); H a : ? ? 1277(k ); (2)指定显著水平α,本例取α=0.05; (3)检验的拒绝域为|t|&ta,f。当α=0.05,f =n-1=5-1=4时, 查附录B-2得 t0.05,4=2.78 (4)计算统计量t , 由原始数据得统计检验1 n x ? ? x j ? 1259.0 n j ?11 n 2 ? ? S? x ? x ? 11.9 ? j n ? 1 j ?1x ? ? 1259.0 ? 1277 t? ? ? ?3.38 S/ n 11.9 / 5 3) t 检验 (5)下结论。由于统计检验t ? 3.38 ? t 0.05,4 ? 2.78所以,在显著水平α=0.05下,否定原假设,接受择一假设,即用此仪器 测量温度有系统误差。3) t 检验(两个子样的t 检验) t 检验还可以用来比较两个子样的均值的检验,这时统计量t 用下式 表示,即 ( x ? x ) ? (? ? ? )t?12122 ( n1 ? 1) S12 ? ( n2 ? 1) S 2 1 1 ? ? n1 ? n2 ? 2 n1 n2x1, x2 分别表示两个子样的平均值 2 分别表示两个子样的方差 S12 , S 2式中μ1、μ2分别表示两个总体的均值;n1,n2分别表示两个子样 的容量 统计检验3) t 检验(两个子样的t 检验) t 遵从自由度f =n1+n2-2的t 分布。两个总体均值的检验,如下所示 H0 Ⅰ Ⅱ Ⅲ Hα 在显著性水平α下的拒绝域μ1 =μ2μ1 =μ2 μ1 =μ2μ1≠μ2μ1 >μ 2 μ1 <μ 2|t|〉tα,ft>t2α、f t<-t2α、f例: 用A,B两台仪器测定某一物理量,得如下两组数据: A 20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2 B 17.7 20.3 20.0 18.8 19.0 20.2 19.1 20.1 19.4 试问这两台仪器的测量有无显著差别? 统计检验3) t 检验(两个子样的t 检验) 解: 这是一个双边检验问题。假定两个子样数据均来自正态分布,这 里用t 分布。 (1)建立假设 H 0 : ? A ? ? B ; H? : ? A ? ? B ; (2)指定显著水平α,本例取α=0.05; (3)检验的拒绝域为|t|&ta,f。当α=0.05,f =n1+n2-2=8+9-2=15时, 查附录B-2得 t0.05,15=2.13 (4)计算统计量t ,t?( x1 ? x 2 ) ? ( ? 1 ? ? 2 )2 ( n1 ? 1) S12 ? ( n2 ? 1) S 2 1 1 ? ? n1 ? n2 ? 2 n1 n2由于? n ? 1? S2? ? ?x j ? x ?n j ?122 x A ? 20.40; ?nA ? 1?S A ? 6.2由原始数据得2 x B ? 19.40; ?nB ? 1?S B ? 5.8 统计检验3) t 检验(两个子样的t 检验) 求t 得:t?( x1 ? x 2 ) ? ( ? 1 ? ? 2 )2 1 2 2( n1 ? 1) S ? ( n2 ? 1) S 1 1 ? ? n1 ? n2 ? 2 n1 n2?20.40 ? 19.40 ? 2.30 6.2 ? 5.8 1 1 ? ? 8?9?2 8 9(5)下结论。由于t ? 2.30 ? t 0.05,15 ? 2.13故否定原假设,即可以认为这两台仪器的测量有显著差别,其 置信度为95%。 如果两个子样的容量相等,即n1=n2=n0,可以得出t?? x1 ? x 2 ? ? ? ? 1 ? ? 2 ? ?n1 ? 1?S12 ? ?n2 ? 1?S 22 1n1 ? n2 ? 21 ? ? n1 n2?? x1 ? x 2 ? ? ? ? 1 ? ? 2 ?2 S12 ? S 2 n0 统计检验3) t 检验(两个子样的t 检验) 例: 有甲乙两为分析人员用同一分析方法测定某一样品中的CO2含 量,结果分别为: 甲 14.7 14.8 15.3 15.6 乙 14.5 14.8 15.0 15.3 试问甲乙二人的测定结果是否基本一致? 解: 本例用双边检验。假定两个子样均来自正态分布。 (1)建立假设 H 0 : ?1 ? ? 2 ; H a : ?1 ? ? 2 ; (2)指定显著水平α,本例取α=0.05; (3)检验的拒绝域为|t|&ta,f。当α=0.05,f =n1+n2-2=2n0-2=6时, 查附录B-2得 t0.05,6=2.45 (4)计算统计量t , 由原始数据得x 2 ? 14.901 x1 ? n1n1 1 2 2 ?x j ? x j ? ? 0.18 x j ? 15.10; S1 ? ? ? n1 ? 1 j ?1 j ?1 n12 S2 ? 0.11 统计检验3) t 检验(两个子样的t 检验) 由于n1=n2,可用两个子样容量相等的t 检验公式t?? x1 ? x2 ? ? ??1 ? ? 2 ?2 2 S1 ? S2 n0?15.10 ? 14.90 ? 0.74 0.18 ? 0.11 4(5)下结论。由于t ? 0.74 ? t 0.05,6 ? 2.45故接受原假设H0,即甲乙二人测定结果基本一致,其置信度为95%。 上述情况下,虽然两个人做的实验我们可以看成是一个人做了 (n1+n2)次的测试。 统计检验3) t 检验(两个子样的t 检验) 下面给出一个单边检验的例子。 例: 有两个不同处理技术来处理污水,设两个实验区,各为10个处 理,各处理的污水处理量相同,实验处理效果如下 甲区 62 65 57 60 63 58 57 60 60 58 乙区 56 59 56 57 58 57 60 55 57 55 试判断两种处理技术有无显著差异? 解: 根据要判断的问题,这里做单边检验比较合理,即检验甲区的处 理效果是否显著高于乙区。假定两个子样均来自正态分布。 (1)建立假设 H 0 : ?1 ? ?2 ; H a : ?1 ? ?2 ; (2)指定显著水平α=0.05; (3)检验的拒绝域为|t|&t2a,f。当α=0.05,f =n1+n2-2=10+10-2=18 ,2α=0.10时 查附录B-2得 t0.10,18=1.73 (4)计算统计量t , 由甲乙两个子样数据分别求得 统计检验3) t 检验(两个子样的t 检验)x ? 60.0 x 2 ? 57.0S12 ? 7.11 2 S2 ? 2.6760.0 ? 57.0 ? ? 3.03 7.11 ? 2.67 10计算t 值:t?? x1 ? x2 ? ? ??1 ? ? 2 ?2 2 S1 ? S2 n0(6)下结论。由于t ? 3.03 ? t 0.10,18 ? 1.73故否定原假设H0,接受择一假设,即两种技术处理效果差异显著,其 置信度为95%。 在t 检验的应用中,必须注意以下两点: 第一点, t 检验只适应于正态分布或接近正态分布的总体。在多数情况 下,正态假设是成立的。第二点, 对两个总体的均值进行t 检验时,两个总 体的方差被认为是相等的。 4) x 2 检验(卡方检验) 在用仪器测定某一量时,方差的大小反映了测定结果的精密度,是衡 量实验条件稳定性的一个重要标志;而在生产管理中,方差反映了生产 2 x 波动的程度,是衡量生产是否稳定的一个重要标志。下面介绍 检验 2 2 2 检验假设 H 0 : ? ? ? 0 ,其中 ? 0 为已知,这便用到卡方检验。检 验统计量为统计检验x ?21x 2 服从自由度f=n-1的 x 2 分布。卡方检验表如下H0 Ⅰ Ⅱ σ2=σ20 σ2=σ20 Ha σ2≠σ20 σ2>σ20 在显著性水平α下的拒绝域 χ2>χ2α/2,f 或χ2<χ2(1-α/2),f χ2>χ2α,f?2 ? ? n ? 1 S 2Ⅲσ2=σ20σ2<σ20χ2<χ2(1-α),f 4) x 2 检验(卡方检验) 例: 某钢铁厂的铁水含碳量,在正常情况下,服从正态分布,总体平均 数为4.55,总体方差为0.102。某一生产日抽测10炉铁水,测得含碳量 为: 4.53 4.66 4.55 4.50 4.48 4.62 4.42 4.57 4.54 4.58 试问这一天生产的铁水的含碳量总体方差是否正常? 解: 这是一双边检验问题 2 2 2 2 2 H : ? ? ? ? 0 . 10 ; H : ? ? ? (1)建立假设 0 0 a 0; (2)检验统计量为 x 2 ? 1 ?n ? 1?S 2 (3)指定显著性水平α,这里取α=0.10; (4)卡方服从自由度为f=n-1的卡方分布,检验的拒绝域为2 x 2 ? x? / 2, f2 2 x ? x 或 ?1 ? ? / 2 ? , f统计检验?2当f =10-1=9, α=0.10,α/2=0.05,1-α/2=0.95 查附录B-3, 得x2 ?1?? / 2 ?, f?x2 0.95 , 9? 3.3252 2 x? ? x / 2, f 0.05 , 9 ? 16.92 4) x 2 检验(卡方检验)10统计检验2 x (5)计算统计量 ,由原始数据得? x j ? 45.45,j ?12 x ? j ? 207 j ?110?n ? 1?S2? ? ?x j ? x ?n j ?12? 1 ? 2 ? 207 ? ? ??45.45? ? 0.0428 ? 10 ?21? ? ? ? x ? ? ? xj ? j ?1 n ? j ?1 ?n 2 j n2? 1 ? ?0.0428? ? 4.28 x ? 2 ?n ? 1?S ? ? 2 ? ? ? 0.10 ? 122 2 2 x ? x ? x (6)下结论。由于 3.25&4.28&16.92 即 ?1?? / 2 ?, f ? / 2, f故接受原假设,即不能认为方差有明显变化,换言之,方差是正常的。 4) x 2 检验(卡方检验)统计检验例:某厂生产的电池,其寿命服从方差σ20=5000(小时2)的正态分布。 现又生产一批这种电池,为检验其寿命的波动性,随即抽取26只电池, 测得样本方差S2=9200(小时2),试推断这批电池的寿命波动性是否比 以往明显增大?(取a=0.01) 解: 这是单边检验问题2 2 2 2 (1)建立假设 H0 : ? ? ? 0 ? 5000; Ha : ? ? ? 0 ; (2)检验统计量为 x 2 ? 1 ?n ? 1?S 2?2(3)卡方服从自由度为f=n-1的卡方分布,检验的拒绝域为:2( 26 ? 1) ? 9200 x ? ? ? 46 2 5000 ? 2 2 当f =26-1=25, α=0.01, 查附录B-3, 得 x? , f ? x0.01 , 25 ? 44.3142 (4)下结论。因为 x 2 ? 46.0 ? x 0 .01 , 25 ? 44.3 所以拒绝H0,接受H1,即认为电池的寿命波动性明显增大。( n ? 1) S 22 x 2 ? x? ,f 统计检验5)方差的置信区间 均值的区间估计问题已经讨论过,与此类似,下面讨论一下方差的区 间估计问题。 设容量为n的随机子样的标准差为S?1 n 2 ? ?x j ? x ? n ? 1 j ?1该子样来自正态分布总体,现在试用置信概率(1-α)×100%估计 2 2 2 总体方差σ2。 x ? ?n ? 1?S / ? 服从自由度f =n-1的卡方分布。由于2 P ?x ?21?? / 2 ?, f ? ?n ? 1?S 2 / ? 2 ? x? / 2, f ? ? 1 ? ?2 2? ? ?n ? 1?S ? ? ?n ? 1?S 2 P? 2 ?? ? 2 ? ? 1?? x ?1?? / 2 ?, f ? ? ? ? x? / 2 , f 统计检验5)方差的置信区间由此得到, 当总体参数μ、σ2未知时, 方差σ2置信概率为(1-α)×100%的置信区 2 2 间是 ?? a ?, 其中 ,? b2 ?a ??n ? 1?S 2x2 a / 2, f? ?2 b?n ? 1?S 2x ?21? a / 2 ?, f或总体标准差σ的置信区间是(σa,σb) 方差区间估计的具体步骤如下: (1)问题给出: 原始数据, 置信概率(1-α); 2 2 x (2)由α, 自由度f =n-1查附录B-3, 分别得 x? / 2 , f和 ?1? a / 2 ?, f的值; (3)计算子样方差S2; ? 2 2 ? 2 2 2 ? , ? a b ? 。 (4)求出 ? a , ? b 得总体方差 ? 的置信区间 ? ? ? 统计检验5)方差的置信区间 例: 测定某种溶液中的甲醛浓度, 取得4个独立测定值(%)为: 8.30, 8.35, 8.28, 8.33 试估计置信概率为90%时的总体方差和总 体标准差的置信区间。 解: 由1-a=0.90, 则a=0.10, a/2=0.05, f =n-1=4-1=3时, 查附录B-3得x2 0.05 , 3? 7.82,x2 0.95 , 3? 0.3522 ? ? ? ? n ? 1 S 4 ? 1??0.00097 2 ? ? ? ? 0.0083 b于是得到,置信概率为90% 的方差置信区间(0.0 2 2 S ? ? x j ? x ? 0.3),标准差置信区间 n ? 1 j ?1 (0.019, 0.091)。 2 ? ? ?4 ? 1??0.00097? n ? 1 S 2 ?a ? ? ? 0.00037 ? a ? 0.019 2 7.82 xa / 2, f 由原始数据求得??x2 ?1?? / 2 ?, f0.352? b ? 0.091 统计检验6) F检验 F检验又称方差比检验。它是用来比较二正态总体方差的差异程度 的。检验统计量为S F? S2 1 2 22 ( S12 ? S 2 )2 2 其中 S1 和 S2 分别为第一子样和第二子样的子样方差。F遵从第一 自由度 f =n1-1,第二自由度 f =n2-1的F分布。 对于F检验一般只作单边检验, 这是因为, 一般在编制F分布表(见附 录B-4)时,都是将大方差作为分子,小方差作为分母,因而由子样值计 算统计量F时,必须是将方差较大的定位为第一子样,方差较小的定位 为第二子样,此时必有F&1,这就要求建立的假设更明确一些,即2 H 0 : ? 12 ? ? 2 ;2 H a : ? 12 ? ? 2 ,2 2 S S 已知 1总是比 2 大 ,因此采用单边检验就更加合理。在显著水平α 下的拒绝域为 F ? Fa ,( f 1, f 2 ) 统计检验6) F检验 例: 测定某聚合物中Cl含量, 使用两种分析方法, 得如下数据 A B 27.5 27.9 27.0 26.5 27.3 27.2 27.6 26.3 27.8 27.0 27.4 27.3 26.8试问两种分析方法所得到的方差有无显著差别?解: 假定两个子样均来自正态分布, 检验二总体的方差差别,用F检验。 2 2 , H ? : ? 12 ? ? 2 ; (1)建立假设 H 0 : ? 12 ? ? 2 (2)指定显著水平α,这里取α=0.05; (3)检验统计量为S12 2 F ? 2 ( S12 ? S 2 ) S2 (4)计算统计量F值,由原始数据得2 SA ? 0.093, 2 SB ? 0.266由于 S B ? S A2 2 统计检验6) F检验 所以2 S12 ? S B ? 0.266, 2 2 S2 ? SA ? 0.093计算F得2 S12 S B 0.266 F? 2 ? 2 ? ? 2.86 S 2 S A 0.093(5)统计量F服从自由度 f1 =n1-1, f2=n2-1的F分布,由f 1 ? n1 ? 1 ? 8 ? 1 ? 7,(6)下结论。由于f 2 ? n2 ? 1 ? 4, ? ? 0.05查F分布表(附录B-4)得F0.05,(7,4)=6.09F ? 2.86 ? F0.05,( 7,4) ? 6.09故接受原假设,即这两种分析方法的方差无显著差别。 统计检验6) F 检验 例: 用老方法冶炼某种金属材料, 抽样测定冶炼产品中杂质含量(%) 数据为 2.69, 2.28, 2.57, 2.30, 2.23, 2.42, 2.61, 2.64, 2.72, 3.02, 2.45, 2.95, 2.51。而现在采用一种新的冶炼方法的测定数据为 2.26, 2.25, 2.06, 2.35, 2.43, 2.19, 2.06, 2.32, 2.34。试问新冶 炼方法得到的产品的杂质含量的变动性是否比老方法小? 解: 假设两个子样均来自正态分布。用F检验2 2 (1)建立假设 H 0 : ? 1 ? ? 2 , 2 H a : ? 12 ? ? 2 ;(2)给定显著性水平 α=0.05 (3)计算统计量F, 老,新冶炼方法得到产品杂质含量的方差分别为 0.058和0.016,所以S12 ? 0.058,2 S2 ? 0.016 统计检验6) F 检验S12 0.0586 F? 2 ? ? 3.57 S 2 0.0164由 f 1 ? 13 ? 1 ? 12, 查附录B-4, 得:f 2 ? 9 ? 1 ? 8, ? ? 0.05F0.05,(12,8) ? 3.28(5)下结论。因为F ? 3.57 ? F0.05,(12,8) ? 3.282 2 H : ? ? ? 故拒绝原假设, 接受 a 1 2,即在5%的显著性水平下,可以认为两种冶炼方法所得产品质量的变 动性是显著不同的。 新方法的变动性较小,生产情况比较稳定。 统计检验7)正态性检验 u检验,t 检验,x2检验,F 检验都是子样所代表的总体遵从或接近正态 分布,即作了正态假设。在多数情况下,我们可以根据经验,认为被检验 总体是服从或接近于服从正态分布的。但在有些场合,特别是在要求比 较严格的情况下,当不能确定总体是否遵从正态分布时,应用统计检验 的方法,检验随机变量分布的正态性。 常用的正态性检验的方法有: 正态概率纸法,偏度峰度法,x2检验法。 这里介绍x2检验法,其检验统计量为x ? ?2n?mj? Np j ?2j ?1Np j?(实际频数-理论频数)2 ? 理论频数N表示子样容量; n为N个数据所分的组数; mj为各组的次数; pj为 2 各区间的理论分布概率。x 2 总是近似服从自由度f =n-r-1的 x 分布, 其中r是被估计参数的个数。2 对于检验假设 H0: 实际频数=理论频数; 检验的拒绝域为 x 2 ? xa ,f 统计检验7)正态性检验 例: 下面是某钢厂60个转炉终点渣的氧化亚铁含量情况, 试检验它们 能否可信为一正态分布。20.0 21.8 19.1 11.3 15.3 18.2 13.8 24.9 19.8 26.9 14.5 16.823.5 19.4 16.3 13.7 17.1 17.7 19.3 15.6 19.4 15.7 13.9 22.116.3 19.2 19.4 10.9 13.5 20.7 20.5 15.1 14.9 22.6 17.8 16.4 18.2 19.3 12.0 15.7 14.0 13.8 13.1 16.1 16.3 17.1 22.3 11.9 15.7 18.1 19.0 20.1 16.9 17.1 23.7 20.5 15.6 17.2 23.1 19.1 解: (1)建立检验假设H0: 氧化亚铁含量的分布服从正态分布; (2)检验统计量为x ??2n?mj? Np j ?2j ?1Np j(3)指定显著性水平a=0.05 统计检验7)正态性检验 2 (4)计算统计量 x 的值 ①由于总体参数未知,故首先应求出其估计量,即求出子样平均值与 标准差,由原始数据得:x ? 17.655,S ? 3.46②把子样数据分成n个区间,使每个区间数据的个数m1≧5。因正态 分布的变量是连续变量,所以区间划分为: n组数: -∞~14.0 ~ 15.9 ~ 16.7 ~ 18.0 ~ 19.5 ~ 21.0~∞ m j各 组 9 5 8 12 6 9 的次数: 11 ③用标准正态分布表(附录B-1)求出各区间正态分布理论的分布概 率,由式 x ? ? x j ? 17.655u?现在以 x 代替μ,S代替σ,得本例的标准化公式??3.469uj ?xj ? x Sx j ? 17.655 xj等于14.0,15.9, ? 16.7???21.0 3.469 }

我要回帖

更多关于 试验设计李云雁答案 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信