2.2 提高分析结果准确度的方法(自学)2.3 有效数字及其运算规则
2.4 有限量测量数据的统计处理2.5 相关分析和回归分析(自学)§2.1 测量值的准确度和精密度
误差(Error) : 测量值与真值之差。➢真值T (True value)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:1、理论真值(如化合物的理论组成)(如,NaCl中Cl的含量)2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精度的测量值)(例如,标准样品的标准值)误差分类•系统误差(Systematicerror)—某种固定的因素造成的误差方法误差、仪器误差、试剂误差、操作误差•随机误差(Randomerror)—不定的因素造成的误差仪器误差、操作误差系统误差与随机误差的比较项目产生原因系统误差随机误差固定因素,有时不存在不定因素,总是存在方法误差、仪器与试剂环境的变化因素、主误差、主观误差观的变化因素等重现性、单向性(或周服从概率统计规律、期性)、可测性不可测性准确度校正精密度增加测定的次数分类性质影响消除或减小的方法系统误差的校正•方法系统误差——方法校正•主观系统误差——对照实验校正(外检)•仪器系统误差——对照实验校正•试剂系统误差——空白实验校正如何判断是否存在系统误差?误差的表示:绝对误差Ea= x –xT误差越小,分析结果越接近真实值,准确度也越高x<xT为负误差,说明测定结果偏低x >xT为正误差,说明测定结果偏高相对误差Eax -xTEr= ——= ————xTxT常用%表示平均值对一B 物质客观存在量为T 的分析对象进行分析,得到n个个别测定值x1、x2、x3、••• xn,对n 个测定值进行平均,得到测定结果的平均值,那么:个别测定的误差为:测定结果的绝对误差为:测定结果的相对误差为:xiTEaxTEaEr100%T偏差与偏差的表示:偏差(deviation): 单次测量值与测量平均值之差。偏差的表示有:绝对偏差di平均偏差d极差R标准偏差S相对标准偏差(变异系数)CV设n次测定结果为:x1、x2、……xn,算术平均值为x1x2xn1xxinni1绝对偏差di是个别测定值xi与算术平均值之差ndixix相对偏差dr:(有正、负)drdix(有正、负;常用%)平均偏差d: dd1d2dnni1ndin相对平均偏差dr:ddr=x平均偏差和相对平均偏差:用来表示一组测定值的离散趋势。一组数据越分散,平均偏差和相对平均偏差越大,精密度越低.平均偏差和相对平均偏差可衡量精密度高低,但有时不能充分反映测定结果的精密度,引入标准偏差。标准偏差S标准偏差也称均方根偏差,它和相对标准偏差是用统计方法处理分析数据的结果,二者均可反映一组平行测定数据的精密度。标准偏差越小,精密度越高。对有限测定次数(n<20)S(xi1nix)2n1di1n2in1n-1称为自由度,以f 表示,表示变化的偏差数目相对标准偏差:(变异系数) SCV100%x准确度与精密度➢准确度Accuracy 准确度表征测量值与真实值的符合程度。准确度用误差表示。➢精密度Precision精密度表征平行测量值的相互符合程度。精密度用偏差表示。•准确度与精密度的关系例:A、B、C、D 四个分析工作者对同一铁标样(WFe= 37.40%) 中的铁含量进行测量,得结果如图示,比较其准确度与精密度。DCBA表观准确度高,精密度低(不可靠)准确度高,精密度高准确度低,精密度高准确度低,精密度低36.00 36.50 37.00 37.50 38.00测量点平均值真值准确度与精密度的关系•结论:1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。误差的传递2.2 有效数字及其运算规则1.有效数字定义定义:在实验中仪器能测得的有实际意义的数字。组成:由准确数字加一位欠准确数字组成。如0.3628g:0.3627g—0.3629g之间,8是估计值特点:不仅表示数值的大小,而且反映测量仪器的精密程度以及数字的可靠程度。如◎用万分之一分析天平称取试样质量1.3056g,为5位有效数字,用滴定管量取体积应记录为28.07mL,有效数字四位,而相同体积改用50mL量筒量取,记为28mL,有效数字2位。称量分析天平台秤移液管滴定管容量瓶50mL量筒记录1.0000g1.0g误差真实值0.9999—1.0001g0.9—1.1g1g1g0.0001g0.1g0.01mL1mL25mL25.00mL25mL25mL24.99—25.01mL24—26mL2.有效数字位数(1)仪器能测定的数据、非零数字都是有效数字;(2)数字“0”具有双重意义,若作为普通数字使用为有效数字,如1.3060中“0”是有效数字;若起定位作用,则不是有效数字,如0.0010,可写为1.0×10-3,前面3个“0”起定位作用,不是有效数字,最后一个“0”是有效数字;①“0”在所有非零数字之前时,“0”只起定位作用,如0.001202是四位有效数字。②当“0”位于非零数字之间时是有效数字,“0”要计位,如1.008,四位有效数字。③当“0”位于所有非零数字之后,一般是有效数字,“0”要计位,如1.00计3位。(3)整数末尾为“0”的数字,应该在记录数据时根据测量精度写成指数形式,如3600,应根据测量精度分别记为3.600×103(4位),3.60×103(3位),3.6×103(2位);(4)对于pH、pM、lgKθ等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,因为其整数部分只代表该数的方次。例如pH=11.20,换算为H+浓度应为c(H+)=6.3×10-12mol·L-1,(不是-12-1θθ6.309×10mol·L);logK=10.69,K=4.9×1010,有效数字为两位,不是四位;(5)遇到倍数、分数关系和常数,由于不是测量所得的,可视为无限多位有效数字;如式量、原子量M(H2SO4)=98,R等。(6)有效数字位数不因换算单位而改变。如101kg,不应写成101000g,而应写为101×103g或1.01×105g。1.30602.0000.002811.516.57532.96%4.38×10-90.00105位(有效数字位数)4位3位2位0.0636005×1051001位位数含糊例题下列数字是几位有效数字?3.2050×104 0.002810 12.96%
54lgK=11.61
242500位数含糊pH=1.20
23.有效数字的修约规则“四舍六入五成双”;将下列数字修约为两位3.2493.2“四舍”8.3618.4“六入”6.5506.6“五成双”6.2506.2“五成双”6.25016.3“五后有数需进位”只可保留最后一位欠准确数字;一次修约例将5.5491修约为2位有效数字。修约为5.5。√修约为5.549~5.55~5.6×偏差的修约:只进不舍运算中多保留一位有效数字例将下列数字修约为4位有效数字。3.1124 3.1126 3.1115 3.1125 3.112513.1123.1133.1123.1123.113另外,“0”以偶数论。3.11053.110
4.有效数字运算规则(*先修约后计算)(1)加减法几个数据相加或相减时,它们的和或差的有效数字的保留,应以小数点后位数最少的数据为根据(即取决于绝对误差最大的那个数据)。3.72+10.6355=?3 .7 2 + 1 0 . 6 361 4 . 3 56 ——14.36(2)乘除法几个数据相乘除,所得结果的有效数字的位数取决于各数中有效数字位数最少(相对误差最大)的那个数据。0.14×15.2525 =?运算中还应注意:①分析化学计算经常会遇到分数、倍数、常数(如R、2.303等)、相对原子质量、相对分子质量等,其有效数字位数可认为无,取值应与题意相适应,即在计算过程中不能根据它们来确定计算结果的有效数字的位数。②对数尾数的有效数字位数应与真数的有效数字位数相同,在有关对数和反对数的运算中应加以注意。例如:log339=2.530,而不应是2.53。③在重量分析和滴定分析中,一般要求有四位有效数字;各种分析方法测量的数据不足四位有效数据时,应按最少的有效数字位数保留。④有关化学平衡的计算(如平衡状态某离子的浓度等),一般保留二或三位有效数字。⑤表示偏差和误差时,通常取1-2位有效数字即可。2.3 测量结果的表述方法:一些概念:
•总体、样本、样本容量•平均值•标准偏差•平均偏差•平均值的标准偏差注意总体与样本的区别
例测定某亚铁盐中铁的质量分数(%)分别为38.04,38.02,37.86,38.18,37.93。计算平均值、平均偏差、相对平均偏差、标准偏差、相对标准偏差。解:x =1/5(38.04+38.02+37.86+38.18+37.93)%=38.01%d1=38.04%-38.01%=0.03%;…….d5=37.93%-38.01%=-0.08%;d =1/5(|0.03|%+|0.01|%+|-0.15|%+|0.17|%+|-0.08|%)= 0.09%0.09%dr×100%=0.24%38.01%(0.03%)(0.01%)(0.15%)(0.17%)(0.08%)S510.12%22222S0.12%变异系数CV100%100%0.32%38.01%x极差:R=38.18%-37.86%=0.32%误差的计算一般保持1~2位有效数字
2.4 有限测量数据的统计处理
No123分组15.8415.8715.90频数频率(ni)(ni/n)1130.0050.0050.015频率密度(ni/ns)0.170.170.51理工大学生科院的学生对海水中的卤素进行测定,得到x16.01g/L45615.9315.9615.99818340.0400.0910.1721.353.035.72n198s0.047g/L74.24%88.38%71011121316.0216.0616.0916.1216.1516.1816.21554020115200.2780.2020.1010.0560.0250.0100.0009.266.733.371.850.840.340.00数据集中与分散的趋势随机误差的正态分布
•因测量过程中存在随机误差,使测量数据具有分散的特性,但仍具有一定的规律性:具有一定的集中趋势。分散——测量时误差的不可避免,正误差和负误差出现的概率相等。集中——大误差少而小误差多¤标准正态分布曲线是以总体平均值μ为原点,标准偏差σ为横座标单位的曲线。
测量值与随机误差的正态分布测量值正态分布N (,2)的概率密度函数1yf(x)e22=0.023x2总体标准偏差,表示22无限次测量分散的程度。注意总体与样本的区别
25.0 概率密度20.0 15.0 10.0 5.0 0.0 15.8015.85y概率密度个别测量值1=0.04715.9015.9516.0016.0516.1016.1516.20xx-随机误差0 x-x测量值的正态分布随机误差的正态分布1yf(x)e20.400.300.200.100.00-3-2-1(x)222总体平均值,表示无限次测量值集中的趋势。总体标准偏差,表示无限次测量分散的程度。y概率密度x个别测量值x-随机误差(x)uy68.3%95.5%99.7%z0123置信水平•由图可得:
¤x = (即误差为零)时Y值最大。说明大多数测量值集中在算术平均值附近,或曰算术平均值是最可信赖值。¤X值趋于+或—(即x与差很大)时,曲线以X轴为渐近线,说明小误差出现的概率大而大误差出现的概率小。¤曲线以x = 的直线呈轴对称分布,即正、负误差出现概率相等。¤值越大,测量值的分布越分散;越小,测量值越集中,曲线越尖锐。
标准正态(u)分布曲线有限次测量中随机误差的t 分布无限多次测定才有总体平均值μ和总体标准偏差σ,而实际测定为有限次测定,μ与σ不知道,只能用有限次测定的平均值x及标准偏差S来估计数据的离散情况;而用S代替σ会引起误差。解决:英国化学家高塞特提出用校正系数t来代替u做补偿。xtsxtst值呈正态分布,且由统计学计算得出,可查表f(t)
f=n-1自由度f(t):概率密度平均值的标准偏差与测定次数的关系t分布曲线校正系数t与置信水平和自由度f 有关。置信水平p:测定值在置信区间内出现的概率(也称置信度、置信水平、可信度)。一般分析化学选xts90%或95%。*显著性水平a=1-P(测定值在置信区间外出现的概率)校正系数t与自由度有关,f = n-1,测定次数越多,t↓,n→∞,t 分布曲线为正态分布曲线。ta,f: 如t0.05,10平均值的精密度和置信区间
平均值的精密度
sxsxn对于有限次测量:xtSnxtSn置信区间:在一定置信度下,以测定结果x为中心的、包括总体平均值μ在内的可靠性范围。tStSx~xnn结论:(1)由上式,根据平均值x、查t可求出μ可能存在的范围即置信区间。置信区间越小,x和μ越接近,算术平均值的可靠性就越大。(2)测定次数越多、精密度越高、S越小,置信区间越小。(3)t越小,置信区间越小。例某铵盐含氮量的测定结果为x=21.30%; S=0.06%;n=4。求置信水平分别为95%和99%时平均值的置信区间。若测10次(设x、S不变),置信概率为99%时平均值的置信区间为多少?结果说明什么?解:当n=4, ƒ=3,P=95%时,查表,t=3.18,所以21.30%3.180.06%4(21.300.10)%当n=4,P=99%时,查表,t 0.01, 3=5.8421.30%5.840.06%4(21.300.18)%当n=10,P=99%时,查表,t 0.01, 9=3.253.250.06%21.30%(21.300.06)%10结果1.n=4有95%的把握认为,铵盐的含氮量在21.20~21.40%2.n=4有99%的把握认为,铵盐的含氮量在21.12~21.48%(P增大、可靠程度增加,但置信区间变大)3.n=10有99%的把握认为,铵盐的含氮量在21.24~21.36%(n增大,置信区间减小)注意: 结果说明(1)置信概率p的高低反映测定值的可靠程度。置信度越高,估计的把握程度越大。但:置信概率并非越高越好! 因为p增大→ t增大→置信区间增大,这样虽然估计的把握程度增大,但分析结果的准确程度降低; 100%置信概率就意味着置信区间无限大,肯定会包含总体平均值,但这样的置信区间毫无意义。置信概率也不可太低!因为虽然p减小会使置信区间减小,但测定值的可靠程度降低.——不可靠的高精度同样无意义!(置信概率p一般选90%~95%)(2)置信区间的大小反映测定值的精度。相同置信概率时,n大,置信区间减小,分析结果的精度将提高。(3)比较多个测定值的准确程度,应在同一置信概率下进行。否则没有可比性。*甲有90%把握估计其考试成绩及格60~100分,(p大,置信区间增大)只有50%把握估计其考试成绩在90~100分,(p小,置信区间虽小但不可靠)测定结果离群值的取舍•在一组平行测定的数据中,有时会有个别数据偏离其他数据较远,这些偏离较远的数据称为可疑值(或异常值、离群值)•可疑值不能随意舍弃!可疑值的取舍影响分析结果,必须用统计方法进行检验,决定取舍。常用4d法、Q检验法及Grubb法决定可疑值的取舍。Q 检验法(适于测定次数3~10次)步骤(1)将测定值由小到大排列,求极差R:x1x2…… xn R= xn-x1(2)求可疑数据与相邻数据之差:x可疑-x相邻(3)计算舍弃商Q计:Q计x可疑x相邻Rx可疑x相邻xnx1(4)根据测定次数和要求的置信度查Q表:(表17-2)测定次数n 置信概率p(置信度) 0.90 0.95 0.94 1.53 0.76 0. 0.56 1.05 0.86 0.76 0.51 0.47 0.44 0.69 0. 0.60 0.41 0.58 3 4 5 计算结果的可信程度6 7 8 9 (5)将Q计与Q表(如Q90)相比,若Q计≥Q表,则舍弃可疑值;若Q计 排列数据:0.1040, 0.1041, 0.1042, 0.1043, 0.1048R=0.1048-0.1040=0.0008查表,当n=5,p=90%时, Q0.90=0.0.10480.1043Q计0.62< Q表(0.)0.0008所以0.1048应予保留。(3)若再增测一次0.1042,再判断0.1048是否舍弃:Q计仍为0.62;查表,当n=6p=90%时,Q0.90=0.56;Q计=0.62>Q0.90=0.56,那么0.1048应舍弃。(3)舍弃了0.1048后,测定次数为5次,新序列中0.1043和0.1040是否还能保留,还应再进行判断。排列数据:0.1040, 0.1041, 0.1042, 0.1042, 0.1043, R=0.1043-0.1040=0.0003查表, 当n=5, p=90%时, Q0.90=0.; 对0.10400.10400.1041Q计0.33< Q表(0.)0.0003所以0.1040应予保留。同理, 对0.10430.10430.1042Q计0.33< Q表(0.)0.0003所以0.1043也应保留;可用这5数计算平均值:(0.10400.10410.10420.10420.1043)x0.10425结论:当Q计与Q表比较接近时,最好多测一次以决定取舍;当最大值、最小值均可疑时,需分别计算而定;舍去某可疑值后应继续检验,至无可疑值为止。显著性检验Significant Test (1)对含量真值为T 的某物质进行分析,得到平均值但xT0xx1,x2(2)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值但x1x20显著性检验问题:是由随机误差引起,或存在系统误差?xT0x1x20显著性检验系统误差显著性差异校正非显著性差异随机误差正常1、F 检验法检验两组实验数据的精密度S1和S2之间有无显著差异:2FFs大表计算查表F计算2s小精密度无显著差异。2、t检验确定两组平均值之间有无显著性差异x1x2t计算sp3、查表4、比较表n1n2n1n2asp2(n11)s12(n21)s2n1n2212tt(f),t计算t表fnn2非显著差异,无系统误差有限数据的统计处理总体500g样本甲乙丙有限数据的处理:样本容量平行测定3 次平行测定4 次平行测定4 次平均值x1x2x3x1,x2,x3...x1,x2,x3...计算x估计显著性检验没有系统误差,= T有系统误差,T总结:分析结果的数据处理与报告在定量分析中,应在无系统误差条件下:➢尽量多次平行测定➢按有效数字记录结果➢对多次平行测定结果检查有无可疑值并处理➢求平均值、平均偏差、标准偏差、变异系数➢置信区间➢报告分析结果。作业:P34,8,9,10 查表,当n=5,p=90%时,Q0.90=0.0.10400.1041Q计0.12< Q表(0.)0.0008所以(n=5) 0.1040应予保留。(2)再判断0.1048是否舍弃:
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- gamedaodao.com 版权所有 湘ICP备2022005869号-6
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务