NO.01
认证: 论文检测

掌柜:论文查重第一家

点击这里给我发消息

支付宝个人认证

2011-03-24

消费者保障协议

该店铺已签署消费者保障协议
已缴纳1000元保证金

店铺动态评分

描述相符5.0

服务态度5.0

物流服务5.0

与同行业相比

高于1.23%

持平0.45%

高于4.31%

开店时长5年老店

血糖检测中建模方法和温度引入的偶然相关研究

引 言 近红外光谱分析技术被誉为分析的巨人[1],广泛地应用在血糖检测中。但它作为一种间接的分析技术,必须借助化学计量学来建立校正模型,从而实现对未知样本的定量分析。也就是说,近红外光谱分析技术的有效性是基于所建校正模型的有效性。从统计学的角度来看,模型的质量好坏一般是考察所建立的回归曲线与数据趋势的拟合程度[2],通常用决定系数、相关系数、标准偏差、模型预测误差等描述[3]。但模型的有效性评价却相对比较困难,需要一些法则指导模型有效性的判断,如F-检验(F-Ratio)和QUIK(Qunderin-fluence of K,QUIK)法则[43和渐近Q法则[51等。在近红外光谱分析中,常用的建模方法包括多元线性回归(multivariatelinearregression,MLR)、主成分回归(prin-ciple component regression,PCR)和偏最小二乘法(partialleast square,PLS),这些回归方法均属于黑箱子的方法。在建立线性模型时,如果被测成分的浓度与光谱数据本身不具有显著的相关关系或者被测成分对光谱数据的变异贡献很小,但由于建模方法强大的信息提取功能或者测量中其他干扰的影响,如仪器漂移、实验设计不合理导致成分之间存在高度相关等等,都会导致建立的模型看起来很好,但实际上模型并非基于被测成分的光谱信息,而是基于某种偶然的因素,即发生了偶然相关。 Topliss等[63采用随机数模拟研究的方式来计算偶然相关的概率和F_检验,实验结果表明MLR模型产生偶然相关的概率远大于F_检验的结果。Rich—ard[7]用同样的方法对比研究了MLR算法和PLS算法,并指出PLS算法具有更高的预测精度。Liu等[8]考察了测量过程中仪器漂移等对模型偶然相关的影响及解决措施。此外,评价多变量模型的效果通常采取交互验证的方式,在数据量不太大或出于降低建模成本的角度,最普遍的做法是留一完全交互验证法(1eave-one-outcross-validation,LOO-CV),但近年来研究发现LOO-CV方法存在着一些缺陷[9'10]。Geisser『_”]提出采用留多交互验证法(1eave-multiple-out cross-validation,LMO-CV),也就是每次提取多个样本进行模型验证。目前已有一些文献对不同交互验证方法进行了对比研究[12,”],但关于它们对PLS模型引入偶然相关的评价能力优劣的研究还是空白。 本文主要通过引入模拟产生的随机数,考察了建模方法自身存在偶然相关的概率水平,重点研究建模样本数和波长数的选择以及交互验证时最优的样本挑选比例。最后,通过对葡萄糖水溶液的温度实验,研究温度对葡萄糖浓度检测的影响,指导在实际血糖检测中如何降低温度的影响。 1偶然相关的评价方法在MLR模型的评价中,决定系数(R2)表示在建模过程中模型能够解释的方差(ExplainedVariance)占光谱数据中总方差的比例,表示的是回归曲线对光谱数据的拟合程度,R2越大,表示拟合程度越高。如果被测成分物化性质与光谱数据之间不具有任何相关关系,则模型能够解释的任何方差都是偶然的,是建模过程中发生了偶然相关。因此可以采用Rz来评价MLR模型的偶然相关的程度。从原理上看,PLS和PCR在数据的提取方式上具有一定的相似性,都是基于成分提取的思路。本文主要讨论PLS模型中的偶然相关。PLS模型的效果通常通过交互验证的方法来确定,其决定系数Rb类似于MLR模型的R2,可以通过它来评价PLS模型的偶然相关的程度。 2建模方法引人偶然相关的研究 2.1实验方法对于建模方法本身导致的偶然相关,采用随机数的方式进行模拟研究。分别用均值为0.5、标准差为0.3的正态分布的随机数表示光谱数据和参考浓度。行对应于建模的样本,列对应于建模的波长。每一列数据都服从正态分布,每一组数据(光谱矩阵和参考浓度向量)的产生都是独立的。由5 10 15 20 25 30 35 40 45 50 55Numberofwavelength于浓度数据和光谱数据均为随机数据,在理论上它们之间不存在线性相关,此时模型计算出来的任何相关都是假的,是建模方法导致的偶然相关。在实验中,首先产生10000×10 000的随机数矩阵,然后从中截取符合实验设计大小的矩阵作为实验数据。经检测,通过这种方法产生的实验数据基本不存在线性相关的关系,能够满足实验的要求。 2.2 MLR模型中的偶然相关采用MLR建立校正模型时,由于参与建模的样本数必须大于参与建模的波长数,于是在此只考虑建模样本数固定为60的情况。按照实验方法重复产生10000组数据,对于每组数据,分别设定参与建模的波长数为5,10,15,20,25,30,35,40,45,50,55,计算R2。记录MLR模型取得不同水平的R2的概率和平均的R2,如图1所示。从图1可以看出,(1)当建模样本数固定为60时,R2>0.5和R2>0.8的概率都随着参与建模的波长数增加而增大;(2)R2的平均值同样也随着参与建模的波长数的增加而增加;(3)波长数分别增加到一定比例时,R2>o.5和R2>0.8的概率会急剧增大。这就表示建模波长数远小于建模样本数时,出现偶然相关的概率比较小。如果能接受的决定系数R2为0.8(即校正模型能够解释80%的光谱变异就认为模型的效果可以接受),若以90%的概率接受模型的显著性,则建模波长数必须小于40(样本数的66%),否则容易导致偶然相关的发生。 2.3 PLS模型中的偶然相关采用PLS建立校正模型时,从两方面考察:一是建模波长数固定时,参与建模的样本数对偶然相关的影响;二是建模样本数固定时,参与建模的波长数对偶然相关的影响。首先固定建模波长数为60,分别设定建模样本数为20,40,50,55,60,65,70,80,i00,120,150,200,300,按照实验方法产生数据,每次都重复产生10000组,汜录每个PLS模型的R邑v,并统计R8v大于0.25,0.3,0.4和0.5的概率及平均的值,如图2所示。由图2可以看出:(1)当建模样本数和波长数比较接近时,PLS模型会表现出较高的偶然相关;(2)当建模样本数小于波长数时,PLS模型出现偶然相关的概率随着样本数的增加而增大;(3)当建模样本数大于波长数时,PLS模型出现偶然相关的概率随着样本数的增加而降低,特别是当建模样本数远大于建模的波长数时,偶然相关几乎可以忽略。然后固定建模样本数为60,分别设定建模波长数为20,40,50,55,60,65,70,80,100,120,150,200,300,按照实验方法产生数据,每次都重复产生10000组,记录每个PLS模型的R&,并统计R&大于0.25,0.3,0.4和0.5的概率及平均的值,如图3所示。由图3可以看出:(1)当建模波长数和样本数比较接近的情况下,PLS表现出较高的偶然相关;(2)当建模波长数小于样本数时,PLS模型出现偶然相关的概率随着参与建模波长数增加而增大;(3)当建模波长数大于样本数时,PLS模型出现偶然相关的概率随着波长数的增加而降低,特别是当建模波长数远大于建模的样本数时,偶然相关几乎可以忽略。 2.4验证样本比例对P璐模型偶然相关的影响为了比较LMO-CV与LOO-CV对PLS模型偶然相关的影响,可在模型计算中改变每次参与验证的样本比例来实现。在模拟中,用随机数建立PLS模型,分别采用LOO-CV和LMO-CV对模型进行验证并计算胝,同样考察样本数固定和波长数固定两种情况。首先固定建模样本数为100,分别设定建模波长数为20,40,60,80,100,120,160,200,250,300,400,500,按照实验方法产生数据,每次都重复产生10000组,计算不同比例验证集的交互验证的胁,并统计磁。大于0.25的概率,结果如图4所示。然后固定建模波长数为100,分别设定建模样本数为20,40,60,80,100,120,160,200,250,300,400,500。按照实验方法产生数据,每次都重复产生10000组,计算不同比例验证集的交互验证的胝,并统计磁。大于0.25的概率,结果如图5所示。由图4可以看出:(1)随着参加验证的样本的比例增加,j氐大于0.25的概率峰值逐渐左移,也就意味着当建模波长数与样本数接近时,LMO-CV可以在一定程度上减少对模型的错误评价;(2)当建模波长数大于样本数时,参加验证的样本比例越大,PLS模型出现偶然相关的概率越小。o loo 200 300 400500NumberofwavelengthFig.4Different methodsofcn螂validation whilethe numberofsamplesis fixed andthe numberofwavelengthsisvariable由图5可以看出:(1)随着参加验证的样本的比例增加,j吼大于0.25的概率峰值逐渐右移,这同样意味着当建模样本数与波长数数接近时,LMO-CV可以在一定程度上减少对模型的错误评价;(2)当建模样本数大于波长数时,参加验证的样本比例越大,PLS模型出现偶然相关的概率越大。勰拍M控加堪Mmc;nc;mc;m0L篮g苫987654321)OOO0O0nnn古葛D日D2山丝拍M控撕捕=2OO0O仉On0。冒g苫987654321)OOOO0OOOn窘_l一言D2厶98765432l,OOO0OOOOO扫专。日D2山万方数据第4期 光谱学与光谱分析 9370 100 200 300 400 500NumberofwavelengthFig.5Differentmethodsofcross validation whilethe numberofwavelengthsisfixed andthe numberofsamplesisvariable 3温度引入偶然相关的研究除了建模方法导致的偶然相关外,所测量的近红外光谱信号中也存在各种潜在的偶然相关因素,在本节中主要通过实验分析温度与葡萄糖浓度之间的偶然相关。首先配制5个浓度分别为100,200,300,400和500mg·dLl的葡萄糖溶液。仪器采用本课题组自主研制的检测系统,它是在声光可调谐滤波器(acoustooptictumble filter,AOTF)分光系统基础上构建的。测量的波数范围是1740l 240nIn。实验分三组进行。(1)温度固定不变(30℃),记录不同浓度葡萄糖溶液的吸收光谱;(2)温度与葡萄糖浓度线性相关(30℃一100mg·dL,32℃一200mg·dL,34℃一300 mg·dL~,36℃一400mg·dL,38℃一500 mg·dLl),在相应温度下记录不同浓度葡萄糖溶液的吸收光谱。(3)温度与葡萄糖浓度不相关(38。C-100mg·dL~,36℃一200rng·dL,36℃一300mg·dL1,32℃-400nag·dL1,36℃-500mg·dL一1,此References[1][2]结果通过随机配对得到),在相应温度下记录不同浓度葡萄糖溶液的吸收光谱。将三种情况下测得的光谱数据,分别建立PLS模型,用模型的预测均方根误差(RMsEP)和决定系数(磁v)来表征模型的有效性,结果如表1所示。Table1 Result ofPLsmodelin the three cases由表1可以看出(1)温度与葡萄糖浓度线性相关时,建立的PI,S模型的RMSEP值最小且R&值最大,故其有效性最好;(2)温度与葡萄糖浓度不相关时,建立的PLS模型的RMSEP值最大且R&值最小,故其有效性最差;(3)温度固定不变时,建立的PLS模型的RMSEP值和磁v值均居于前两者之间,故其有效性也在前两者之间。这意味着在不能保证温度与血糖浓度线性无关时,使温度固定不变是最好的选择。 4结论 用MLR方法建立模型时,不能对光谱噪声进行有效辨别,简单地认为光谱数据与浓度向量之问都存在相关,当更多的信息加入到模型中时,偶然相关会随之增加。PLS方法在建模过程中反复地提取成分,成分提取的每一步都会试图关联浓度向量,所以PLS模型出现偶然相关的概率远小于MI。R模型,并且在样本数与波长数差异较大时呈现出较低的偶然相关概率。当PLS建模波长数小于样本数时,LCK)-CV对模型有着更稳健的评价能力;反之当波长数大于或接近样本数时,LM旺CV对模型有着更稳健的评价能力。在实际血糖检测中,温度固定不变是最优的测量条件

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

论文查重:

论文检测,论文查重第一家,是一家以检测抄袭与剽窃、伪造、篡改、不当署名、一稿多投等学术不端文献的论文检测平台,目前主要推荐的知名、权威检测产品包括中国知网的AMLC系统、VIP、TMLC2系统,万方数据库的万方相似比检测系统,维普文检测系统、gaperpass检测系统,等等常见检测软件

推荐软件知网期刊检测AMLC 知网本科检测 知网硕博检测 万方论文相似比检测 维普论文检测

检测须知:

1.此系统一旦提交,开始检测后,概不退款!2.在淘宝中购买宝贝后,可以在“我已购买宝贝”中看到有“订单编号”,知网系统检测需要输入订单编号才能使用。3.Word文档大小请不要超过15MB ,否则将无法上传;请把不必要的图片删除即可(系统不检测图片);4.上传检测的文档格式为Word的docx,doc格式,请勿上传其他格式的文档。

检测入口返回顶部
知网期刊检测
知网本科检测
知网硕博检测
万方论文检测
维普论文检测
paperpass
返回顶部