目录

1、光谱简介

2、化学计量学简介

3、光谱数据处理流程(以拉曼光谱为例)

4、数据预处理

4.1 归一化

4.2 滤波

4.3基线校正

5、特征量提取

6、建立数学模型(回归)


1、光谱简介

光是一种由各种波长(或频率)的电磁波叠加起来的电磁辐射。光谱借助光栅、棱镜、傅里叶变换等分光手段将一束电磁辐射的某项性质解析成辐射的各个组成波长对此性质贡献的图表。

2、化学计量学简介

化学计量学是综合运用计算机科学、数学和统计学等相关学科,寻找最佳方法优化化学测量过程,并从测量数据中最大限度地提取有用信息。将化学计量学与分子光谱相结合,最大限度地提取光谱数据中的有用信息,建立对分析组分性质高效、可靠的分析检测模型。

3、光谱数据处理流程(以拉曼光谱为例)

拉曼光谱用于定量分析的处理流程如下:

对于一个测量系统来说,算法的流程分为两条线路,一条是提取已知的样品(校准品)的特征量,然后通过回归算法在特征量与浓度之间建立一个数学模型,一条是提取被测样品的特征量,然后再代入数学模型中计算得到被测样品的浓度值。

从上述的流程中可以将光谱算法分为三大块:数据预处理、特征量提取、建立数学模型。常见的算法整理如下:

4、数据预处理

4.1 归一化

原因:不同条件下采集到的光谱数据往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果

方法:采用归一化的算法使数据被限定在一定的范围内比如[0,1]或者[-1,1]),从而让不同浓度的光谱数据具有可比性。常用的归一化算法有以下两种:

(1)min-max标准化(Min-Max Normalization)(线性函数归一化)
本质:把数变为【0,1】之间的小数。
转换函数:(X-Min)/(Max-Min)
其中,X为原始数据,Min所有样本数据的最小值,Max为所有样本数据的最大值。

(2)0均值标准化(Z-score standardization)
本质:把有量纲表达式变成无量纲表达式。
转换函数:(X-Mean)/SD
其中,Mean为所有样本数据的均值。SD为所有样本数据的标准差。

序号

归一化方法

应用场景

缺点

1

Min-Max Normalization

不涉及距离度量、协方差计算、数据不符合正太分布的时候

(1)当有新数据加入时,会导致min(x)和max(x)的变化,需要重新定义;

(2)存在极端的最大值或者最小值。

2

z—score 标准化

1、在分类、聚类算法中,需要使用距离来度量相似性的时候;

2、使用PCA技术进行降维的时候;

3、数据服从正态分布

/

4.2 滤波

原因:光谱数据中存在随机噪声(光源噪声、CCD噪声、暗电流等),同样会影响后续的数据分析结果。
方法:采用数字滤波算法滤除随机噪声,提高信噪比。常用的滤波算法有滑动中值滤波、滑动均值滤波、滑动多项式滤波(Savitzky-Golay滤波 )等

(1)滑动中值滤波
原理:采用一个窗口沿着光谱向量平移,逐一求取窗口内元素的中值,替代原始光谱中窗口中心位置处的元素,即可得到降噪的光谱。
MATLAB代码:
yy=medfilt1(y,framelen)
Yy为输出,y为输入,framelen为窗口长度;

(2)滑动均值滤波
原理:采用一个窗口沿着光谱向量平移,逐一求取窗口内元素的均值,替代原始光谱中窗口中心位置处的元素,即可得到降噪的光谱。
MATLAB代码:
yy=smooth(y,span);    
%span为奇数,表示窗宽,比如span=2,则窗口长度为5;

(3)滑动多项式滤波(S-G滤波)
原理:通过一个移动窗口,对窗口内部元素做多项式最小二乘拟合,得到窗口中 心位置处元素平滑后的值。
MATLAB代码:
yy = sgolayfilt(y,order,framelen)
% order为多项式阶数,framelen为窗口长度。

滤波效果:

4.3基线校正

原因:荧光背景、样品及周围环境的黑体辐射等影响,导致光谱的基线产生,其表现为缓慢变化曲线,直接对后续的数据分析产生影响。因此需要在后续处理之前将谱线中的基线消除。

常用的基线校正算法有分段线性拟合法、局部极值中值法、多项式拟合法。本文主要介绍多项式拟合法。多项式拟合的实现流程如下:

分三步:

① 峰值消除;
② 多项式拟合逼近基线,得到基线;
③ 减去基线,得到基线校正后的光谱数据。

其中,拟合残差计算公式如下:

式中O(x)为原始光谱,P(x)为拟合光谱,DEV为残差。

残差判断条件如下:
If i=1,判断条件为abs(DEV1-DEV)/DEV1<0.05;
else,判断条件为abs(DEVi-DEVi-1)/DEVi<0.05;

MATLAB代码:

x=[];%拉曼位移
y=[];%原始光谱
n=5;%多项式阶数
[p0,s0,mu0]=polyfit(x,y,n);%多项式拟合
y_fit0=polyval(p0,x,[],mu0);%计算拟合值
r0=y-y_fit0;
dev0=sqrt(sum((r0-mean(r0)).^2)/length(r0));%计算残差
y_remove0=y(find(y<=y_fit0));%峰值消除
x_remove0=x(find(y<=y_fit0));%峰值消除
i=1;
judge=1;
while(judge)
p1,s1,mu1]=polyfit(x_remove0,y_remove0,n);%多项式拟合
y_fit1=polyval(p1,x_remove0,[],mu1);%计算拟合值
r1=y_remove0-y_fit1;
dev(i)=sqrt(sum((r1-mean(r1)).^2)/length(r1));%计算残差
if i==1judge=abs(dev(i)-dev0)/dev(i)>0.05;
elsejudge=abs((dev(i)-dev(i-1))/dev(i))>0.05;%残差判断条件
end
index=find(y_remove0<=y_fit1);
y_remove0(index)=y_fit1(index);%光谱重建,大于拟合值的数据用拟合值代替,小于拟合值的数组采用原始数据
i=i+1
end
y_baseline=polyval(p1,x,[],mu1);%基线
y_baseline_correction=y-y_baseline;%基线校正后
figure(1)
h=plot(x,y,'k',x,y_baseline,'r',x,y_baseline_correction,'b')
set(h,'Linewidth',2,'Markersize',2)%设置线宽和点的大小
title('基线校正效果','fontsize',20)%图形标题
xlabel('波数','fontsize',15)%x轴名称
ylabel('幅值','fontsize',15)%y轴名称
grid on %打开网格线
egend('原始光谱','基线','基线校正后的光谱')%添加图例
axis tight

基线校正效果:

5、特征量提取

为了提取和浓度有一定函数关系的特征量,最常用的是谱线的峰值或者谱线与坐标轴所夹的面积差。

6、建立数学模型(回归)

求解得到特征量与浓度值的函数关系式,一般采用回归的方式。

MATLAB代码:

PCR:【建模应用】PCA主成分分析原理详解 - pigcv - 博客园

PLS:【建模应用】PLS偏最小二乘回归原理与应用 - pigcv - 博客园

光谱数据处理及定量分析相关推荐

  1. pandas Excel 光谱数据处理

    pandas Excel 光谱数据处理 在化学专业的学习中常常会使用到光谱分析,但是这种资料难以寻找,通常要进行手动绘制.通过查找数据库的源码,可以获取此数据,本文是使用pandas对此数据进行处理, ...

  2. 转载]ASD光谱仪测量地物光谱的数据处理方法及遇到的问题【转】

    一.利用ASD光谱仪测量地物光谱的数据处理方法 1.安装ASD光谱仪配套的光谱数据处理软件ViewSpecPro: 2.将ASD光谱仪配套笔记本电脑上面的光谱数据文件拷贝到本地硬盘: 3.打开View ...

  3. 提高数据处理速度_气相色谱仪用数据处理

    我们知道由于色谱法本身的特点,决定了它的分析数据后处理过程的复杂性,所以分析结果的可用性很大程度上与数据处理装置的可靠性和数据处理的好坏有关.过去常说,色谱仪的设计制造心脏部分是检测器,色谱分析工作者 ...

  4. iMeta | 俄亥俄州立大学郑庆飞组发表多组学方法研究肿瘤微生物组综述

    点击蓝字 关注我们 多组学方法在肿瘤微生物组研究中的应用 原文链接DOI: https://doi.org/10.1002/imt2.73 综  述 ● 2023年1月9日,俄亥俄州立大学郑庆飞团队在 ...

  5. 神经网络应用现状分析,神经网络应用现状调查

    神经网络研究现状 光谱分析因其能够灵敏.高精度.无破坏.快速地检测物质的化学成分和相对含量而广泛应用于分析化学.生物化学与分子生物学.农业.医学等领域. 目前,光谱分析技术日趋成熟,引入光谱分析理论的 ...

  6. 神经网络的图像识别技术,神经网络图像角度分析

    如何通过人工神经网络实现图像识别 人工神经网络(Artificial Neural Networks)(简称ANN)系统从20 世纪40 年代末诞生至今仅短短半个多世纪,但由于他具有信息的分布存储.并 ...

  7. 神经网络图怎么分析,画神经网络结构图

    神经网络Hopfield模型 一.Hopfield模型概述1982年,美国加州工学院J.Hopfield发表一篇对人工神经网络研究颇有影响的论文.他提出了一种具有相互连接的反馈型人工神经网络模型--H ...

  8. 神经网络现状综述,神经网络现状分析

    bp神经网络研究现状 BP网络的误差逆传播算法因有中间隐含层和相应的学习规则,使得它具有很强的非线性映射能力,而且网络的中间层数.各层神经元个数及网络的学习系数等参数可以根据实际情况设定,有很大的灵活 ...

  9. 一种基于后间隔偏最小二乘的梯度下降助力谱建模方法

    一种基于后间隔偏最小二乘的梯度下降助力谱建模方法 外文链接:https://pan.baidu.com/s/1MU_e2GCz7vDq0_z1dkFq6Q 摘要 升压回归技术应用在近红外光谱,全光谱的 ...

  10. 神经网络研究现状分析,神经网络研究现状论文

    1.神经网络研究现状 光谱分析因其能够灵敏.高精度.无破坏.快速地检测物质的化学成分和相对含量而广泛应用于分析化学.生物化学与分子生物学.农业.医学等领域.目前,光谱分析技术日趋成熟,引入光谱分析理论 ...

最新文章

  1. Django报错:mysql ImproperlyConfigured: mysqlclient 1.3.13 or newer is required, you have 0.9.3的解决办法
  2. 微信小程序textArea组件字数限制
  3. facenet 中心损失函数(center loss)详解(代码分析)含tf.gather() 和 tf.scatter_sub()函数
  4. ubuntu要更新18.04了,lei了lei了~~~
  5. ad采样做按键开关_电池应用中的电流采样电阻设计
  6. sqlachemy入门基础手册
  7. 汉语拼音/pinyin4j
  8. 专业的raw图像处理编辑工具Capture One Pro 22 for Mac
  9. Java 异常处理 之 运行期异常
  10. Dell R410 BIOS 升级方法
  11. 360腾讯计算机比赛,巅峰对决 腾讯电脑管家VS360详尽评测
  12. 【题解】P2627 [USACO11OPEN]Mowing the Lawn G
  13. 小步快跑是这样玩的(下)
  14. sp经营许可证适用范围是什么?
  15. nginx将一个域名的访问跳转到另一个域名
  16. hashcat学习笔记0 安装与例子
  17. 我用DoS把自己网站弄挂了
  18. JavaScript中this的指向
  19. openssl sha1 16进制数据
  20. Unity网络开发实践

热门文章

  1. c1200 写频软件_摩托罗拉C1200写频软件
  2. django session过期设置
  3. eclipse汉化版的问题
  4. adobe flash player ActiveX IE降级安装旧版本的方法
  5. 光纤跳线接口_你知道光纤接头、尾纤、终端盒的作用与接法嘛?读懂这篇足够...
  6. java wsdl 服务端代码_wsdl2java 生成 webservice服务端代码:
  7. css实现w3cschool广告轮播图
  8. python 公众号文章发布_Python获取公众号文章
  9. roboguide程序导出_FANUC ROBOGUIDE下载-FANUC ROBOGUIDE(发那科机器人编程软件)下载v9.1-西西软件下载...
  10. 麒麟系统安装打印机共享_国产操作系统麒麟——文档打印 解决方案