系列文章目录

“光晰本质,谱见不同”,光谱作为物质的指纹,被广泛应用于成分分析中。伴随微型光谱仪/光谱成像仪的发展与普及,基于光谱的分析技术将不只停留于工业和实验室,即将走入生活,实现万物感知,见微知著。本系列文章致力于光谱分析技术的科普和应用。


文章目录

  • 系列文章目录
  • 前言
  • 一、光谱数据读入
    • 1.1 光谱数据读入
    • 1.2 光谱可视化
  • 二、光谱预处理
    • 2.1 光谱预处理模块
    • 2 .2 光谱预处理的使用
  • 总结

前言

典型的光谱分析模型(以近红外光谱作为示意,可见光、中远红外、荧光、拉曼、高光谱等分析流程亦相似)建立流程如下所示,在建立过程中,需要使用算法对训练样本进行选择,然后使用预处理算法对光谱进行预处理,或对光谱的特征进行提取,再构建校正模型实现定量分析,最后针对不同测量仪器或环境,进行模型转移或传递。因此训练样本的选择、光谱的预处理、波长筛选、校正模型、模型传递以及上述算法的参数都影响着模型的应用效果。


针对光谱分析流程所涉及的常见的训练样本的划分、光谱的预处理、波长筛选、校正模型算法建立了完整的算法库,名为OpenSA(OpenSpectrumAnalysis)。整套算法库的架构如下所示。

样本划分模块提供随机划分、SPXY划分、KS划分三种数据集划分方法,光谱预处理模块提供常见光谱预处理,波长筛选模块提供Spa、Cars、Lars、Uve、Pca等特征降维方法,分析模块由光谱相似度计算、聚类、分类(定性分析)、回归(定量分析)构建,光谱相似度子模块计算提供SAM、SID、MSSIM、MPSNR等相似计算方法,聚类子模块提供KMeans、FCM等聚类方法,分类子模块提供ANN、SVM、PLS_DA、RF等经典化学计量学方法,亦提供CNN、AE、Transformer等前沿深度学习方法,回归子模块提供ANN、SVR、PLS等经典化学计量学定量分析方法,亦提供CNN、AE、Transformer等前沿深度学习定量分析方法。模型评估模块提供常见的评价指标,用于模型评估。自动参数优化模块用于自动进行最佳的模型设置参数寻找,提供网格搜索、遗传算法、贝叶斯概率三种最优参数寻找方法。可视化模块提供全程的分析可视化,可为科研绘图,模型选择提供视觉信息。可通过几行代码快速实现完整的光谱分析及应用(注: 自动参数优化模块和可视化模块暂不开源,等毕业后再说)


本篇针对OpenSA的光谱预处理模块进行代码开源和使用示意。

一、光谱数据读入

提供两个开源数据作为实列,一个为公开定量分析数据集,一个为公开定性分析数据集,本章仅以公开定量分析数据集作为演示。

1.1 光谱数据读入

# 分别使用一个回归、一个分类的公开数据集做为example
def LoadNirtest(type):if type == "Rgs":CDataPath1 = './/Data//Rgs//Cdata1.csv'VDataPath1 = './/Data//Rgs//Vdata1.csv'TDataPath1 = './/Data//Rgs//Tdata1.csv'Cdata1 = np.loadtxt(open(CDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)Vdata1 = np.loadtxt(open(VDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)Tdata1 = np.loadtxt(open(TDataPath1, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)Nirdata1 = np.concatenate((Cdata1, Vdata1))Nirdata = np.concatenate((Nirdata1, Tdata1))data = Nirdata[:, :-4]label = Nirdata[:, -1]elif type == "Cls":path = './/Data//Cls//table.csv'Nirdata = np.loadtxt(open(path, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)data = Nirdata[:, :-1]label = Nirdata[:, -1]return data, label

1.2 光谱可视化

    #载入原始数据并可视化data, label = LoadNirtest('Rgs')plotspc(data, "raw specturm")

采用的开源光谱如图所示:

二、光谱预处理

2.1 光谱预处理模块

将常见的光谱进行了封装,使用者仅需要改变名字,即可选择对应的光谱分析,下面是光谱预处理模块的核心代码

"""-*- coding: utf-8 -*-@Time   :2022/04/12 17:10@Author : Pengyou FU@blogs  : https://blog.csdn.net/Echo_Code?spm=1000.2115.3001.5343@github :@WeChat : Fu_siry@License:"""
import numpy as np
from scipy import signal
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from copy import deepcopy
import pandas as pd
import pywt# 最大最小值归一化
def MMS(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after MinMaxScaler :(n_samples, n_features)"""return MinMaxScaler().fit_transform(data)# 标准化
def SS(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after StandScaler :(n_samples, n_features)"""return StandardScaler().fit_transform(data)# 均值中心化
def CT(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after MeanScaler :(n_samples, n_features)"""for i in range(data.shape[0]):MEAN = np.mean(data[i])data[i] = data[i] - MEANreturn data# 标准正态变换
def SNV(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after SNV :(n_samples, n_features)"""m = data.shape[0]n = data.shape[1]print(m, n)  ## 求标准差data_std = np.std(data, axis=1)  # 每条光谱的标准差# 求平均值data_average = np.mean(data, axis=1)  # 每条光谱的平均值# SNV计算data_snv = [[((data[i][j] - data_average[i]) / data_std[i]) for j in range(n)] for i in range(m)]return  data_snv# 移动平均平滑
def MA(data, WSZ=11):""":param data: raw spectrum data, shape (n_samples, n_features):param WSZ: int:return: data after MA :(n_samples, n_features)"""for i in range(data.shape[0]):out0 = np.convolve(data[i], np.ones(WSZ, dtype=int), 'valid') / WSZ # WSZ是窗口宽度,是奇数r = np.arange(1, WSZ - 1, 2)start = np.cumsum(data[i, :WSZ - 1])[::2] / rstop = (np.cumsum(data[i, :-WSZ:-1])[::2] / r)[::-1]data[i] = np.concatenate((start, out0, stop))return data# Savitzky-Golay平滑滤波
def SG(data, w=11, p=2):""":param data: raw spectrum data, shape (n_samples, n_features):param w: int:param p: int:return: data after SG :(n_samples, n_features)"""return signal.savgol_filter(data, w, p)# 一阶导数
def D1(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after First derivative :(n_samples, n_features)"""n, p = data.shapeDi = np.ones((n, p - 1))for i in range(n):Di[i] = np.diff(data[i])return Di# 二阶导数
def D2(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after second derivative :(n_samples, n_features)"""data = deepcopy(data)if isinstance(data, pd.DataFrame):data = data.valuestemp2 = (pd.DataFrame(data)).diff(axis=1)temp3 = np.delete(temp2.values, 0, axis=1)temp4 = (pd.DataFrame(temp3)).diff(axis=1)spec_D2 = np.delete(temp4.values, 0, axis=1)return spec_D2# 趋势校正(DT)
def DT(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after DT :(n_samples, n_features)"""lenth = data.shape[1]x = np.asarray(range(lenth), dtype=np.float32)out = np.array(data)l = LinearRegression()for i in range(out.shape[0]):l.fit(x.reshape(-1, 1), out[i].reshape(-1, 1))k = l.coef_b = l.intercept_for j in range(out.shape[1]):out[i][j] = out[i][j] - (j * k + b)return out# 多元散射校正
def MSC(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after MSC :(n_samples, n_features)"""n, p = data.shapemsc = np.ones((n, p))for j in range(n):mean = np.mean(data, axis=0)# 线性拟合for i in range(n):y = data[i, :]l = LinearRegression()l.fit(mean.reshape(-1, 1), y.reshape(-1, 1))k = l.coef_b = l.intercept_msc[i, :] = (y - b) / kreturn msc# 小波变换
def wave(data):""":param data: raw spectrum data, shape (n_samples, n_features):return: data after wave :(n_samples, n_features)"""data = deepcopy(data)if isinstance(data, pd.DataFrame):data = data.valuesdef wave_(data):w = pywt.Wavelet('db8')  # 选用Daubechies8小波maxlev = pywt.dwt_max_level(len(data), w.dec_len)coeffs = pywt.wavedec(data, 'db8', level=maxlev)threshold = 0.04for i in range(1, len(coeffs)):coeffs[i] = pywt.threshold(coeffs[i], threshold * max(coeffs[i]))datarec = pywt.waverec(coeffs, 'db8')return datarectmp = Nonefor i in range(data.shape[0]):if (i == 0):tmp = wave_(data[i])else:tmp = np.vstack((tmp, wave_(data[i])))return tmpdef Preprocessing(method, data):if method == "None":data = dataelif method == 'MMS':data = MMS(data)elif method == 'SS':data = SS(data)elif method == 'CT':data = CT(data)elif method == 'SNV':data = SNV(data)elif method == 'MA':data = MA(data)elif method == 'SG':data = SG(data)elif method == 'MSC':data = MSC(data)elif method == 'D1':data = D1(data)elif method == 'D2':data = D2(data)elif method == 'DT':data = DT(data)elif method == 'WVAE':data = wave(data)else:print("no this method of preprocessing!")return data

2 .2 光谱预处理的使用

在example.py文件中,提供了光谱预处理模块的使用方法,具体如下,仅需要两行代码即可实现所有常见的光谱预处理。
示意1:利用OpenSA实现MSC多元散射校正

 #载入原始数据并可视化data, label = LoadNirtest('Rgs')plotspc(data, "raw specturm")#光谱预处理并可视化method = "MSC"Preprocessingdata = Preprocessing(method, data)plotspc(Preprocessingdata, method)

预处理后的光谱数据如图所示:

示意2:利用OpenSA实现SNV预处理

    #载入原始数据并可视化data, label = LoadNirtest('Rgs')plotspc(data, "raw specturm")#光谱预处理并可视化method = "SNV"Preprocessingdata = Preprocessing(method, data)plotspc(Preprocessingdata, method)

预处理后的光谱数据如图所示:

总结

利用OpenSA可以非常简单的实现对光谱的预处理,完整代码可从获得GitHub仓库 如果对您有用,请点赞!
代码现仅供学术使用,若对您的学术研究有帮助,请引用本人的论文,同时,未经许可不得用于商业化应用,欢迎大家继续补充OpenSA中所涉及到的算法,如有问题

光谱预处理最简单实现方法--基于OpenSA光谱分析库相关推荐

  1. 战棋游戏中的简单策略方法:基于群表示论的思想

    战棋游戏中的简单策略方法:基于群表示论的思想 最近在开发一款自娱自乐的基于上世纪30年代历史背景的战棋游戏,需要为其设计一个策略算法,我一开始就想可能用比较传统的动态规划,恰逢本周周一周二中科院数学所 ...

  2. 无信息变量选择(UVE)波长筛选算法--基于OpenSA开源库实现

    系列文章目录 "光晰本质,谱见不同",光谱作为物质的指纹,被广泛应用于成分分析中.伴随微型光谱仪/光谱成像仪的发展与普及,基于光谱的分析技术将不只停留于工业和实验室,即将走入生活, ...

  3. 光谱预处理算法(python版本)

    系列文章目录 近红外光谱分析技术属于交叉领域,需要化学.计算机科学.生物科学等多领域的合作.为此,在(北京邮电大学杨辉华老师团队)指导下,近期准备开源传统的PLS,SVM,ANN,RF等经典算和SG, ...

  4. 光谱预处理算法(matlab版本)

    系列文章目录 近红外光谱分析技术属于交叉领域,需要化学.计算机科学.生物科学等多领域的合作.为此,在(北京邮电大学杨辉华老师团队)指导下,近期准备开源传统的PLS,SVM,ANN,RF等经典算和SG, ...

  5. 【CI3.1】CI框架简单使用方法

    CI框架简单使用方法 1.回忆MVC1.1.M:模型,提供数据,保存数据1.2.V:视图,只负责显示,表单form1.3.C:控制器,协调模型和视图1.4.action:动作,是控制器中的方法,用于被 ...

  6. scala akka_如何对Scala和Akka HTTP应用程序进行Docker化-简单的方法

    scala akka by Miguel Lopez 由Miguel Lopez 如何对Scala和Akka HTTP应用程序进行Docker化-简单的方法 (How to Dockerise a S ...

  7. php 批量删除cookie,php批量删除cookie的简单实现方法

    php批量删除cookie的简单实现方法 本文实例讲述了php批量删除cookie的简单实现方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: //删除单个cookie:键值设置为空 ...

  8. php中间件怎么使用,laravel框架中间件简单使用方法示例

    本文实例讲述了laravel框架中间件简单使用方法.分享给大家供大家参考,具体如下: laravel内置了一个中间件来验证用户是否经过认证,如果用户没有经过认证,中间件会将用户重定向到登录页面,否则如 ...

  9. php批量新增数据类型,Yii框架批量插入数据扩展类的简单实现方法

    本文实例讲述了Yii框架批量插入数据扩展类的简单实现方法.分享给大家供大家参考,具体如下: MySQL INSERT语句允许插入多行数据,如下所示: INSERT INTO tbl_name (a,b ...

  10. java按两列输出_有没有一种简单的方法可以将两列输出到Java中的控制台? - java...

    如标题所述,是否有一种简单的方法可以将两列输出到Java中的控制台? 我知道\t,但是在使用printf时,我还没有找到基于特定列进行空间分配的方法. 参考方案 使用宽度和精度说明符,将其设置为相同的 ...

最新文章

  1. 烂泥:php5.6源码安装及php-fpm配置与nginx集成
  2. 世界卫生日:大数据解读抑郁症群体
  3. HDU1164 Eddy's research I【素因子分解】
  4. qwidget多个窗口同步_【好人BUG】本机多组控制 一台电脑使用一个帐号登录多个(省钱) !...
  5. 解决Android 启动模拟器是出现“Failed to allocate memory: 8”错误提示
  6. SonarQube 规则的挂起与激活
  7. 利用函数wavread对语音信号进行采样_AI大语音(一)——语音识别基础(深度解析)...
  8. android 图层绘画分析,Android绘图技巧使用详解
  9. tensorflow学习3---mnist
  10. python中‘ ‘.join()的使用
  11. python怎么使用int四舍五入_python浮点数舍入(ROUND)方式总结
  12. 国内杀毒软件的发展史
  13. 解决问题:The server time zone value ‘�й���׼ʱ��‘ is unrecognized or represents more than one time zone.
  14. 不从装VS6 MSDN
  15. PHP——get和post请求他人接口
  16. 读书印记 - 《历代经济变革得失》
  17. 2018 in Restrospect
  18. 软件安装与升级——rpm
  19. Linux下访问处理器硬件信息原理:图形化工具RWLinux的诞生
  20. 新款iPad发布:Retina显示屏、A5X、高清摄像头、语音听 ...

热门文章

  1. EXCEL:获取某列或得中最后一个非空单元格的行数和数值
  2. Python调用OpenCV接口实现网络摄像头录像和抓拍图片
  3. react实现关于文本框的双向绑定
  4. Unity Gyro之使用陀螺仪实现简单VR全景环视效果
  5. Gsensor/Gyro数据滤波算法思考
  6. 孙子问题-中国剩余定理
  7. 软件测试kpi绩效考核表,测试工程师绩效考核表.xls
  8. 磁力聚合搜索工具中文版magnetW 3.1.1
  9. Unity VR成像原理
  10. python图片转svg_Python3.7将普通图片(png)转换为SVG图片格式并且让你的网站Logo(图标)从此”动”起来...