合肥金星智控科技股份有限公司
宣传

位置:中冶有色 >

有色技术频道 >

> 化学分析技术

> 碳纤维金属元素测量方法、设备、存储介质及系统

碳纤维金属元素测量方法、设备、存储介质及系统

164   编辑:中冶有色网   来源:陕西煤基特种燃料研究院有限公司  
2025-03-17 15:21:32
权利要求

1.一种碳纤维金属元素测量方法,其特征在于,包括:

获取待测碳纤维中一种或多种目标金属元素各自对应的光谱强度数据;

将所述各自对应的光谱强度数据输入对应的已优化预处理单元,得到各自对应的优化光谱强度数据;以及

将所述各自对应的优化光谱强度数据输入对应的训练好的随机森林预测单元,得到所述一种或多种目标金属元素各自的含量。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取样本碳纤维中一种或多种样本金属元素各自对应的样本数据,其中所述样本数据包括光谱强度数据和对应的参考含量数据;

将每种样本金属元素的样本数据划分为校正集和测试集;

基于每种样本金属元素的校正集构建各自的第一随机森林回归模型;

基于所述第一随机森林回归模型对选用的预处理方法进行优化,得到该种样本金属元素对应的优选预处理方法以构成所述已优化预处理单元并且得到该种样本金属元素对应的已预处理校正集。

3.根据权利要求2所述的方法,其特征在于,

所述选用的预处理方法包括小波变换方法和二阶求导方法;

所述基于所述第一随机森林回归模型对选用的预处理方法进行优化,得到该种样本金属元素对应的优选预处理方法,包括:

根据所述第一随机森林回归模型以平均相对误差最小为判断标准,从小波变换方法和二阶求导方法中选择优选预处理方法并确定其优化参数。

4.根据权利要求3所述的方法,其特征在于,

所述小波变换方法的优化参数包括对小波基函数和分解层数的选择,其中所述小波基函数包括coif函数和db函数,分解层数范围为1-15;

所述二阶求导方法的优化参数包括对平滑点数的选择,其中所述平滑点数范围为3-15。

5.根据权利要求4所述的方法,其特征在于,

所述目标金属元素为K、Ca、Mg、Na和Fe;

对于K,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为coif4,分解层数为9;

对于Ca,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db10,分解层数为8;

对于Mg,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db8,分解层数为9;

对于Na,优选预处理方法为二阶求导方法,其中平滑点数为9;

对于Fe,所述小波变换方法的小波基函数为db12,分解层数为4。

6.根据权利要求2-5中任一项所述的方法,其特征在于,所述方法还包括:

基于变量重要性测量方法对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量;

基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型;

采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值;

基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

使用每种样本金属元素的样本数据中的测试集对对应的基于变量重要性测量的随机森林回归模型进行验证,从而得到所述训练好的随机森林预测单元。

8.一种电子设备,包括处理器和存储介质,其特征在于,所述存储介质中存储有程序,所述程序被所述处理器执行时实现根据权利要求1-7中任一项所述的方法。

9.一种存储介质,其特征在于,所述存储介质中存储有程序,所述程序被执行时实现根据权利要求1-7中任一项所述的方法。

10.一种系统,其特征在于,包括:

权利要求8所述的电子设备;

光谱仪系统,用于采集碳纤维中金属元素的光谱强度数据。

说明书

技术领域

[0001]本发明涉及计算机技术领域,具体涉及一种碳纤维金属元素测量方法、设备、存储介质及系统。

背景技术

[0002]碳纤维中金属主要来自于原丝及其生产过程,生产过程中使用的上浆剂中存在大量的硅及少数其他碱金属等元素。碳纤维中的硅、钾、钠、钙、镁、铁、、钛等杂质元素含量对抗氧化性能影响较大,碳纤维中碱金属及碱土金属含量越高,其抗氧化性能越差,氧化失重率就越高,从而影响碳纤维的品质。因此,检测碳纤维中金属元素具有重要的意义,能够衡量碳纤维的抗氧化性能。然而,在现有技术中,针对碳纤维中金属元素含量的检测大多需要电感耦合等离子体质谱仪来实现,具体地,首先采用电感耦合等离子体原子发射光谱、原子吸收光谱等,以上方法虽然可以获得准确的定量结果,但是需要复杂性的样品前处理(例如消解等),使用大量强酸,增加了特殊复杂的废水处理过程,这些问题导致难以实现碳纤维金属元素含量简单快速预估。

发明内容

[0003]本发明所要解决的技术问题是提供一种碳纤维金属元素测量方法、设备、存储介质及系统,通过机器学习方法来对碳纤维金属元素含量进行预测,在应用阶段无需使用电感耦合等离子体质谱仪,也就无需经过背景技术中提及的前处理步骤,从而解决了现有技术中碳纤维金属元素检测过程复杂、不环保等问题。本发明的碳纤维金属元素的测量过程简便,能够准确快速地实现碳纤维金属元素含量的测量。

[0004]为此,本发明第一方面提供一种碳纤维金属元素测量方法,包括:

获取待测碳纤维中一种或多种目标金属元素各自对应的光谱强度数据;

将所述各自对应的光谱强度数据输入对应的已优化预处理单元,得到各自对应的优化光谱强度数据;以及

将所述各自对应的优化光谱强度数据输入对应的训练好的随机森林预测单元,得到所述一种或多种目标金属元素各自的含量。

[0005]在一个具体实施例中,所述方法还包括:

获取样本碳纤维中一种或多种样本金属元素各自对应的样本数据,其中所述样本数据包括光谱强度数据和对应的参考含量数据;

将每种样本金属元素的样本数据划分为校正集和测试集;

基于每种样本金属元素的校正集构建各自的第一随机森林回归模型;

基于所述第一随机森林回归模型对选用的预处理方法进行优化,得到该种样本金属元素对应的优选预处理方法以构成所述已优化预处理单元并且得到该种样本金属元素对应的已预处理校正集。

[0006]在一个具体实施例中,所述选用的预处理方法包括小波变换方法和二阶求导方法;所述基于所述第一随机森林回归模型对选用的预处理方法进行优化,得到该种样本金属元素对应的优选预处理方法,包括:根据所述第一随机森林回归模型以平均相对误差最小为判断标准,从小波变换方法和二阶求导方法中选择优选预处理方法并确定其优化参数。

[0007]在一个具体实施例中,所述小波变换方法的优化参数包括对小波基函数和分解层数的选择,其中所述小波基函数包括coif函数和db函数,分解层数范围为1-15;

所述二阶求导方法的优化参数包括对平滑点数的选择,其中所述平滑点数范围为3-15。

[0008]在一个具体实施例中,所述目标金属元素为K、Ca、Mg、Na和Fe;

对于K,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为coif4,分解层数为9;

对于Ca,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db10,分解层数为8;

对于Mg,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db8,分解层数为9;

对于Na,优选预处理方法为二阶求导方法,其中平滑点数为9;

对于Fe,所述小波变换方法的小波基函数为db12,分解层数为4。

[0009]在一个具体实施例中,所述方法还包括:

基于变量重要性测量方法对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量;

基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型;

采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值;

基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型。

[0010]在一个具体实施例中,所述方法还包括:

使用每种样本金属元素的样本数据中的测试集对对应的基于变量重要性测量的随机森林回归模型进行验证,从而得到所述训练好的随机森林预测单元。

[0011]在一个具体实施例中,所述基于变量重要性测量方法对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量,包括:分别设置多个变量重要性阈值,从所述已预处理校正集中的光谱强度数据中提取各自的特征变量;

所述基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型,包括:使用各自的特征变量以及对应的参考含量数据构建对应的第二随机森林回归模型;

所述采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值,包括:基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值;

所述基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型,包括:基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建该样本金属元素的基于变量重要性测量的随机森林回归模型。

[0012]在一个具体实施例中,所述方法还包括:

基于变量重要性测量方法对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量;

基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型;

采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值;

基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型;

基于网格搜索法对所述基于变量重要性测量的随机森林回归模型的参数进行优化,得到基于变量重要性测量和网格搜索的随机森林回归模型。

[0013]在一个具体实施例中,所述方法还包括:

使用每种样本金属元素的样本数据中的测试集对对应的变量重要性测量和网格搜索的随机森林回归模型进行验证,从而得到所述训练好的随机森林预测单元。

[0014]在一个具体实施例中,所述基于变量重要性测量方法对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量,包括:分别设置多个变量重要性阈值,从所述已预处理校正集中的光谱强度数据中提取各自的特征变量;

所述基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型,包括:使用各自的特征变量以及对应的参考含量数据构建对应的第二随机森林回归模型;

所述采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值,包括:基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值;

所述基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型,包括:基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建该样本金属元素的基于变量重要性测量的随机森林回归模型;

所述基于网格搜索法对所述基于变量重要性测量的随机森林回归模型的参数进行优化,得到基于变量重要性测量和网格搜索的随机森林回归模型,包括:选择待优化的参数的取值范围及步长,其中所述待优化参数包括随机回归模型的树的数量范围和步长、随机种子数的范围和步长以及最大深度范围和步长;基于所述待优化的参数取值范围及步长构建参数网格,得到所有参数组合;对每个参数组合进行交叉验证和/或外部验证;根据验证结果,选择最优参数得到所述基于变量重要性测量和网格搜索的随机森林回归模型。

[0015]在一个具体实施例中,树的数量范围为50~300,步长为20;随机种子数范围为40~62,步长为3;最大深度范围为10或20。

[0016]在一个具体实施例中,所述交叉验证采用5折交叉验证。

[0017]在一个优选实施例中,对于K,所述最优参数为:树的数量为50、随机种子数为57、最大深度为10;对于Ca,所述最优参数为:树的数量为250、随机种子数为48、最大深度为10;对于Mg,所述最优参数为:树的数量为110、随机种子数为45、最大深度为10;对于Na,所述最优参数为:树的数量为290、随机种子数为48、最大深度为20;对于Fe,所述最优参数为:树的数量为150、随机种子数为42、最大深度为10。

[0018]在一个具体实施例中,基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值,包括:根据第二随机森林回归模型的预测值与参考含量值间的决定系数和平均相对误差作为模型预估性能的评价指标来进行所述内部验证。

[0019]在一个具体实施例中,所述决定系数大于0.97;平均相对误差小于0.05。

[0020]在一个具体实施例中,所述目标金属元素为K、Ca、Mg、Na和Fe;

对于K,所述优选阈值为3;

对于Ca,所述优选阈值为0.5;

对于Mg,所述优选阈值为0.1;

对于Na,所述优选阈值为0.004;

对于Fe,所述优选阈值为1。

[0021]本发明的第二方面提供一种电子设备,包括处理器和存储介质,所述存储介质中存储有程序,所述程序被所述处理器执行时实现上述第一方面所述的方法。

[0022]本发明第三方面提供一种存储介质,所述存储介质中存储有程序,所述程序被执行时实现上述第一方面所述的方法。

[0023]本发明第四方面提供一种系统,包括:

本发明第二方面所述的电子设备;

光谱仪系统,用于采集碳纤维中金属元素的光谱强度数据。

[0024]在一个具体实施例中,所述系统还包括质谱仪系统,用于采集碳纤维中金属元素的含量。

[0025]与现有技术相比,本发明的有益效果为:

1) 本发明利用机器学习方法对碳纤维金属元素含量进行测量(也可称为预测),仅需要在训练机器学习模型阶段使用质谱仪来获取样本的金属元素含量,也就是说仅仅在训练阶段引入背景技术中所提的前处理方法,而在应用阶段仅需要光谱仪和加载有本发明的机器学习模型的电子设备即可完成测量,不需要复杂性的样品前处理,无损分析,不需要使用大量酸,最大限度减少了特殊复杂的废水处理过程,从而实现环保、准确、简单、快速且直接的测量效果。

[0026]2) 本发明的一个实施例针对碳纤维金属元素测量场景下金属元素含量少且不同种类的金属元素含量可能差距大的特点,采取了针对不同金属元素获取各自优选的光谱数据预处理方法的方案,为后续预测提高了准确性。

[0027]3) 本发明的一个实施例对于经过预处理的数据进行进一步的特征提取,降低数据维度,从而构建了随机森林回归模型,避免了模型复杂化,降低了建模时间,进而提高了模型的预测能力和计算效率。

[0028]4) 本发明的一个实施例针对碳纤维金属元素测量场景下金属元素含量少且不同种类的金属元素含量可能差距大的特点,采取了针对不同金属元素获取各自优选的随机森林回归模型的方案,提高了预测的准确性。

[0029]5) 本发明的一个实施例采用网格搜索方法将进一步优化基于变量重要性测量的随机森林回归模型,构建参数组进行交叉验证,从而得到优化的模型参数,进而基于优化的模型参数构建的模型能够达到预测稳定性需求。

附图说明

[0030]为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。

[0031]图1是实现本发明的测量方法的网络架构示意图;

图2是获得根据本发明一个实施例的已优化预处理单元的流程框图;

图3是获得根据本发明一个实施例的基于变量重要性测量的随机森林回归模型的流程框图;

图4是获得根据本发明一个实施例的基于变量重要性测量和网格搜索的随机森林回归模型的流程框图;

图5是根据本发明一个实施例的应用阶段所使用的硬件及软件结构示意图;

图6是根据本发明一个实施例的碳纤维金属元素测量方法的流程框图;以及

图7是根据本发明一个实施例的电子设备示意图。

具体实施方式

[0032]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。

[0033]图1示出了本申请一个示例性实施例的网络架构示意图,通过该网络架构或其部分来执行本申请涉及的训练方法和测量方法。

[0034]该架构1包括:电子设备10、光谱仪系统12以及质谱仪系统14。其中,光谱仪系统12和质谱仪系统14分别通过无线网络或有线网络与电子设备10相连。

[0035]电子设备10可以包括计算机、服务器、云计算平台和虚拟化中心中的至少一种,但也不限于此。只要能执行本发明的机器学习模型建模及模型训练方法以及模型应用阶段的测量方法即可。在一个具体示例中,采用随机森林回归模型作为本发明的机器学习模型。

[0036]光谱仪系统12可以采用激光诱导击穿光谱仪系统(LIBS)。具体地,本发明所使用的LIBS主要由Q开关Nd:YAG激光器(Dawa300,北京Beamtech,中国),光谱仪(美国海洋光学MX2500-3PLUS),电荷耦合器件(charge coupled device, CCD)以及可移动样品台和计算机等组成。

[0037]光谱仪系统12在建模及训练阶段的作用在于采集样本碳纤维中样本金属元素的光谱强度数据,并将光谱强度数据传输给电子设备10,以供其建模和进行模型训练;在应用阶段的作用在于采集待测碳纤维中目标金属元素的光谱强度数据,并将光谱强度数据传输给电子设备10,以供其预测对应的金属元素含量。

[0038]质谱仪系统14可以采用电感耦合等离子体-质谱法(ICP-MS)系统。质谱仪系统14在建模及训练阶段的作用在于采集样本碳纤维中样本金属元素的参考含量。请注意,质谱仪系统14在本发明中仅需用于建模及训练阶段。

[0039]建模及模型训练阶段

本发明一个实施例的建模及模型训练方法整体光谱数据预处理单元的优化过程以及随机森林回归模型的优化过程。

[0040]具体而言,如图2所示,提供一种光谱数据预处理单元的优化过程,包括:

S10、获取样本碳纤维中一种或多种样本金属元素各自对应的样本数据,其中所述样本数据包括光谱强度数据和对应的参考含量数据。

[0041]具体地,电子设备10从光谱仪系统12和质谱仪系统14分别获取样本碳纤维中样本金属元素的光谱强度和参考含量。

[0042]在一个示例中,采用激光诱导击穿光谱仪系统对15个样本碳纤维的样本金属元素(K、Ca、Mg、Na和Fe)进行光谱数据采集。考虑到均匀性,每个样本碳纤维随机不同测试点采集光谱,优选地,在进行光谱数据采集时,每个样本随机挑选10个不同测试点,因此,对于每个样本碳纤维的每种样本金属元素,共获得10条LIBS光谱,共计150条LIBS光谱数据,其中对于每一条LIBS光谱数据,包含例如5000个光谱强度(取决于所用的光谱仪系统,在此仅以5000举例)。进而,对于每种样本金属元素(例如K),可以得到150*5000的光谱数据矩阵,传输给电子设备10。

[0043]另一方面,在一个示例中,采用电感耦合等离子体-质谱法(ICP-MS)系统对这15个样本碳纤维的样本金属元素(K、Ca、Mg、Na和Fe)进行含量采集,具体地,对每个样本所挑选的10个不同测试点进行测试。因此,对于每种样本金属元素,共获得150个参考含量数据,进而,对于每种样本金属元素,可以得到150*1的含量矩阵,传输给电子设备。

[0044]S12、将每种样本金属元素的样本数据划分为校正集和测试集。

[0045]在电子设备10接收到光谱数据矩阵以及含量矩阵后,将每种样本金属元素的样本数据划分为校正集和测试集。接下来的操作分别对每种样本金属元素进行。

[0046]仍以K为例,将150*5000个光谱数据和对应的150个参考含量数据分为校正集和测试集。例如按照2:1随机划分的方法。

[0047]S14、基于每种样本金属元素的校正集构建各自的第一随机森林回归模型。

[0048]仍以K为例,基于100*5000个光谱数据和对应的100个参考含量数据构建金属元素K的第一随机森林回归模型。其它金属元素类似操作。

[0049]S16、基于所述第一随机森林回归模型对选用的预处理方法进行优化,得到该种样本金属元素对应的优选预处理方法以构成已优化预处理单元并且得到该种样本金属元素对应的已预处理校正集。

[0050]在本发明中,由于金属元素在碳纤维中的含量较少,且各个金属元素之间的含量比例也可能存在很大差距,受限于光谱仪系统的测量精度,得到的光谱强度数据可能存在噪声干扰以及数据不平滑,所以需要对光谱强度数据进行预处理。并且,仅采用一种预处理方法可能会引起后续建模的干扰。

[0051]为此,在一个优选实施例中,S16进一步包括:

根据所述第一随机森林回归模型以平均相对误差最小为判断标准,从小波变换方法和二阶求导方法中选择优选预处理方法并确定其优化参数。

[0052]也就是说,仍以金属元素K为例,采用小波变换方法和二阶求导方法二者分别对光谱强度数据进行预处理并作为输入之一输入该种金属元素的第一随机森林回归模型,以平均相对误差最小为判断标准,从小波变换方法和二阶求导方法中选择优选预处理方法并确定其优化参数。其它金属元素类似操作。

[0053]其中,所述小波变换方法的优化参数包括对小波基函数和分解层数的选择,其中所述小波基函数包括coif函数和db函数,分解层数范围为1-15;所述二阶求导方法的优化参数包括对平滑点数的选择,其中所述平滑点数范围为3-15。

[0054]在本发明的一个实施例中,经过上述优化,得到如下结果:

对于K,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为coif4,分解层数为9;对于Ca,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db10,分解层数为8;对于Mg,优选预处理方法为小波变换方法,其中所述小波变换方法的小波基函数为db8,分解层数为9;对于Na,优选预处理方法为二阶求导方法,其中平滑点数为9;对于Fe,所述小波变换方法的小波基函数为db12,分解层数为4。

[0055]对于上述5种金属元素,分别得到5个已优化预处理单元,如图5所示(图中以省略号表示多个)。

[0056]本发明的针对碳纤维金属元素测量场景下金属元素含量少且不同种类的金属元素含量可能差距大的特点,采取了针对不同金属元素获取各自优选的光谱数据预处理方法的方案,为后续预测提高了准确性。

[0057]另外,针对每种金属元素得到的优化预处理方法(也就是优化预处理单元),得到了对应的已预处理校正集。

[0058]由于样品的复杂性,获得的已预处理校正集中除了样品有效信息外还包括冗余信息。如果将所有光谱数据用于分析,则很容易产生“维度灾难”问题,不但会使模型复杂化,增加建模时间,还会严重影响模型的预测能力和计算效率。因此,需要光谱进行变量选择,提取特征信息,降低数据维度,以减少耗时,提高分析结果。

[0059]为此,如图3所示,提供一种随机森林预测单元的优化过程,包括:

S20、基于变量重要性测量方法(VIM)对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量;

S22、基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型;

S24、采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值;

S26、基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型(又称为VIM-RF回归模型)。

[0060]在一个具体实施例中,S20-S26进一步包括:分别设置多个变量重要性阈值,从所述已预处理校正集中的光谱强度数据中提取各自的特征变量;以及使用各自的特征变量以及对应的参考含量数据构建对应的第二随机森林回归模型;基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值;基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建该样本金属元素的基于变量重要性测量的随机森林回归模型。

[0061]例如,仍以K为例,首先随机选取一个变量重要性阈值为2,从已预处理校正集中提取一部分变量例如150*1000及其对应的含量数据去构建一个第二随机森林回归模型;再随机选取一个变量重要性阈值为4,从已预处理校正集中提取一部分变量例如150*800及其对应的含量数据去构建第二个第二随机森林回归模型,......等等。

[0062]从而,可以从这些变量重要性阈值中选择最优阈值,并且基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建金属元素K的基于变量重要性测量的随机森林回归模型。其它金属元素类似操作。

[0063]在一个具体实施例中,所述基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值,包括:根据第二随机森林回归模型的预测值与参考含量值间的决定系数和平均相对误差作为模型预估性能的评价指标来进行所述内部验证。

[0064]在一个具体实施例中,所述决定系数大于0.97;平均相对误差小于0.05。

[0065]至此,完成了使用校正集构建基于变量重要性测量的随机森林回归模型的过程。在此基础上,本发明的方法还包括:

S28、使用每种样本金属元素的样本数据中的测试集对对应的基于变量重要性测量的随机森林回归模型进行验证,从而得到训练好的随机森林预测单元。对于上述5种金属元素,分别得到5个训练好的随机森林预测单元,如图5所示,包括针对每种金属元素的预处理单元1000以及针对每种金属元素的预测单元1005,二者共同构成了本发明的软件部分100。

[0066]表1示出了VIM-RF回归模型相比于普通随机森林回归模型对测试集样本的预测性能比较。可见,VIM-RF回归模型预测性能上优于普通随机森林回归模型。

[0067]表1不同RF回归模型的预测性能

然而,发明人发现在使用上述VIM-RF回归模型对未知样品进行多次平行测量时,预测性能的稳定性欠佳(例如相对标准偏差大)。为此,本发明的一个实施例采用网格搜索方法进一步优化VIM-RF回归模型:构建参数组进行交叉验证,从而得到优化的模型参数,进而基于优化的模型参数构建的模型能够达到满意的预测稳定性效果。

[0068]为此,如图4所示,作为图3方案的替代,提供另一种随机森林预测单元的优化过程,包括:

S30、基于变量重要性测量方法(VIM)对每种样本金属元素对应的已预处理校正集中的光谱强度数据进行初步优化,得到各自的初步优化特征变量;

S32、基于所述特征变量构建每种样本金属元素各自的第二随机森林回归模型;

S34、采用内部验证对变量重要性测量方法的变量重要性阈值进行选择,得到优选阈值;

S36、基于所述优选阈值确定优选光谱强度数据构建基于变量重要性测量的随机森林回归模型(又称为VIM-RF回归模型);

S37、基于网格搜索法对所述基于变量重要性测量的随机森林回归模型的参数进行优化,得到基于变量重要性测量和网格搜索的随机森林回归模型。

[0069]在一个具体实施例中,S30-S37进一步包括:分别设置多个变量重要性阈值,从所述已预处理校正集中的光谱强度数据中提取各自的特征变量;以及使用各自的特征变量以及对应的参考含量数据构建对应的第二随机森林回归模型;基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值;基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建该样本金属元素的基于变量重要性测量的随机森林回归模型;选择基于变量重要性测量的随机森林回归模型中待优化的参数的取值范围及步长,其中所述待优化参数包括随机回归模型的树的数量范围和步长、随机种子数的范围和步长以及最大深度范围和步长;基于所述待优化的参数取值范围及步长构建参数网格,得到所有参数组合;对每个参数组合进行交叉验证和/或外部验证;根据验证结果,选择最优参数得到所述基于变量重要性测量和网格搜索的随机森林回归模型(又称为GS-VIM-RF回归模型)。

[0070]例如,仍以K为例,首先随机选取一个变量重要性阈值为2,从已预处理校正集中提取一部分变量例如150*1000及其对应的含量数据去构建一个第二随机森林回归模型;再随机选取一个变量重要性阈值为4,从已预处理校正集中提取一部分变量例如150*800及其对应的含量数据去构建第二个第二随机森林回归模型,......等等。

[0071]从而,可以从这些变量重要性阈值中选择最优阈值,并且基于所述最优阈值从所述已预处理校正集中的光谱强度数据中确定优选光谱强度数据,并基于所述优选光谱强度数据和对应的参考含量数据构建金属元素K的基于变量重要性测量的随机森林回归模型,并且进一步优化基于变量重要性测量的随机森林回归模型,得到GS-VIM-RF回归模型。其它金属元素类似操作。

[0072]在一个具体实施例中,所述基于所述对应的第二随机森林回归模型进行内部验证,从所述多个变量重要性阈值中选择最优阈值,包括:根据第二随机森林回归模型的预测值与参考含量值间的决定系数和平均相对误差作为模型预估性能的评价指标来进行所述内部验证。

[0073]在一个具体实施例中,所述决定系数大于0.97;平均相对误差小于0.05。

[0074]在一个具体实施例中,树的数量范围为50~300,步长为20;随机种子数范围为40~62,步长为3;最大深度范围为10或20。

[0075]在一个具体实施例中,所述交叉验证采用5折交叉验证。

[0076]在一个优选实施例中,对于K,所述最优参数为:树的数量为50、随机种子数为57、最大深度为10;对于Ca,所述最优参数为:树的数量为250、随机种子数为48、最大深度为10;对于Mg,所述最优参数为:树的数量为110、随机种子数为45、最大深度为10;对于Na,所述最优参数为:树的数量为290、随机种子数为48、最大深度为20;对于Fe,所述最优参数为:树的数量为150、随机种子数为42、最大深度为10。

[0077]至此,完成了使用校正集构建基于变量重要性测量和网格搜索的随机森林回归模型的过程。在此基础上,本发明的方法还包括:

S38、使用每种样本金属元素的样本数据中的测试集对对应的基于变量重要性测量和网格搜索的随机森林回归模型进行验证,从而得到训练好的随机森林预测单元。对于上述5种金属元素,分别得到5个训练好的随机森林预测单元,如图5所示。

[0078]表2示出了GS-VIM-RF回归模型相比于VIM-RF对测试集样本的预测性能比较。可见,GS-VIM-RF回归模型预测性能更好,且模型运行时间缩短,极大提高预测效率。

[0079]表2不同RF回归模型的预测性能

并且,从表2中可知,与VIM-RF模型相比,目标元素的5个GS-VIM-RF回归模型的预测性能更稳定且准确度更高,各元素的RSD均小于0.07,MRE均小于0.05。

[0080]应用阶段

如图6所示,基于上述模型构建及训练的基础上,本发明还提供一种碳纤维金属元素测量方法,包括:

S40、获取待测碳纤维中一种或多种目标金属元素各自对应的光谱强度数据;

S42、将所述各自对应的光谱强度数据输入对应的已优化预处理单元,得到各自对应的优化光谱强度数据;

S44、将所述各自对应的优化光谱强度数据输入对应的训练好的随机森林预测单元,得到所述一种或多种目标金属元素各自的含量。

[0081]例如将金属元素K的光谱强度数据输入第一目标元素预处理单元,得到优化的光谱强度数据,并将其输入对应的第一目标元素随机森林预测单元。其它元素类似。

[0082]在一个具体实施例中,所述目标金属元素为K、Ca、Mg、Na和Fe。

[0083]本领域技术人员能够理解的是,本申请实现上述实施例的建模/训练方法、测量方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。

[0084]本申请的还提供了一种电子设备,例如图7所示的电子设备,包括处理器31和存储器32,其中存储器中存储有程序,该程序被处理器执行时可以用来实现上述方法。

[0085]另外,本申请还提供一种系统,如图1所示,包括电子设备和本发明所提及的光谱仪系统。进一步,在建模及训练阶段,该系统还包括本发明提及的质谱仪系统。

[0086]需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本申请的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些调整之后的方案与本申请中描述的技术方案属于等同技术方案,因此也将落入本申请的保护范围之内。

[0087]以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或改进,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

说明书附图(7)

声明:
“碳纤维金属元素测量方法、设备、存储介质及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)
分享 0
         
举报 0
收藏 0
反对 0
点赞 0
全国热门有色金属技术推荐
展开更多 +

 

中冶有色技术平台

最新更新技术

报名参会
更多+

报告下载

第二届中国微细粒矿物选矿技术大会
推广

热门技术
更多+

衡水宏运压滤机有限公司
宣传
环磨科技控股(集团)有限公司
宣传

发布

在线客服

公众号

电话

顶部
咨询电话:
010-88793500-807
专利人/作者信息登记