权利要求书: 1.考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,包括以下步骤:步骤S1,采集回转窑的工况数据;
步骤S2,对热工信号进行特征提取,转化成用于分类的训练数据;
步骤S3,对预处理后的训练数据计算出核矩阵;
步骤S4,将核矩阵和训练数据进行ODM训练学习得到训练分类器C;
步骤S5,运用训练分类器C计算出训练样本到分类面的间隔,并计算出间隔均值;
步骤S6,根据计算的间隔和间隔均值,计算得到保角变换函数;
步骤S7,根据保角变换函数对核函数进行修正,得到新的核矩阵;
步骤S8,使用修正后的核矩阵进行ODM训练,得到分类器,可以识别出烧结状态是正常还是异常,然后采取相关措施。
2.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S1中,工况数据包括八种热工信号,包括喂煤速度CF、投原料速度RMF、一次空气PA、窑尾负压NP、窑头气体温度KHT、窑尾气体温度KTT、主机电流MDC和烧结区火焰的温度ST。
3.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S2的具体过程是:
步骤S2.1,通过下述公式:
其中, 是指加入s个热工信号XD所求得的李普希茨商,L(k)是所有 中第k大的商,s是热工信号XD的个数,XD(i)表示作为输入的热工信号XD中的第i个数据,XD(j)表示作为输入的热工信号XD中的第j个数据,XD(i?s)表示作为输入的热工信号XD中的第i?s个数据,XD(j?s)表示作为输入的热工信号XD中的第j?s个数据,XD属于{CF,RMF,PA,NP,KHT,KTT,MDC,ST}八种热工信号之一,XRT(i)、XRT(j)表示作为模型输出的热工信号RT中的第i个数据和第s
j个数据,L表示加入s个热工信号XD后,所求得的李普希茨数;
s
随着热工信号XD中的内容增加,即增加s,计算不同s值下的李普希兹数L ,随着s值的增s
大,画出s与李普希兹数L之间的曲线关系图,通过在图上找出下降转折点、上升转折点,找出最后一个相关输入LRI,第一个相关输入FRI和最后一个相关输入LRI之间的时间段就是该热工信号XD的相关时段RP;
步骤S2.2,对热工信号进行打标,找出欠烧、过烧和正常三种工况时刻的数据,进行标签划分;
步骤S2.3,提取热工信号的统计特征,统计特征包括平均值特征和趋势特征:步骤S2.3.1,提取热工信号的平均值特征:通过式(1)计算相关时段RP中各热工信号的平均值:其中,MD为热工信号XD的平均特征,DR为热工信号XD的RP,LDR是DR的长度;
步骤S2.3.2,提取热工信号的趋势特征;
热工信号趋势定义为由热工信号值线性拟合得到的斜率,线性拟合模型如下:g(tD)=atD+b(2)其中,a和b分别为拟合直线的斜率和截距,tD为热工信号XD对应的时刻;
拟合直线g(tD)与XD之间的误差通过最小化平均拟合损失来最小化:其中,tD(i)为热工信号XD相关时段内第i个数据对应的时刻,以相关时段起点为0时刻,XDR(i)为热工信号XD相关时段内的第i个数据,斜率a的最优值为趋势特征,将热工信号XD的趋势特征表示为AD;
步骤S2.4,提取热工信号的动态特征,动态特征包括短时能量和样本熵特征:步骤S2.4.1,提取短时能量特征对于热工信号的短时能量定义为:
其中,En(t)为t时刻的短时能量,w()为窗口函数,Nc为窗口宽度,此处的i表示从t?(Nc?
1)时刻迭代到t时刻的一个迭代变量;
当矩形窗口w(n)定义为:
其中,若n时刻在热工信号XD的相关时段内,则w(n)=1,否则为0;
将式(5)代入到式(4)中,RP中热工信号的短时能量ED由下式计算:步骤S2.4.2,提取样本熵特征;
对于时序热工信号 可得到一组按序号顺序排列的m维向量向量Um(i)与Um(j)之间的最大距离定义为:其中,Um(j)为Um向量中的第j个元素,i,j,k为Um向量中的元素位置;
对于给定的向量Um(i),满足{Um(j)|1≤j≤t?m,j≠i}条件的向量Um(i)和Um(j)之间的最大距离不大于给定阈值η的数表示为Bi,对于维数m,两个向量匹配m个点的概率定义为:则该热工信号的样本熵为:
m+1 m
其中,B 为B中m维数取m+1时的值,各烧结状态样本由MD,AD,ED和SED四个特征组成,RP中各热工信号可表示为{MCF,...,MST,...,SECF,...,SEST},由此可以得到训练样本Xtrain由N个包含{MCF,...,MST,...,SECF,...,SEST}这些特征的向量组成的一个矩阵,N为训练样本个数。
4.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S3的具体过程是:
选择RBF核作为核函数,根据式(10)计算训练样本的核矩阵K:其中,K(i,j)表示核矩阵K中的第i行j列的元素,Xtrain(i)、Xtrain(j)分别为训练样本Xtrain中的第i个样本和第j个样本,σ为RBF核中的参数。
5.根据权利要求4所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S4的具体过程是:
用于判别欠烧、过烧和正常三种状态的分类器可以表示为 即训练数据通过映射函数 映射到RBF核空间后,由分类器进行分离,其中y表示训练样本标签, 表示实际训练样本空间到RBF核空间的映射函数,映射函数与核矩阵的关系为xi为Xtrain的第i个训练样本的特征向量,xj为Xtrain的第j个训练样本的特征向量,T表示ω向量的转置,(xi,yi)样本的边际定义为:其中,f()表示计算间隔关于xi的函数,γi中定义(xi,yi)样本的间隔,xi为Xtrain的第i个训练样本的特征向量,yi为Xtrain中的第i个训练样本的标签;
间隔均值表示为:
其中,ω为线性分类器中的系数;然后通过计算每个样本的间隔与间隔均值之间的差值,得到间隔方差如下:
yi为Xtrain中的第i个训练样本的标签,N为训练样本个数;
考虑到间隔均值和间隔方差的计算效率较低,通过缩放将边缘均值设置为1,通过最小化边际方差,优化边际分布,表示ODM的目标函数为:其中,ξi、εi分别为xi样本的间隔与间隔均值的下界偏差、xi样本的间隔与间隔均值的上界偏差,S为ODM的稀疏参数,决定哪些样本是支持向量,C1和C2为惩罚参数,C1和C2分别控制ξi和εi在目标函数中的权重,C1作为分类器间隔下界错分的惩罚,C2作为分类器间隔上界错分的惩罚,N为训练样本个数;
得到了ODM分类器凸函数形式,进行ODM训练,ODM训练输入是训练样本Xtrain和训练样本标签y,输出是计算Xtrain间隔的函数f()。
6.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S5的具体过程是:
当ODM学习训练结束后,将每个回转窑数据样本代入式(15)中即可求出样本到分类面的间隔:
其中,Xtrain(j)为第j个训练样本,Xtrain(i)为第i个训练样本,yj为Xtrain中的第j个训练样本的标签,yi为Xtrain中的第i个训练样本的标签,K(Xtrain(i),Xtrain(j))为K核矩阵中训练样本Xtrain(i)对应的行和训练样本Xtrain(j)对应列的元素,α为训练后得到的分类面系数,f(x)表示计算间隔关于x的函数;
之后根据式(16)计算间隔均值:其中,为间隔均值,∑f(Xtrain(i))为所有训练样本间隔之和,N为训练样本个数。
7.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S6中,计算保角变换函数具体步骤为:其中,S是ODM的稀疏参数,f(Xtrain)和 分别表示间隔和间隔均值,Kn和Kf为特征空间中控制不同区域体积膨胀系数的惩罚参数,Kn控制 区域内的体积膨胀,Kf控制 区域内的体积膨胀,e为自然常数,NIR为训练样本的不平衡比IR,控制不同标签样本的空间膨胀系数定义为:+ ? + ?
其中,Xtrain表示训练样本,X为多数类样本,X为少数类样本,n 和n 分别表示多数样本个数和少数样本个数,多数类样本为正常烧结状态样本,少数类样本为过烧和欠烧烧结状态样本。
8.根据权利要求1所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S7包括:
T
求得向量d=(d1,d2,...,dN) 表示由公式(17)计算得到的一个N维向量,di=D(Xtrain(i)),i=1,…,N,当i=1,…,N时,di表示N维向量d中的d1,d2,...,dN个元素,N为训练样本T T
个数,dd 是d与d的矩阵相乘,结果是一个N行N列的正(半)定矩阵,修正后的新核矩阵由下T
列矩阵形式保角变换公式求得,为dd和K组成的一个哈达玛积:T
Knew=dd*K(19)其中,Knew为通过保角变换修正后的新的核矩阵。
9.根据权利要求5所述的考虑类别不平衡的回转窑烧结状态识别方法,其特征在于,所述步骤S8包括:将Knew替换步骤S3中公式(10)计算得到的核矩阵K,再进行ODM训练,可以得到分类器 重复进行步骤S3?S7两遍,训练出两个分类器,第一次训练将欠烧和过烧的样本标签设为1,正常样本标签设为?1,得到分类器一;第二次训练将正常样本剔除,在欠烧和过烧之间训练分类器;将欠烧样本标签设为1,过烧样本设为?1,得到分类器二;通过两个分类器,特征提取后热工信号的数据的烧结状态可以得到有效的识别,将特征提取后热工信号的数据替换掉分类器中的Xtrain,求出对应的样本标签,先通过分类器一识别出烧结状态是正常还是异常,若为异常烧结状态,再通过分类器二判断出是欠烧还是过烧,采取相关措施。
说明书: 考虑类别不平衡的回转窑烧结状态识别方法技术领域[0001] 本发明主要涉及回转窑烧结状态识别技术领域,特别是涉及一种核修正和最优间隔分布的类别不均衡分类方法。
背景技术[0002] 回转窑是广泛应用于钢铁、电力、水泥等领域的核心生产设备。回转窑的烧结状态直接影响熟料质量。以
氧化铝回转窑为例,回转窑烧结主要有正常烧结、欠烧烧结和过烧烧
结三种烧结状态。欠烧和过烧是不正常的状态。在欠烧状态下,原料熔化不充分,导致后期
冶炼过程中氧化铝提取不完全。熟料在过烧的情况下,会产生粘性,容易结块,不利于破碎
和冶炼。另外,过热会对耐火材料造成损伤,增加回转窑的维护成本。烧结状态的准确判断
和识别对保证安全生产和提高生产效率至关重要,控制系统采取适当的措施来维持正常生
产也是前提。
[0003] 烧结状态识别(SCR)一直不是一项简单的工作。物理测量设备测得的温度是控制回转窑的一个重要指标。然而,仅仅通过温度来估计烧结状态是不够的。例如,在正常烧结
状态下,氧化铝回转窑的火焰温度(ST)会根据材料组成或供煤值等诸多复杂因素变化,在
1000℃到1300℃之间。另外,由于回转窑延迟大,温度变化一般滞后于烧结状态的变化,氧
化铝回转窑的烧结温度不能及时反映当前烧结状态。
[0004] 由于烧结过程涉及复杂的物理和化学反应,回转窑的机理模型难以建立。事实上,在大多数燃煤工业领域,烧结状态是由操作人员根据经验通过工艺数据的变化来判断的。
近年来,利用现场工艺数据对烧结状态或相关参数进行自动识别的研究很多。回转窑烧结
状态识别的过程场数据包括火焰图像和热信号。基于火焰图像的方法以其直观、快速的特
点在烧结状态识别中占有重要的地位。研究人员提取了各种视觉特征,并开发了基于火焰
图像的分类器。但在煤粉场中,烟尘干扰会造成图像的破坏,严重影响算法的精度。与此同
时,许多研究人员分析了热信号的特性,并利用软计算技术对烧结状态识别进行了研究。通
过建立了预测模型,并根据实际与预测值的差值确定了烧结状态。这在利用热信号识别烧
结状态方面也取得了良好的性能。
[0005] 上述数据驱动方法在烧结状态识别方面取得了很大的成就。但是,由于异常情况发生的概率远远小于正常情况发生的概率,因此采集到的工业数据通常是类别不平衡的,
现有的方法通常忽略了这一点。在类别不平衡的情况下,识别模型的学习分隔符总是倾向
于少数类,这使得识别模型的泛化性能和异常状态的识别精度下降。在回转窑现场,对异常
情况的误判可能会导致一系列的误操作,造成严重的后果。例如,当过烧状态被误判为欠烧
状态时,控制系统可能会进行一系列与欠烧状态相对应的操作,如增加输煤量,导致烧结区
温度不断升高,从而降低熟料质量,破坏设备。回转窑类别不平衡数据的存在,对烧结状态
识别模型的设计提出了挑战。
发明内容[0006] 本发明实施例的目的在于提供一种考虑类别不平衡的回转窑烧结状态识别方法,针对现有技术没有考虑到回转窑烧结状态存在数据类别不均衡,从而造成烧结状态在异常
状态下识别精度低,泛化性能差的问题。
[0007] 为解决上述技术问题,本发明所采用的技术方案是:考虑类别不平衡的回转窑烧结状态识别方法,包括以下步骤:
[0008] 步骤S1,采集回转窑的工况数据;[0009] 步骤S2,对热工信号进行特征提取,转化成用于分类的训练数据;[0010] 步骤S3,对预处理后的训练数据计算出核矩阵;[0011] 步骤S4,将核矩阵和训练数据进行ODM训练学习得到训练分类器C;[0012] 步骤S5,运用训练分类器C计算出训练样本到分类面的间隔,并计算出间隔均值;[0013] 步骤S6,根据计算的间隔和间隔均值,计算得到保角变换函数;[0014] 步骤S7,根据保角变换函数对核函数进行修正,得到新的核矩阵;[0015] 步骤S8,使用修正后的核矩阵进行ODM训练,得到分类器,可以识别出烧结状态是正常还是异常,然后采取相关措施。
[0016] 与现有技术相比,本发明的优点在于:[0017] (1)本发明将热工信号中的统计特征和动态特征相结合,动态特征的引入使烧结状态描述更加全面,可以有效提高烧结状态样品的可分性,并且能够有效的解决了回转窑
热工数据强耦合、大时滞的特点,使提取出的特征具有更好的可分性,进而提高烧结状态识
别的精度,避免识别错误导致的影响,有利于工厂的自动化生产。
[0018] (2)本发明能够在类别不均衡的情况下,有效的进行分类,避免了多数类对分类面的干扰,增加了欠烧和过烧两种不正常烧结状态的识别精度。这种分类识别方法,泛化能力
强,可以大大提高回转窑烧结状态的识别精度。
[0019] (3)本发明所构造的新的保角变换函数,能够有效提高分类器的数据可分性和泛化能力,构造时引入了不均衡参数,增加了少数类样本对分类器的影响,可以缓解由于数据
不均衡造成的少数类分类面偏移和检测精度下降的问题。
附图说明[0020] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。
[0021] 图1为本发明的分类算法在实施例的方法流程图。[0022] 图2为通过ODM和本文提出的方法KMODM得到各烧结状态的边缘分布比较图。[0023] 图3为在使用不均衡率为10的半月牙数据集上,本文提出的方法KMODM和ODM学习的分类面的比较图。
[0024] 图4(a)是李普希茨数与相关输入之间的折线示意图,注明了最后一个相关输入的位置。对热工信号进行相关时段分析,即Lipschitz方法,李普希茨数下降转折的位置就是
最后一个相关输入的位置。
[0025] 图4(b)是李普希茨数与相关输入之间的折线示意图,注明了第一个相关输入的位置。对热工信号进行相关时段分析,李普希茨数的第一个突变是输入就是第一个相关输入
的位置。
具体实施方式[0026] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本
发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实
施例,都属于本发明保护的范围。
[0027] 如图1所示,本发明实施例的考虑类别不平衡的回转窑烧结状态识别方法,具体步骤是:
[0028] 步骤S1,采集回转窑的工况数据;[0029] 步骤S2,对热工信号进行特征提取,转化成用于分类的训练数据;[0030] 步骤S3,对预处理后的数据计算出核矩阵;[0031] 步骤S4,将核矩阵和训练样本进行ODM(optimalmargindistributionmachine最优间隔分布机:一种在支持向量机最大化最小间隔原理基础上,考虑最优间隔分布进行
改进的分类方法)训练学习得到训练分类器C。
[0032] 步骤S5,运用训练分类器C计算出训练样本到分类面的间隔,并计算出间隔均值。[0033] 步骤S6,根据计算的间隔和间隔均值,计算得到保角变换函数。[0034] 步骤S7,根据保角变换函数对核函数进行修正,得到新的核矩阵。[0035] 步骤S8,使用修正后的核矩阵进行ODM训练,得到分类器。[0036] 进一步的,步骤S1,采集回转窑中八种热工信号,包括喂煤速度(CF)、投原料速度(RMF)、一次空气(PA)(一次空气又叫一次风,是指回转窑燃烧时,与煤粉混合一起送入炉膛
的空气;一次风对锅炉的燃烧起主导作用)、窑尾负压(NP)、窑头气体温度(KHT)、窑尾气体
温度(KTT)、主机电流(MDC)和烧结区火焰的温度(ST),如表1。
[0037] 表1回转窑的热工变量[0038] 变量 描述 单位CF 喂煤速率 t/h
RMF 投放原料速率 t/h
3
PA 一次空气 m/h
NP 窑尾负压 Pa
KHT 窑头气体温度 ℃
KTT 窑尾气体温度 ℃
MDC 主机电流 A
ST 用比色温度计测量烧结区火焰的温度 ℃
[0039] 步骤S2具体过程是:[0040] 步骤S2.1,对热工信号进行相关时段分析。[0041] 一般来说,输入信号的变化需要一段时间来改变系统的输出(例如,投放煤料的速度增加了,不会立刻导致温度的增加,需要等投放的煤料充分燃烧时才会导致温度的增
加)。为了估计输入变量(即八个热工信号,其中ST信号输入输出都是本身,是以本身为输入
输出求出的相关时段)的相关时间段的变化,采用了一种无模型的方法,即Lipschitz方法,
该方法首先用于确定非线性系统的阶数,改进方法可用于估计复杂非线性系统的输入延
迟。Lipschitz方法的估计结果可以揭示第一个相关输入(FRI)和最后一个相关输入(LRI),
因此第一个和最后一个相关输入之间的时间段可以定义为相关时段(RP)。为了得到各输入
信号的相对速度,本发明建立了以单热工信号为输入,以单热工信号为输出的几个模型,求
出了每个热工信号的相关时段(RP)。
[0042] 首先通过下述公式:[0043][0044][0045] 其中, 是指加入s个热工信号XD所求得的李普希茨商,L(k)是李普希茨商,L(k)是所有 中第k大的商,s是热工信号XD的个数。XD(i)表示作为输入的热工信号XD中的第i
个数据,XD(j)表示作为输入的热工信号XD中的第j个数据,XD(i?s)表示作为输入的热工信
号XD中的第i?s个数据,XD(j?s)表示作为输入的热工信号XD中的第j?s个数据。XD属于{CF,
RMF,PA,NP,KHT,KTT,MDC,ST}八种热工信号之一。XRT(i)、XRT(j)表示作为模型输出的热工
s
信号RT中的第i个数据和第j个数据。L表示加入s个热工信号XD后,所求得的李普希茨数。
[0046] 随着加入模型中热工信号XD中的内容增加,即增加s,计算不同s值下的李普希兹s s
数L。随着s值的增大,可以画出s与李普希兹数L 之间的曲线关系图,通过在图上找出下降
转折点(如图4(a))上升转折点(如图4(b))。图4(a)可找出最后一个相关输入(LRI)。图4(b)
值第一次突然增加的地方称为第一个相关输入(FRI)。第一个相关输入(FRI)和最后一个相
关输入(LRI)之间的时间段就是该热工信号XD的相关时段(RP)。
[0047] 步骤S2.2,对热工信号进行打标,找出欠烧、过烧和正常三种工况时刻的数据,进行标签划分。具体是在所有热工信号中找出欠烧、过烧和正常的时刻点,再选取以该时刻为
末尾,截取之前一段相关时段DR内的时刻点,以这一段序列共同作为一个样本。
[0048] 步骤S2.3,提取热工信号的统计特征,统计特征包括平均值特征和趋势特征。[0049] 步骤S2.3.1,提取热工信号的平均值特征。[0050] 相关时段(RP)中各热工信号的平均值与烧结状态密切相关,通过式(1)计算相关时段(RP)中各热工信号的平均值:
[0051][0052] 其中,MD为热工信号XD的平均特征,XD为热工信号,XD(i)为XD中的第i个数据,DR为热工信号XD的RP,LDR是DR的长度,XD∈{CF,RMF,PA,NP,KHT,KTT,MDC,ST}。
[0053] 步骤S2.3.2,提取热工信号的趋势特征[0054] 热工信号趋势是烧结状态识别不可忽视的特征,它定义为由热工信号值线性拟合得到的斜率。线性拟合模型如下:
[0055] g(tD)=atD+b(2)[0056] 其中,a和b分别为拟合直线的斜率和截距,tD为热工信号XD对应的时刻。[0057] 拟合直线g(tD)与XD之间的误差通过最小化平均拟合损失来最小化:[0058][0059] 其中,tD(i)为热工信号XD相关时段内第i个数据对应的时刻,以相关时段起点为0时刻,XDR(i)为热工信号XD相关时段内的第i个数据。斜率a的最优值为趋势特征,本发明将
热工信号XD的趋势特征表示为AD。
[0060] 步骤S2.4,提取热工信号的动态特征,动态特征包括短时能量和样本熵特征。[0061] 步骤S2.4.1,提取短时能量特征[0062] 短时能量可以在短时间内分辨出信号的稳定性,在语音信号处理和识别中得到了广泛的应用。对于热工信号的短时能量定义为:
[0063][0064] 其中,En(t)为t时刻的短时能量,w()为窗口函数,Nc为窗口宽度,i表示从t?(Nc?1)时刻迭代到t时刻的一个迭代变量。
[0065] 根据专家经验,不同烧结状态下的热工信号稳定性存在显著差异。例如,在欠烧状态下,KHT的波动比其他状态下更为严重。因此,提取RP中热工信号的短时能量作为烧结状
态识别的特征。
[0066] 当矩形窗口w(n)定义为:[0067][0068] 其中,若n时刻在热工信号XD的相关时段内,则w(n)=1,否则为0。[0069] 将式(5)代入到式(4)中,RP中热工信号的短时能量ED由下式计算:[0070][0071] 步骤S2.4.2,提取样本熵特征[0072] 在故障诊断任务中,经常使用样本熵来分析信号的复杂度或提取相关特征。同样,在不同的烧结状态下,热工信号的复杂性也不同,可计算出RP中热工信号的样本熵来描述
它。
[0073] 对于时序热工信号 可以得到一组按序号顺序排列的m维向量向量Um(i)与Um(j)之间的最大距离定义为:
[0074][0075] 其中,Um(j)为Um向量中的第j个元素,i,j,k为Um向量中的元素位置。[0076] 此处的i与上文的i意思相同,i与j元素位置既可以相同也可以不同,上式只作为一个最大距离的定义计算方法,表示如何计算m维向量之间的最大距离,k表示从1到m?1的
一个迭代量。上式表示计算XD(i)与XD(j)两个向量之间的最大距离,先求m维每个维数之间
的差的绝对值,然后m个绝对值中的最大值就表示最大距离。
[0077] 对于给定的向量Um(i),满足{Um(j)|1≤j≤t?m,j≠i}条件的向量Um(i)和Um(j)之间的最大距离不大于给定阈值η的数表示为Bi。对于维数m,两个向量匹配m个点的概率定义
为:
[0078][0079] 则该热工信号的样本熵为:[0080][0081] 其中,Bm+1为Bm中m维数取m+1时的值。[0082] 各烧结状态样本由MD,AD,ED和SED四个特征组成,RP中各热工信号可表示为{MCF,...,MST,...,SECF,...,SEST}。由此可以得到训练样本Xtrai由N个包含{MCF,...,
MST,...,SECF,...,SEST}这些特征的向量组成的一个矩阵。N为训练样本个数。
[0083] 步骤S3选择RBF核作为核函数。根据式(10)计算训练样本的核矩阵K:[0084][0085] 其中,K(i,j)表示核矩阵K中的第i行j列的元素,Xtrain(i)、Xtrain(j)分别为训练样本Xtrain中的第i个样本和第j个样本,σ为RBF核中的参数。
[0086] 步骤S4,一般情况下,用于判别欠烧、过烧和正常三种状态的分类器可以表示为即训练数据通过映射函数 映射到RBF核空间后,由分类器进行分离,径向
基(RBF)核函数能将原始空间映射到无穷维特征空间即RBF核空间。在RBF核空间中,样本之
间的相关关系可由核矩阵表示。其中y表示训练样本的标签, 表示实际训练样本空间到
RBF核空间的映射函数,映射函数与核矩阵的关系为 xi为Xtrain的第i个
训练样本的特征向量,xj为Xtrain的第j个训练样本的特征向量,T表示ω向量的转置。(xi,yi)
样本的边际可定义为:
[0087][0088] 其中,f()表示计算间隔关于xi的函数,γi中定义(xi,yi)样本的间隔,xi为Xtrain的第i个训练样本的特征向量,yi为Xtrain中的第i个训练样本的标签。
[0089] 间隔均值可以表示为:[0090][0091] 其中,ω为线性分类器中的系数;然后通过计算每个样本的间隔与间隔均值之间的差值,得到间隔方差如下:
[0092][0093] yi为Xtrain中的第i个训练样本的标签,N为训练样本个数。[0094] 考虑到间隔均值和间隔方差的计算效率较低,通过缩放将边缘均值设置为1。通过最小化边际方差,优化边际分布,表示ODM的目标函数为:
[0095][0096] 其中,ξi、εi分别为xi样本的间隔与间隔均值的下界偏差、xi样本的间隔与间隔均值的上界偏差,S为ODM的稀疏参数,决定哪些样本是支持向量,C1和C2为惩罚参数,C1和C2分
别控制ξi和εi在目标函数中的权重,C1作为分类器间隔下界错分的惩罚,C2作为分类器间隔
上界错分的惩罚,N为训练样本个数。
[0097] 得到了ODM分类器凸函数形式,进行ODM训练,ODM训练输入是训练样本Xtrain和训练样本标签y,输出是计算Xtrain间隔的函数f()。
[0098] 步骤S5,当ODM学习训练结束后,就得到了一个训练好的分类面,将每个回转窑数据样本代入式(15)中即可求出样本到分类面的间隔:
[0099][0100] 其中,Xtrain(j)为第j个训练样本,Xtrain(i)为第i个训练样本,yj为Xtrain中的第j个训练样本的标签,yi为Xtrain中的第i个训练样本的标签,K(Xtrain(i),Xtrain(j))为K核矩阵中
训练样本Xtrain(i)对应的行和训练样本Xtrain(j)对应列的元素。α为训练后得到的分类面系
数,f(x)表示计算间隔关于x的函数:
[0101] 之后根据式(16)计算间隔均值:[0102][0103] 其中,为间隔均值,∑f(Xtrain(i))为所有训练样本间隔之和,N为训练样本个数。[0104] 步骤S6,计算保角变换函数具体步骤为:[0105][0106] 其中,S是ODM的稀疏参数,f(Xtrain)和 分别表示间隔和间隔均值。Kn和Kf为特征空间中控制不同区域体积膨胀系数的惩罚参数,Kn控制 区域内的体积膨
胀,Kf控制 区域内的体积膨胀。e为自然常数。NIR为训练样本的不平衡
比(IR),控制不同标签样本的空间膨胀系数定义为:
[0107][0108] 其中,Xtrain表示训练样本,X+为多数类样本,X?为少数类样本。n+和n?分别表示多数样本个数和少数样本个数。在本实例中,多数类样本为正常烧结状态样本,少数类样本为过
烧和欠烧烧结状态样本。
[0109] 步骤S7,求得向量d=(d1,d2,...,dN)T表示由公式(17)计算得到的一个N维向量,di=D(Xtrain(i)),i=1,…,N。i=1,…,N时,di表示N维向量d中的d1,d2,...,dN个元素,N为训
T T
练样本个数,dd是d与d 的矩阵相乘,结果是一个N行N列的正(半)定矩阵。修正后的新核矩
T
阵可以由下列矩阵形式保角变换公式求得,为dd和K组成的一个哈达玛积:
[0110] Knew=ddT*K(19)[0111] 其中,Knew为通过保角变换修正后的新的核矩阵。[0112] 由于ODM的原有效核矩阵是一个正(半)定矩阵。根据舒尔定理,可以很容易地证明它是一个正(半)定矩阵,从而证明它是一个有效的核矩阵(Mercer定理)。
[0113] 步骤S8,将Knew替换步骤S3中公式(10)计算得到的核矩阵K,再进行ODM训练,可以得到分类器 由于ODM分类器属于二分类。本实例中有欠烧、过烧和正常
三个标签,要重复进行上述S3?S7步骤两次,训练出两个分类器。第一次训练将欠烧和过烧
的样本标签设为1,正常样本标签设为?1,得到分类器一。第二次训练将正常样本剔除,在欠
烧和过烧之间训练分类器。将欠烧样本标签设为1,过烧样本设为?1,得到分类器二。通过两
个分类器,特征提取后热工信号的数据的烧结状态可以得到有效的识别。将特征提取后热
工信号的数据替换掉分类器中的Xtrain,求出对应的样本标签。先通过分类器一识别出烧结
状态是正常还是异常(欠烧、过烧)。若为异常烧结状态,再通过分类器二判断出是欠烧还是
过烧。若是欠烧则需要采取相关措施,如适当增加喂煤量。若是过烧也需要采取相关措施,
如适当减少喂煤量。
[0114] 本发明设计了一个新的保角变换函数,并在ODM分类器的基础上进行核修正。针对类别不均衡的数据有更好的分类效果和更好的泛化性能。在保角变换函数构造中,加入优
化参数Kn和Kf,可以放大初始分界附近区域的膨胀系数,从而间接提高类边界的空间分辨
率,可以有效地提高分类器的数据可分性和泛化性能。引入参数NIR来反映训练数据的IR,可
以对少数样本自动赋值。这样增加了这些少数样品对最终分类器的影响。可以缓解由于数
据不平衡而导致的少数类分离偏移和检测精度下降的问题。
[0115] 分别利用统计特征和本发明提出的方法两种特征提取方法分别进行欠烧、过烧、正常三类数据进行特征提取,并记录各分类模型的性能。对比的方法有mcSM、mcODM、ODM、
PIBoost、FIECOC、DOO、DECOC、WKSMOTE、BAdaCos、LCSDM、FocalNN。每个分类器使用不同特
征的实验重复30次,F1得分的均值和标准差如表1所示。括号内的数字代表标准差,粗体数
据是最好的结果。
[0116] 表1不同分类器使用分别使用两种特征提取方法所得到平均识别精度的比较[0117][0118] 对比使用不同特征的烧结状态下各模型的识别精度,可以看出,在大多数情况下,引入动态特征可以将整体识别精度提高2%以上。说明本发明中动态特征的引入使烧结状
态描述更加全面,可以有效提高烧结状态样品的可分性。从而证明了所提取的动态特征的
有效性。
[0119] 从各烧结状态的识别精度可以看出,由于欠烧样品与正常样品的可分性较低,因此mcSM获得的欠烧状态识别率最低。通过优化训练样本的边缘分布,mcODM、LCSDM和KMODM
可以获得更合理的分选器,提高欠烧样本的检出率。特别是本发明的KMODM继承了ODM强大
的分类能力,通过修改其内核函数提高了处理类不平衡数据的能力。因此,它的欠烧检出率
比其他方法至少提高了4%。
[0120] 此外,由于mcSM、mcODM和ODM没有考虑到数据不均衡的影响,所以它们对正常情况的识别率远远高于对异常情况的识别率。但是,考虑训练数据分布不均衡的KMODM等分类
器可以显著提高两种异常情况的识别精度,获得更高的整体检出率。其中FIECOC、DECOC、
LCSDM和KMODM的整体识别正确率均在86%以上,特别是提出的KMODM的识别正确率在90%
左右。出现这种情况的原因是,反映不平衡度的参数N被嵌入到所提出的保角变换函数中。
使用保形函数来修改RBF核的ODM,膨胀系数小的少数类样本位于核空间的地区被压缩,分
类面被迫向多数类地区偏移,因此少数类的边缘分布优化和提高检测精度。其他依赖于数
据预处理或代价敏感方法的分类器无法优化样本在核空间中的空间分布,得到的分类超平
面更接近于少数类,因此很难准确识别测试数据集中的异常情况。
[0121] 图2显示了在回转窑欠烧、过烧、正常三种样本数据上,KMODM方法与ODM方法的比较。样本的边际分布可以反映分类器的泛化性能。边际分布越好,模型的泛化性能越好。
KMODM和ODM各烧结状态的边缘分布如图3所示。图中x轴表示KMODM和ODM得到的训练样本的
间隔,y轴表示每个间隔的统计频率。由此可见,KMODM得到的异常情况的边缘分布要大于
ODM得到的异常情况的边缘分布。KMODM正常状态的边缘分布与ODM相似。也就是说,本发明
KMODM的方法可以实现更好的边缘分布,对于异常情况的识别将会更加准确。
[0122] 图3表示在使用不均衡率为10的半月牙数据集上,KMODM和ODM学习的分类面的比较,以说明所提模型的有效性。在该图中,ODM的分隔符严重倾向于少数类。然而,所提出的
KMODM采用核修正法,因此可以减轻分类器的偏度。从而优化了边缘分布和少数类的检出
率。
[0123] 此外,为了验证所提出的KMODM模型对其他不平衡分类任务的适用性,还对UCI标准数据集的部分实验进行了记录。本发明采用F1评分来评估不同类别检出率的平衡程度,
计算方法为:
[0124][0125] 式中,TP为真阳性,FN为假阴性,FP为假阳性,recall为召回率,pre为准确率。[0126] 本实例还选择了5个多类标准UCI数据集来评估KMODM的性能。实验结果如表2所示。可以看出,mcSM、mcODM和ODM对大多数多类不平衡数据的结果都不理想。其他为不平衡
数据设计的分类器可以实现更高的平衡检出率和更好的F1分数。提出的KMODM算法在大多
数数据集上都取得了最好的结果。通过分析KMODM在二维可视化数据和UCI标准数据集上的
性能,可以得出KMODM模型能够有效地处理不平衡数据分类任务的结论。
[0127] 表2基于RBF核的KMODM与其他算法在F1评价标准在多类数据集上的均值和标准差比较
[0128]Dataset hayes newthy balance car thyroid
mcSM 78.3±2.0 91.5±2.8 65.7±2.5 95.2±2.8 63.1±2.3
mcODM 81.2±1.9 92.3±2.5 67.4±1.9 96.0±2.3 65.4±2.2
ODM 78.7±2.4 90.6±2.9 66.7±1.8 95.0±1.5 63.5±1.6
PIBoost 78.4±2.0 93.3±2.2 68.4±1.9 96.3±2.4 68.6±2.8
FIECOC 78.1±2.3 92.5±3.1 68.8±2.1 97.2±1.7 68.4±2.0
DOO 80.5±1.7 93.7±2.6 67.4±1.7 97.9±1.3 69.5±1.4
DECOC 81.7±2.1 94.3±3.0 70.6±2.3 98.4±2.7 70.5±2.0
WKSMOTE 80.2±2.6 92.6±3.5 68.2±3.0 97.1±2.2 67.7±2.5
BAdaCost 82.1±2.3 94.6±1.8 72.0±2.1 97.7±2.3 69.8±2.6
LCSDM 83.5±1.9 95.1±1.8 69.0±2.4 97.0±1.4 68.9±1.9
FocalNN 82.7±1.5 95.4±2.0 69.5±2.7 98.9±1.9 69.3±2.0
KMODM 85.9±2.0 97.9±2.1 69.7±1.8 99.1±1.2 72.9±6.3
[0129] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围
内。
声明:
“考虑类别不平衡的回转窑烧结状态识别方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)