权利要求
说明书
技术领域
本发明涉及数据压缩领域,具体涉及一种废气排放监控检测方法。
背景技术
随着社会的发展,工业废气排放量逐年递增。工业废气的排放不仅影响环境,还严重危害人们的身体健康。因此,对废气排放进行监控检测是非常有必要的。
现有的废气排放监控检测方法为:利用传统的霍夫曼编码方式对采集的废气数据进行压缩并传输,然后将压缩传输后的数据与国家废气浓度排放标准进行比较,实现对废气排放的监控检测。
然而,现有的废气排放监控检测方法是利用传统的霍夫曼编码方式对废气数据进行压缩。而传统的霍夫曼编码方式是根据数据出现的概率进行权重设置,容易造成重要数据的丢失,从而导致压缩传输后的数据不够准确,降低废气排放监控检测的准确度。
发明内容
本发明提供一种废气排放监控检测方法,以解决现有的废气排放监控检测方法准确度低的问题。
为达到上述目的,本发明采用如下技术方案,一种废气排放监控检测方法,包括:
获取采样周期内废气指标的浓度数据;
利用采样周期内每个数据与其相邻数据的差异值,得到采样周期内每个数据的累计值;
利用采样周期内每个数据的累计值占采样周期内所有数据的数量的比例,计算得到采样周期内每个数据的连续度;
利用废气指标的允许排放浓度标准、采样周期内每个数据、采样周期内所有数据的标准差,计算得到采样周期内每个数据的异常程度;
利用采样周期内每个数据的连续度和异常程度计算得到采样周期内每个数据的关注度权重值;
根据采样周期内每个数据的关注度权重值对采样周期内废气指标的浓度数据进行自适应霍夫曼编码,得到编码后的废气指标浓度数据;
将编码后的废气指标浓度数据传输到监控中与废气指标的允许排放浓度标准进行对比,对采样周期内废气指标的浓度数据进行监控。
所述一种废气排放监控检测方法,所述采样周期内每个数据的累计值是按照如下方式得到:
从采样周期内废气指标的浓度数据中任选一个数据作为第一数据,计算第一数据与其相邻数据的差异值的绝对值;
根据废气指标的允许排放浓度标准设置阈值;
利用阈值对第一数据与其相邻数据的差异值的绝对值进行判断:当第一数据与其相邻数据的差异值的绝对值小于等于阈值时,则将该相邻数据与第一数据划分为一个集合,得到第一集合;
将第一集合中第一数据的相邻数据作为第二数据,计算第二数据与其相邻数据的差异值的绝对值;
对第二数据与其相邻数据的差异值的绝对值进行判断:当第二数据与其相邻数据的差异值的绝对值小于等于阈值时,则将该相邻数据划入第一集合,得到更新后的第一集合;
按照上述方式不断迭代更新第一集合,直至更新后的第一集合中每个数据与其相邻数据的差异值的绝对值均大于阈值时,迭代停止,将迭代更新后的第一集合作为第二集合;
统计第二集合中的数据个数,将数据个数作为第一数据的累计值;
按照得到第一数据的累计值的方式得到采样周期内每个数据的累计值。
所述一种废气排放监控检测方法,所述采样周期内每个数据的异常程度是按照如下方式得到:
利用采样周期内每个数据、采样周期内所有数据的数量、废气指标的允许排放浓度标准,计算得到采样周期内所有数据的标准差;
利用废气指标的允许排放浓度标准、采样周期内每个数据、采样周期内所有数据的标准差,计算得到采样周期内每个数据的异常程度。
所述一种废气排放监控检测方法,所述采样周期内每个数据的异常程度的表达式如下:
式中, 表示第 个数据的异常程度, 表示第 个数据, 表示废气指标的允许排放浓度标准, 表示采样周期内所有数据的标准差, 表示双曲正切函数。
所述一种废气排放监控检测方法,所述采样周期内每个数据的关注度权重值是按照如下方式得到:
获取采样周期内所有数据的连续度最大值和最小值;
获取采样周期内所有数据的异常程度最大值和最小值;
利用采样周期内每个数据的连续度和异常程度、采样周期内所有数据的连续度最大值和异常程度最大值的乘积、采样周期内所有数据的连续度最小值和异常程度最小值的乘积,计算得到采样周期内每个数据的关注度权重值。
所述一种废气排放监控检测方法,所述采样周期内每个数据的关注度权重值的表达式如下:
式中, 表示采样周期内第 个数据的关注度权重值, 表示采样周期内第 个数据的连续度, 表示采样周期内第 个数据的异常程度, 表示采样周期内所有数据的连续度最大值和异常程度最大值的乘积, 表示采样周期内所有数据的连续度最小值和异常程度最小值的乘积。
所述一种废气排放监控检测方法,所述对采样周期内废气指标的浓度数据进行监控的过程具体如下:
将编码后的废气指标浓度数据与废气指标的允许排放浓度标准进行对比:当编码后的废气指标浓度数据大于废气指标的允许排放浓度标准时,则废气指标浓度数据异常;当编码后的废气指标浓度数据小于等于废气指标的允许排放浓度标准时,则废气指标浓度数据正常;
对异常的废气指标浓度数据进行判断:当异常的废气指标浓度数据连续出现且数据未发生变化时,则判断数据传感器发生损坏;当异常的废气指标浓度数据零星出现时,则判断数据传感器不稳定;当异常的废气指标浓度数据连续出现且呈现逐渐变化的趋势时,则判断废气指标浓度超标。
本发明的有益效果是:本发明根据废气数据的特性,计算得到每个数据的关注度权重值。利用每个数据的关注度权重值对废气数据进行自适应霍夫曼编码。相较于传统的霍夫曼编码方式,本发明根据废气数据的重要程度进行自适应霍夫曼编码,可以防止重要数据的丢失,使得压缩传输后的数据更完整、更准确,有效提高了废气排放监控检测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种废气排放监控检测方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是:本发明根据采集的传感器数据的特性,并结合国家废气排放标准,得到每个数据的连续度和异常程度。利用每个数据的连续度以及异常程度对数据的关注度进行评估。然后根据每个数据的关注度进行自适应霍夫曼编码,在数据压缩编码过程中,防止重要数据的丢失。将压缩传输后的数据与国家废气浓度排放标准进行比较,实现对废气排放的监控检测。
由于布设的传感器数据量庞大,且受到网络带宽的影响,容易在数据压缩传输的过程中造成重要数据的丢失。因此,本发明提供一种废气排放监控检测方法,针对废气排放数据的自适应数据压缩方法,使得压缩传输后的数据更完整、更准确,有效提高了废气排放监控检测的准确度。
本发明的一种废气排放监控检测方法的实施例,如图1所示,包括:
S101、获取采样周期内废气指标的浓度数据。
首先在设备的排气口处安装多个传感器,用于获取采样周期内废气指标的浓度数据。其中,采集周期内所有数据的数量为 。
S102、利用采样周期内每个数据与其相邻数据的差异值,得到采样周期内每个数据的累计值。
需要说明的是:为了实现自适应霍夫曼编码,即根据数据特性给每个数据分配霍夫曼编码中的权重值,首先计算数据的连续度以及异常程度用于评估数据的重要程度。
根据传感器数据与国家废气浓度排放标准的特性,计算每个数据的连续度以及异常程度,为下一步对每个数据进行自适应霍夫曼编码提供了基础。
由于传感器运行环境的变化、传感器性能不稳定或产生故障等原因,会在采集的数据中产生异常数据,而这些异常数据中不仅包含一些重要的数据,比如由于设备排放废气中的二氧化硫浓度增大导致的异常数据,还包含一些其他数据,比如由于传感器不稳定或者损坏导致的异常数据。由于不同原因导致的异常数据的重要程度不同,因此在进行数据自适应压缩之前需要先评估异常数据的重要程度。
重要数据,往往是连续出现、持续时间较长的,且重要数据与所有数据的均值差异较大。不同于离群数据,重要数据是逐渐变化的。其他数据,存在两种情况,一种是离散的数据,这种数据只是零星的出现,属于传感器不稳定产生的;另一种是连续的数据,但是这些连续的数据不存在差异,即随着时间的变化,数据不发生变化,该种数据属于传感器损坏产生的。
因此,本实施例结合传感器数据的连续度、异常程度和设备工况数据,对正常数据、异常数据中的重要数据和其他数据进行识别。并根据连续度以及异常程度计算得到当前采样周期内每个数据的关注度权重值。
数据的连续度指的是相邻数据之间,数据值差异较小的情况持续的时间在采样周期内的比例。采样周期内每个数据的连续度的获取过程具体如下:
任选第 个数据作为第一数据,即第 个时刻的数据为 。
设置数据差异值阈值 ,根据国家废气排放标准中的废气指标的允许排放浓度 来定,本实施例的建议值为 。
若第 个数据与相邻的第 个数据之间的差异值 ,则将第 个数据和第 个数据划分为一个集合,得到第一集合。
将第 个数据作为第二数据,若第 个数据与相邻的第 个数据之间的差异值 ,则将第 个数据划分到第一集合中,得到更新后的第一集合。
依此类推,不断迭代更新第一集合,直至更新后的第一集合中每个数据与其相邻数据的差异值的绝对值均大于数据差异值阈值时,迭代停止,将迭代更新后的第一集合作为第二集合。
统计第二集合中的数据个数,将数据个数作为第一数据的累计值。至此,得到第 个数据的累计值,用于表征满足阈值条件连续出现的次数。
S103、利用采样周期内每个数据的累计值占采样周期内所有数据的数量的比例,计算得到采样周期内每个数据的连续度。
则第 个数据的连续度的计算表达式为:
式中, 表示第 个数据的连续度, 表示第 个数据的累计值, 表示采集周期内所有数据的数量。其中 用来表征第 个数据的连续性,即表征第 个数据是否为连续性的变化,也用来反映第 个数据是否为突变的数据。连续度越大,则表明数据 的连续性越大,为突变数据的概率就越小。
S104、利用废气指标的允许排放浓度标准、采样周期内每个数据、采样周期内所有数据的标准差,计算得到采样周期内每个数据的异常程度。
数据的异常程度指的是数据与国家废气排放标准之间的差异。通过先验知识可以得知,传感器采集的数据一般符合高斯分布或近似高斯分布,具有统计学意义。根据高斯分布的 法则可以得知,数据中的异常数据分布在 之外,其中, 为所有数据的均值, 为所有数据的标准差。因此本实施例通过引入废气指标的允许排放浓度标准 ,计算传感器数据的异常程度。根据 法则,采样周期内所有数据的标准差的计算表达式为:
式中, 表示第 个数据, 表示废气指标的允许排放浓度标准, 表示采集周期内所有数据的数量, 表示采样周期内所有数据的标准差。标准差的计算公式是公知常识,此处通过计算采样周期内所有数据的标准差,用于得到正常数据的分布范围,进而得到异常数据的分布范围。
则第 个数据的异常程度的计算表达式为:
式中, 表示第 个数据的异常程度, 表示第 个数据, 表示废气指标的允许排放浓度标准, 表示采样周期内所有数据的标准差, 表示双曲正切函数。第 个数据的异常程度表征该数据距离国家废气排放标准的差异,若大于国家废气排放标准,则该数据为异常数据,且越大越异常;若小于国家废气排放标准,则该数据为正常数据。根据 法则,传感器数据中的异常数据分布在 之外,则表明若第 个数据与 的差距越大,第 个数据的异常程度就越大。若第 个数据小于 ,则表明该数据在国家废气排放标准内,则该数据的异常程度为0.0001。本实施例中仅考虑大于上界限的影响。
需要说明的是:根据 法则,数据中的异常数据应该分布在 之外,在计算正常数据的分布范围时,由于本实施例是为了废气排放监控检测,国家废气排放标准是国家设定的允许的废气排放量,因此本实施例中正常数据的均值应以国家标准为主。若使用采集数据的均值计算分布范围,明显不合适。例如若采集数据的均值较大,已经超过国家废气排放标准,则在计算异常数据时,就会得到错误的异常数据的分布范围。
S105、利用采样周期内每个数据的连续度和异常程度计算得到采样周期内每个数据的关注度权重值。
需要说明的是:根据每个数据的连续度与异常程度进行关注度权重值计算,关注度权重值与连续度和异常程度的乘积呈正比关系。将重要数据的关注度权重值设置最大,正常数据的关注度权重值设置最小,其他数据的关注度权重值设置为次大。
通过上述步骤,得到了采样周期内每个数据的连续度与异常程度。为了实现对采样周期内的数据进行自适应霍夫曼编码,需要计算采样周期内每个数据的关注度权重值,并根据每个数据的关注度权重值进行自适应霍夫曼编码。
首先需要对采样周期内每个数据分配关注度权重值,而数据的关注度权重值与数据的重要程度有关。对重要数据分配最大的关注度权重值,重要数据的连续度与异常程度都较大;对正常数据分配最小的关注度权重值,正常数据的连续度较大,异常程度接近于0;对其他数据分配较小的关注度权重值,其他数据的连续度较小,异常程度较大。通过上述分析,可以得到每个数据分配的关注度权重值与数据的连续度和异常程度的乘积呈正比。因此对于第 个数据分配的关注度权重值 的计算表达式为:
式中, 表示采样周期内第 个数据的关注度权重值, 表示采样周期内第 个数据的连续度, 表示采样周期内第 个数据的异常程度, 表示采样周期内所有数据的连续度最大值和异常程度最大值的乘积, 表示采样周期内所有数据的连续度最小值和异常程度最小值的乘积。关注度权重值用于表征第 个数据在进行霍夫曼编码时设置的权重值,关注度权重值越大,对应的霍夫曼编码算法中码长越短,则越不容易丢失。对于连续度大且异常程度也大的重要数据,本实施例认为这些数据是最重要的,不能丢失,则计算得到的关注度权重值很大,码长越短,越不容易丢失;对于连续度大但异常程度接近于0的正常数据,本实施例认为这些数据是不重要的,适当的可以丢失,则计算得到的关注度权重值很小,码长越长,可以适当丢失;对于连续度小但异常程度较大的其他数据来说,本实施例认为这些数据是次重要的,也不可以丢失,则计算得到的关注度权重值较大,码长较短,较不容易丢失。
至此,得到了采样周期内每个数据的关注度权重值。
S106、根据采样周期内每个数据的关注度权重值对采样周期内废气指标的浓度数据进行自适应霍夫曼编码,得到编码后的废气指标浓度数据。
根据每个数据的关注度权重值进行自适应霍夫曼编码。其中自适应霍夫曼编码的过程为:
将关注度权重值代替传统霍夫曼编码的概率权重值进行霍夫曼编码,将两个最小的关注度权重值进行加运算,得到新的权重值;
将新的权重值进行下一次最小值相加运算,直到到达根节点,从而建立霍夫曼编码树;
根据霍夫曼编码树的所有节点进行编码,用“0”和“1”分别表示编码树每一层的左节点和右节点。
至此,得到编码后的废气指标浓度数据。
S107、将编码后的废气指标浓度数据传输到监控中与废气指标的允许排放浓度标准进行对比,对采样周期内废气指标的浓度数据进行监控。
得到编码后的数据,将这些数据与废气指标的允许排放浓度标准进行对比,从而对采样周期内废气指标的浓度数据进行监控。
若编码后的数据大于废气指标的允许排放浓度标准,且呈现逐渐变化的趋势时,则进行系统预警,表明废气指标浓度超标;若编码后的数据大于废气指标的允许排放浓度标准,但零星出现时,则进行系统预警,表明传感器存在不稳定情况;
若编码后的数据大于废气指标的允许排放浓度标准,但数据在一定时间内未发生变化时,则进行系统预警,表明传感器存在损坏情况。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。