一种不均衡数据下最优化学习样本合成算法选择及参数确定方法,以数据特征对诊断结果的贡献能力为出发点,分析样本均衡度对其区分能力的影响,提出以最大化特征区分能力为指标来选择样本合成采样算法。同时,构建激活函数来描述样本数量对分类能力的影响。在此基础上,提出有效特征区分度指标,并通过对该指标的最大化来获得最优样本均衡度。本发明所涉及的过程均以特征对样本的正确分类为目标,且仅需要对原始数据进行操作,可以在不增加样本采集及引入新特征的情况下获得更高的诊断效果。另外,没有特征数量方面要求,不会因为数据特征数量多少影响最终计算的最优样本均衡度的准确率。
声明:
“不均衡数据下最优化学习样本合成算法选择及参数确定方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)