本发明公开了一种多变量数据的特征选择新方法,适合分类与回归分析,属于化学计量学领域。该方法从样本和特征方向同时进行蒙特卡罗划分产生子模型,统计评价模型所产生的结果,以可视化的形式直观呈现出来,方便特征选择。具体包括以下几个步骤:1,从特征方向多次随机划分数据并构建模型,以分类或回归系数方法选择较多的最优特征;2,从样本方向多次划分新的数据,构造训练集和预测集,计算预测错误率或交互验证均方残差;3,统计分析结果的均值和方差,以均值对方差作图;4,分析图形中均值和方差均较小的区域内所构建的模型,统计所有特征在该区域内的出现次数,以此作为特征选择的依据。方法适合特征数目大、共线性程度高的数据分析。
声明:
“复杂多变量数据的特征选择新方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)