用于训练基于强化学习模型来检测恶意软件的系统的技术。这样的已训练系统检测文件是恶意文件还是良性文件,并且确定在这种检测中停止文件执行的最佳时间。强化学习模型与事件分类器和文件分类器相结合可以学习到是在已观察到足够的状态信息之后停止执行,还是在需要更多事件来做出高置信的确定时继续执行。所公开的算法允许系统基于每个文件来决定何时停止。
声明:
“针对用于检测恶意软件的深度强化学习技术的训练技术” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)