本发明公开了一种基于强扰动检测与模型再训练的深度强化学习交通信号控制中毒防御方法,该方法首先利用强扰动获取输入数据中的后门数据,再对后门数据进行识别进一步确定异常数据点,最后可通过数据层面的防御将测试过程中异常数据的异常数据点进行去除,或是通过模型层面的防御将原始训练数据与反向触发器重构训练集对中毒模型进行忘却学习使得中毒模型忘却触发器引发的异常行为。本发明通过检测方法首先将异常交通状态数据筛选出来,只需在后门数据子集中寻找“反向触发器”而无需对所有输入数据进行计算,最后通过两个层面的防御方法对模型层面和数据层面进行防御,以此消除后门触发器带来的异常行为,提高交叉路口的车辆通行效率。
声明:
“基于强扰动检测与模型再训练的深度强化学习交通信号控制中毒防御方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)