本发明提供了一种基于深度强化学习的物理层欺骗检测方法,主要解决现有物理层欺骗检测方法中对于动态未知的无线环境,信道模型或参数难获取,难准确地选择固定检测阈值的问题。其实现步骤为:1)建立欺骗攻击场景,接收方提取收发双方之间物理层信道信息表征物理层指纹特征;2)建立二进制假设检验模型;3)以动态的物理层指纹特征构建状态值,以阈值数值选择构建行为值,以贝叶斯风险函数作为瞬时效益函数,建立状态‑行为‑效益三元组;4)基于深度确定性策略梯度框架,设计检测阈值动态选择方法,对物理层欺骗攻击进行检测。本发明可以实现检测阈值的动态连续选择且对于动态未知环境具有自适应性,有效地检测物理层欺骗攻击。
声明:
“基于深度强化学习的物理层欺骗检测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)