所描述的是一种使用深度强化学习来生成环境特征的系统。该系统接收策略网络架构、初始化参数以及仿真环境,该仿真环境是对通过物理环境的目标系统的轨迹进行建模的。对从策略网络采样的地标特征进行初始化,并且通过使用强化学习算法对该策略网络进行训练来生成经训练的策略网络。使用经训练的策略网络来生成环境特征集并在显示设备上进行显示。
声明:
“生成环境特征的深度强化学习方法以用于计算机视觉系统的漏洞分析与改进性能” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)