本发明公开了一种空间精细操作的多任务强化学习基准平台设计方法,属于空间技术领域。本发明方法包括:搭建多任务空间操作的训练环境,构建多模态观测信息的提取基准,建立多任务空间操作学习的评价基准,将干扰变量总数、干扰变量摄动方差、接触动力学摄动方差等引入策略优化,可更好应对空间环境的多源干扰与非结构化特点。针对真实环境数据采样的高成本、低安全问题,本发明实现了机器人设置与真实环境相近的虚拟环境,利用虚拟环境数据采样代替真实环境数据采样,有利于提升算法的可复用性。
声明:
“空间精细操作的多任务强化学习基准平台设计方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)