本发明涉及数据处理领域,其公开了一种基于深度强化学习的自适应博弈算法,包括如下步骤:(A)获取不同合作程度的策略;(B)生成不同合作程度的策略;(C)检测对手的合作策略;(D)制定不同的应对策略。本发明的有益效果是:利用训练出来的检测器和不同合作程度的策略,将已有的Tit for tat等思想实现运用在sequential social dilemmas中;提高了智能体agent的扩展性;更加直观的获取更优于自身的竞争策略。
声明:
“基于深度强化学习的自适应博弈算法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)