一种基于强化学习的多用户图像数据自适应处理方法包括:分析多用户输出中存在的输出遮挡问题,针对输出遮挡问题设计输出策略;对输出控制问题进行建模得到自适应图像输出控制模型,根据输出策略设置行为动作及相应的奖励函数;在移动设备端收集环境信息,智能体与环境进行不断地交互,进行强化学习实现输出策略的自适应生成;移动设备接收到输出信息指令后收集状态信息;若当前状态信息符合输出策略,则直接输出;若不符合输出策略,则按照最终的输出控制模型输出的动作进行调整,将调整后的对象进行输出。本发明利用强化学习通过与环境的不断交互自适应的学习到所求的策略,避免隐私信息的泄露同时增加模型学习的信息量,从而增强模型的鲁棒性。
声明:
“基于强化学习的多用户图像数据自适应处理方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)