本申请提供了数据处理方法及装置、设备、存储介质;其中,所述数据处理方法包括:获取第一状态,所述第一状态包括用于反映无线信道质量的测量数据;基于训练后的强化学习模型,确定与所述第一状态对应的第一目标动作,所述第一目标动作包括影响物理层速率的参数的参数值;其中,所述第一目标动作用于向第一设备发送第一数据;所述训练后的强化学习模型是基于第二状态和与所述第二状态对应的第二目标动作的第一奖励训练得到的,所述第一奖励是至少基于所述第二目标动作发送第二数据时所达到的第一吞吐速率得到的。
声明:
“数据处理方法及装置、设备、存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)