本发明公开一种基于云原生的强化学习流水线方法、系统、设备及存储介质;包括:基于系统框架和数据序列化协议,构建云原生存储系统;对原始数据集进行预处理,并将预处理的数据集存储至云原生存储系统;启动强化学习智能体和强化学习环境进行交互,产生轨迹数据,存储到轨迹缓存池,并构建强化学习自有数据集;调用轨迹缓存池的轨迹数据,更新强化学习智能体模型;保存更新完成的强化学习智能体模型到云原生存储系统中,构建模型推理服务;基于训练过程中的训练日志,构建日志可视化微服务,实时反馈智能体训练结果,并将结果保存到云原生存储系统。本发明能够提高决策分析场景中分布式训练、循环运行和云原生部署的可靠性、简便性和实用性。
声明:
“基于云原生的强化学习流水线方法、系统、设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)