本发明公开了一种基于深度强化学习的数据仪表板生成方法,包括:(1)将仪表板生成问题刻画为马尔可夫决策问题,即将马尔可夫决策问题中的状态空间视为由图表组成的仪表板,将动作空间视为对图表的操作动作和图表参数;(2)构建包含嵌入网络、决策网络和评价网络的深度强化学习模型;(3)构建仪表板特征,利用嵌入网络提取仪表板特征的共享嵌入向量,利用决策网络根据输入的共享嵌入特征经计算预测对图表的操作动作和图表参数选择,并计算决策网络获得的即时奖励,利用评价网络根据共享嵌入向量产生图表的操作动作和图表参数的预期回报;(4)根据图表操作和图表参数进行图表绘制以更新仪表板。该方法能够快速准确地生成仪表板。
声明:
“基于深度强化学习的数据仪表板生成方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)