本发明涉及人工智能技术领域,提供一种车险报案风险预测方法、装置、电子设备及存储介质,搭建深度双Q网络作为强化学习模型的框架,基于多个历史车险报案数据确定强化学习模型的动作集、状态集及奖励值,从而利用动作集、状态集以及奖励值对强化学习模型进行迭代循环训练,在进行强化学习时通过经验回放的方式学习之前的环境,并对回放经验池进行随机采样,能够消除样本之间的相关性,增加了强化学习模型的稳定性,使得训练得到的车险报案风险预测模型的稳定性得到了增强,最后使用车险报案风险预测模型对当前车险报案数据进行风险预测,得到风险预测结果的准确度较高。
声明:
“车险报案风险预测方法、装置、电子设备及存储介质” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)