本发明公开了一种基于用户体验分析的深度强化学习式智能门锁系统及装置。首先,我们设计出智能门锁系统的强化学习模型,并提出改进的线上线下强化学习算法,该算法对用户体验质量(QoE)分析,通过分析将搜索空间的状态‑行为对降维;其次,为克服强化学习带有的延迟奖励或者惩罚,而影响到后续学习过程,为此,我们采用带有临时记录功能的资格迹进行信用评分,从而避免强化学习中具有的延迟赏罚的弊端。最后,该算法作为核心模块,设计出智能门锁系统的装置,从而实现多元化、智能化学习式的开/关锁系统。避免了用户用人脸/指纹/密码开锁的费时费心的操作,增强门锁的智能化和人性化。
声明:
“基于用户体验分析的深度强化学习式智能门锁系统及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)