本发明的各实施方式总体上涉及搜索安全测量来部署。具体地,描述了风险量化、策略搜索和自动安全策略部署。在一个或多个实施方式中,技术用于确定策略的安全性,诸如表示新策略将相对于当前部署的策略显示出增加的性能测量(例如,交互或转换)的置信等级。为了进行这种确定,利用强化学习和集中不等式,其生成和约束关于策略的性能测量的置信值并由此提供该性能的统计保证。这些技术可用于量化策略部署中的风险、基于估计性能和该估计中的置信等级选择策略用于部署(例如,其可以包括使用策略空间来减少数据处理量)、用于通过交互创建新策略(其中策略的参数被迭代调整并且评估这些调整的效果)等。
声明:
“搜索安全测量来部署” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)