本发明公开一种基于故障数据建模的HPC可靠性评估方法,包括以下步骤:对目标系统的所有故障单元,进行故障数据采集;基于故障严重等级,对采集到的故障数据进行故障分类,将故障数据分为严重故障数据与非严重故障数据;筛除与失效无关的非严重故障数据;选定时间区间,将该时间区间内的所有严重故障数据作为采样样本,采用最大似然估计法,计算weibull分布参数,获得该时间区间内的目标系统的失效时间分布模型;计算时间区间上的目标系统的MTTF,即weibull分布的特征值;根据不同时间区间的目标系统的MTTF变化,评估目标系统的可靠性变化特征。本发明能够真实反映系统运行中的可靠性指标,可以在线分析出系统在不同时间段的可靠性水平,指导系统容错和日常运维。
声明:
“基于故障数据建模的HPC可靠性评估方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)