作者:李天梅 司小胜 刘翔 裴洪
4. 统计数据驱动的剩余寿命预测
传统统计数据驱动的剩余寿命预测方法通过对设备失效时间数据统计分析, 构造寿命TT的分布函数, 由此设备在tt时刻的剩余寿命即为 T−t|T>t,zT−t|T>t,z, 其中zz代表该类设备的事件数据集(主要指失效时间数据), 然后通过分布拟合得到寿命TT的概率分布, 再通过上述条件随机变量的关系实现剩余寿命预测[110]. 然而, 随着生产制造水平的不断提升, 设备的可靠性逐步提高, 很难在短期内(即使是加速条件下)获得足够多的失效数据或对于昂贵的设备获取成本过高, 而且这类方法没有用到设备运行过程中的监测数据, 预测结果难以反映当前运行实际情况, 由此导致难以实现个体服役设备的精准健康管理.
相比之下, 随着信息技术和传感器技术的迅猛发展, 通过设备性能退化变量的监测数据, 建立描述设备性能演化过程的随机模型, 便可预测设备剩余寿命[111]. 这类方法以概率统计理论为基础, 在随机模型框架下建模性能退化变量演变规律, 以概率分布的形式给出剩余寿命分布的表达式, 不仅能得到剩余寿命的点估计, 而且能描述预测的不确定性(方差、置信区间等各种不确定性量化指标), 这对维修、替换、后勤保障等的科学决策极为重要, 因而已成为国内外研究的热点.
基于随机模型建模性能退化变量监测数据的关键是选择合适的随机模型, 常用的随机模型主要指各种随机过程模型, 包括Wiener过程、Gamma过程、Markov链、隐Markov过程和逆高斯过程等[112-115]. 这类方法采用随机过程描述性能退化变量的演变过程, 通过监测数据实现模型参数的估计, 基于此通过求解所建立的随机退化过程首达失效阈值时间的概率分布实现剩余寿命预测, 在剩余寿命预测不确定性量化方面具有天然优势. 从物理机制看, 设备退化是其内部应力和外部环境综合作用而引起的设备老化和性能衰变, 与采样时间和采样频率无关, 亦即设备的退化过程应该满足无限可分性. 迄今, 从数学上已证明满足无限可分性的随机过程模型只有Gamma过程、逆高斯过程和Wiener过程[116-117]. 因此, 利用这三类随机过程建立设备退化模型, 在数学上和物理上均具有较强的可解释性, 受到了国内外研究者的广泛关注[118-119]. 然而, 前两种随机过程都是单调随机过程, 只能描述单调退化, 例如磨损、疲劳裂纹增长等. 在实际中, 由于设备内部应力的吸收与释放、使用强度、使用频率、载荷大小、外界环境等的动态变化, 性能退化变量的监测信号往往呈现非单调波动的特点, 而Wiener过程是由Brownian运动驱动的一类扩散过程, 其增量独立且为高斯分布, 适合刻画非单调退化过程, 在退化测量信号的建模上更具灵活性, 因此广泛应用于滚动轴承、液晶显示器、激光器、惯性器件等的退化建模及剩余寿命预测. 2018年, Zhang等[120]系统全面地总结了基于Wiener过程的各种退化建模及剩余寿命预测方法最新研究进展情况.
目前, 这类基于随机过程的方法主要针对图2所示的完整监测数据, 且需要能够从监测数据中提取具有一定趋势特征的性能退化变量, 以确定所采用随机过程的参数化形式并基于监测数据实现随机过程模型参数辨识, 最终通过求解随机过程首达失效阈值时间的概率分布达到预测剩余寿命的目的. 根据建模过程中涉及的性能退化变量数目, 主要分为单变量模型和多变量模型两种情况.
单变量下随机退化设备剩余寿命预测研究得到了广泛关注和深入研究. Gebraeel等[121]以轴承振动数据为背景, 将设备退化数据演化过程描述为线性Wiener过程, 最早将Bayesian更新策略用于剩余寿命分布的在线递归预测. Huang等[122]通过采用时间尺度变换线性化技术研究了一类基于一般Wiener随机退化过程的剩余寿命预测问题, 提出了漂移系数自适应更新方法; 为处理本质非线性退化数据, Si等[123]提出了一类一般非线性扩散过程模型描述退化数据, 通过时间−空间变换, 得到了剩余寿命分布的解析形式, 并将所得结果应用于惯性平台的漂移退化和2017-T4铝合金的疲劳裂纹增长. 在文献[123]基础之上, 出现了诸多的理论扩展及应用研究[124-125]. 最新出版的学术专著 [126] 对基于Wiener过程及其变形开展的单变量下随机退化设备剩余寿命预测基础理论和方法, 从线性到非线性、从固定模式到切换模式进行了详细的论述.
在工程实际中, 设备存在运行工况、运行环境、运行负载多变等复杂运行模式, 反映设备性能退化的变量往往不止一个且相互关联, 呈现多性能退化变量的特点, 表征设备健康状态的性能退化指标往往并不唯一. 文献[127]在Bayesian框架下研究了多变量动态系统的可靠性估计问题, 但将各个变量单独建模, 未考虑多退化变量之间相互耦合的实际. 当前, 对多变量耦合的情况主要有两种思路. 第1种是基于Copula函数的方法. 其中, Copula函数是一种连接多维联合分布与一维边缘分布的特殊函数, 基于此函数, 多个相关退化量的联合分布可以通过每个退化量的边缘分布和Copula函数融合为一个整体分布[128]. Pan等[129]、Peng等[130]、刘胜南等[131]、张建勋等[132]采用不同的随机过程模型和Copula函数研究了多元退化变量的建模问题, 并用于剩余寿命预测. 然而, 基于Copula函数的方法成功应用的关键在于Copula函数的选择, 不同的退化数据常常适用于不同的Copula函数, 而且可供选择的Copula函数形式是非常有限的, 选择的过程有一定的主观性, 选择结果也不唯一, 因此这类方法难以对多个性能退化变量之间的相互作用关系进行合理的定量描述. 第2种是基于信息融合的方法. 这种方法的主要思路是在进行退化建模之前, 首先根据多维数据之间的关系, 通过优化、加权、融合滤波等方式, 将多维数据投影变换到一维数据上来, 提取一个单变量复合性能指标, 再应用已有针对单变量的方法对此一维数据进行建模和预测. 例如, Liu等先后提出了基于退化信号加权组合[133-134]、基于信号质量优化[135]、基于多源信息融合[136-137]的复合性能指标获取方法, 据此采用单变量退化建模方法实现剩余寿命预测. 此类方法的优点在于融合后的性能指标可以采用传统针对单变量的退化建模和剩余寿命预测方法. 然而, 在多维数据融合时其相互之间的关系一般难以界定, 使得融合后的指标难以全面反映整个设备的退化, 而且融合后的指标物理意义不明确, 导致退化失效阈值的确定成为一个新的难题.
通过以上文献分析可以看出, 统计数据驱动方法以概率统计理论为基础, 利用随机模型对监测数据进行建模, 进而对剩余寿命进行推断, 可以得到剩余寿命的概率分布, 在量化剩余寿命预测不确定性上具有天然优势, 且随机模型参数与设备退化失效过程紧密相关使得模型可解释性较强(如反映退化快慢的退化率参数、反映退化过程时变不确定性的扩散系数等), 因此得到了可靠性领域学者的大力推崇, 发展迅速. 但需要注意到的是, 无论是单变量下还是多变量下, 这类方法主要针对图2所示的完整监测数据且需要能够从监测数据中提取具有一定统计特征的退化趋势数据以实现参数化的演变轨迹建模. 然而, 在大数据时代, 通常采用传感器网络收集多物理源信号以全面反映设备状态, 由于多源信号差异大、采样策略形式多, 数据价值密度低, 导致数据质量参差不齐, 现有统计数据驱动的方法从大数据中提取退化特征信息如同大海捞针, 处理如图2所示的“碎片化、分段的、稀疏的”监测大数据更是难上加难, 没有良好统计特征的退化数据做输入, 这类方法必将迷失于浩瀚的数据海洋. 此外, 单变量下随机退化设备剩余寿命预测研究试图提取单一特征表征设备健康状态全貌的思路, 已与复杂运行条件下设备健康状态需从多维度表征的需求不相适应, 而现有多变量下随机退化设备剩余寿命预测问题的研究基本都是试图通过转换为单变量情况再来处理, 未充分考虑多性能退化变量相互耦合、相互影响的机制, 多变量耦合导致的剩余寿命分布求解难题仍未能得到有效解决. 因此, 针对大数据环境下随机退化设备的剩余寿命预测问题, 发展新的理论和方法势在必行.
5. 机器学习方法与统计数据驱动方法相结合的剩余寿命预测
通过第3节和第4节的文献分析可以看出, 以深度学习为代表的机器学习方法在监测大数据深层次特征自动提取、复杂结构数据拟合、非线性映射等方面具有强大的处理能力, 但很难得到体现剩余寿命预测不确定性的概率分布, 这与其强大的数据处理能力和学习能力还不相匹配. 统计数据驱动的方法虽能得到剩余寿命的概率分布、在量化剩余寿命预测不确定性上具有天然优势, 但对具有多源信号差异大、采样策略形式多、数据价值密度低、数据质量参差不齐等特点的监测大数据处理能力非常有限. 因此, 若能将机器学习方法与统计数据驱动方法相结合, 有望综合两者的优势、弥补各自局限性. 最近, 一些学者也开始了这方面的探索性研究. Deutsch等[138]将深度置信网络用于提取退化特征, 然后用随机退化模型表示特征的演变趋势, 利用粒子滤波算法实现模型更新, 并得到了剩余寿命概率分布的数值形式. 彭开香等[139]研究提出了一种基于深度置信网络的无监督健康指标构建方法, 并结合隐马尔可夫模型对特征进行建模用于剩余寿命预测. 进一步, 该方法被改进为深度置信网络与粒子滤波相结合的形式[140], 可以实现剩余寿命概率分布的数值计算. 最近, Hu等[141]利用深度置信网络的无监督学习特性构建性能退化指标, 然后采用非线性扩散过程建模性能退化指标演变趋势, 从而得到了剩余寿命的概率分布.
这些研究在做出了有益尝试的同时, 还存在不容忽视的局限性: 1)以上方法中深度网络用于特征提取而随机模型用于建模特征实现剩余寿命的概率分布输出, 但在实现过程中特征提取和模型建立是孤立进行的, 由此导致机器学习方法和统计数据驱动方法实际是简单的组合关系, 提取的深度退化特征能否适应并匹配所采用的随机模型仍是问题, 因为在特征提取过程中并没有考虑提取后采用何种形式的模型对其建模表征; 2)深度网络通常可以从监测大数据中提取深层次、多维度的退化特征, 但以上方法通过指标筛选技术从多维度特征中选择单个特征用于随机退化建模, 由此这类方法还存在第4节讨论的所选单一特征难以表征设备健康状态全貌、未考虑多变量耦合下剩余寿命分布求解等问题; 3)通过深度网络从大数据中提取的退化特征实际上是虚拟退化指标, 物理意义不明确, 由此导致这些退化指标所对应的失效阈值确定成为一个新的难题.
通过上述分析可见, 若能综合统计数据驱动方法在预测不确定性量化能力上的优势与机器学习方法在大数据处理能力上的优势, 实现交互联动、交叉融合、强强联合, 发展大数据环境下随机退化设备剩余寿命预测新理论与新方法, 有望为大数据时代设备剩余寿命预测与健康管理打造一把利器. 然而, 现有为数不多的综合机器学习方法和统计数据驱动方法的剩余寿命预测研究中, 基于监测数据的退化特征提取过程与所提取特征的随机过程建模是孤立进行的, 由此导致机器学习方法和统计数据驱动方法实际上是简单的组合关系. 此外, 这些研究中提取退化特征的过程中主要关注了特征本身的特性(如单调性、趋势性等), 但如此提取的特征能否适应并匹配所采用的随机过程模型并不能保证. 因此, 发展大数据下退化特征提取与随机退化建模交互联动的剩余寿命预测方法, 将有助于形成大数据下剩余寿命预测研究的新模式.
了解更多信息请关注:人工智能技术与咨询