综述|设备状态监测中处理工业数据分布不平衡的重采样技术(上中下)
在实际工业场景中,机器大多数时间都处于正常工作状态,而故障状态下的时间则非常短。因此,收集到的故障数据非常有限,这导致了故障诊断数据集的不平衡,故障样本的数量远少于正常样本。此外,随着制造业的快速发展,机器设备变得越来越复杂,这使得收集的故障数据中存在噪声、类重叠、类内和类间不平衡、多类不平衡以及时间序列不平衡等问题。因此,解决这些问题已成为故障诊断领域的研究热点和难点,并出现了许多解决方法。本文将从数据预处理、特征提取以及分类器改进三个方面进行全面梳理。同时,还描述了不平衡数据分类方法在工业场景中的应用。最后,总结了不平衡数据分类研究领域面临的挑战,并提出了未来可能的研究方向。