当前位置：首页 > news >正文

网站策划运营浙江省交通建设工程监督管理局网站

news 2025/11/15 0:47:36

网站策划运营,浙江省交通建设工程监督管理局网站,修改wordpress的tag页,开发技术网站开发技术人工智能技术与咨询点击蓝字关注我们来源#xff1a;《人工智能与机器人研究》 #xff0c;作者华丰关键词: 不平衡工业时间序列#xff1b;异常检测#xff1b;生成对抗网络#xff1b;滚动轴承数据关注微信公众号#xff1a;人工智能技术与咨询。了解更多咨询《人工智能与机器人研究》作者华丰关键词: 不平衡工业时间序列异常检测生成对抗网络滚动轴承数据关注微信公众号人工智能技术与咨询。了解更多咨询摘要摘要: 在工业系统中普遍存在样本数据不平衡现象正常样本数量远远大于异常样本数量。而传统的机器学习算法和深度学习方法例如朴素贝叶斯和支持向量机在处理类不平衡问题时很难获得较高的识别分类准确率因为它们往往会偏向保证多数类的准确率。为此本文提出了一种基于生成对抗网络(GAN)的异常检测方法。这个方法中的生成器结构是“编码器–解码器–编码器”的三子网并且训练该生成器只需要从正常样本中提取特征所以训练数据集中就不需要异常样本。此系统的异常检测结果由样本的最终得分来判别其中异常分数由表观损失和潜在损失组成。本文方法的亮点在于可以实现在无异常样本训练的情况下对异常数据样本做检测通过系统生成更高的异常分数来诊断故障。本项目在凯斯西储大学(CWRU)获得的基准滚动轴承数据集上验证了该方法的可行性和有效性。本文提出的方法在数据集中区分异常样本与正常样本的准确率达到了100%。 1. 项目介绍异常检测对于现代工业系统的可靠性和安全性至关重要。及时准确的异常检测有助于预防重大事故的发生提高生产效率。然而工业生产中数据类不平衡的情况比较严重在正常条件下的样本比在异常条件下的样本普遍得多为准确诊断工业设备故障造成了巨大的障碍。此外工业系统总是具有非线性和不确定性这对模型训练提出了很大的挑战 [1]。工业异常检测的数据一般是不同传感器在一定时间内记录的电流、温度等物理信号也称为时间序列。对于工业异常检测领域时间序列通常作为训练模型的输入数据 [2]。一般以时间序列为输入异常检测框架通常分为特征提取和故障识别两个阶段。通过特征提取算法将时间序列预处理为低维特征向量送入故障检测器进行故障检测 [3]。机器学习算法作为一种强大的异常检测模式识别工具已经成为关注的焦点包括贝叶斯分类器、支持向量机方法等 [4]。上述方法都是假设基于类平衡的情况然而当数据分类不平衡时这些方法难以获得较高的精度 [5]。除了数据集的类均衡假设外标记数据也是训练阶段机器学习算法的关键。然而在许多实际的工业系统中来自异常情况下的样本数量往往很少。另外当系统在正常状态下运行了很长一段时间后突然出现异常要准确定位异常的发生时间是极其困难的 [6]。因此不准确的异常标签也会对异常检测的准确性产生不利的影响。当正常和异常的标签不平衡时机器学习方法的分类器会牺牲少数类来保证多数类的准确性这意味着分类结果会偏向于测试样本整体的正态性 [5]。但是对于工业系统中的异常检测我们应该特别关注那些处于少数情况的类如何能够准确捕捉和判别异常数据是当前工业系统中异常检测的重点。在2014年由Goodfellow等人提出的生成对抗网络(GAN)为解决工业中类不平衡问题提供了一个新的思路。这个网络模型最先出现在“Generative Adversarial Networks”一文中起初它被用于图像识别领域并取得了卓越的成绩 [7]。GAN的基本思想是通过一个具有随机数据点的生成器生成原型样本这些随机数据点满足一定的分布(如高斯分布)。在图像的异常诊断领域已经有一些基于GAN的具有竞争力的网络架构被提出如AnoGAN [8] 、BiGAN [9] 和GANomaly [10]。这些基于GAN的方法只训练正常图像的模型根据正常图像和异常图像的特征分布差异来区分异常图像。从这一点出发基于GAN的模型对于学习和识别不平衡数据集是有效的可以防止诊断结果偏向于多数类。然而在工业应用中基于GAN的异常检测方法非常少见。经过类似项目的调查研究发现依次有基于GAN网络的机械故障检测方法 [11] 和基于GAN的不平衡数据故障诊断方法 [12] 被提出。这些研究启发可以进一步研究GAN在工业故障检测方面的有效性特别是在没有异常数据的情况下。因此针对工业时间序列的特性本文基于GANomaly改善了生成器整体的损失函数以实现类不平衡场景的检测高精度。在这项工作中针对工业系统中异常数据的匮乏本文提出了一种基于GAN的方法来解决智能异常检测问题。这个方法的系统由一个生成器和一个判别器组成将生成器和判别器进行对抗训练得到训练后的模型来用于诊断。该系统的生成器基于卷积生成对抗网络采用“Encoder-Decoder-Encoder”为结构的三子网络。为了提高诊断性能在原始数据和GAN之间插入数据转换器对原始数据集进行预处理。通过在CWRU滚动轴承数据集的实验验证了该方法的可行性和有效性。本文的主要贡献如下 a) 针对工业领域的不平衡时间序列问题提出了一种新的基于GAN的异常检测方法。 b) 所提出的网络训练中只需要正常样本。这是一个比其他现有算法网络更贴合现实场景的网络。因为在真实的工业场景中异常样本的数量往往非常少。实验基于CWRU的滚动轴承基准数据集进行了训练和调整通过测试确保了该系统模型具有良好的诊断性能并进一步验证了本文方法的有效性使其可以作为解决工业数据类不平衡问题的新思路。 2. 项目背景 2.1. 深度学习用于智能故障诊断随着各种工业系统中产生的时间序列数据流越来越动态、复杂和庞大许多用于深度学习的异常检测技术得到了很好的发展。在调用这些深度学习模型的过程中它们被赋予学习目的但这并不意味它们清楚最终的输出特性是什么。这些黑箱旨在为特定的数据集提取特定的模式如长短时记忆网络(LSTM)递归神经网络(RNN)卷积神经网络(CNN)。虽然上述的这些深度学习模型在异常检测方面显现出了许多卓越的性能但在面对不平衡的数据集时其准确率仍然不能令人满意 [13]。此外由于数据表示的差异(如图像和时间序列)许多深度学习模型适用于图像领域但在工业领域往往难以实施和应用。 2.2. 类不平衡问题在基于不平衡时间序列的异常检测中通常会考虑两种主要方法数据级方法和算法级方法 [14]。数据级方法通常利用采样策略改变不平衡的数据分布其中广泛使用过采样和欠采样两种策略 [15]。算法级的方法一般采用调整分类器以适应不平衡的数据其中通常使用bagging和boost ensemble-based方法 [16]。具体的有Easy Ensemble [17] 和Balance Cascade [18] 算法被提出用于处理类不平衡问题。Easy Ensemble [17] 是通过多次从多数类样本有放回的随机抽取一部分样本生成多个子数据集将每个子集与少数类数据联合起来进行训练生成多个模型然后集合多个模型的结果进行判断。这种方法看起来和随机森林的原理很相似 [14]。Balance Cascade [17] 是通过一次随机欠采样产生训练集训练一个分类器对于那些分类正确的多数类样本不放回然后对这个剩下的多数类样本再次进行欠采样产生第二个训练集训练第二个分类器同样把分类正确的样本不放回以此类推直到满足某个停止条件最终的模型也是多个分类器的组合 [17]。 2.3. GAN和GANOMALY 近年来在类不平衡图像的异常检测中对抗训练尤其是GAN占据了越来越重要的地位。GAN最早由Goodfellow等人提出被认为是一种无监督机器学习算法在图像识别领域取得了突出的应用效果。GAN的网络结构如图1使用原始数据对生成器进行训练生成器(Generator)产生新的样本。生成器数据和真实训练数据输入到判别器(Discriminator)中训练得到能正确区分数据类型的判别器。判别器和生成器相互对抗生成器通过学习来产生更逼近真实数据的新样本用于欺骗判别器反之判别器也需要更好地区分生成数据与真实数据。自2014年以来基于GAN的对抗性算法层出不穷很多新的方法和框架被提出并取得了优秀的表现。 Figure 1. Structure of generate adversarial network 图1. 生成对抗网络结构在图像分类领域中Akcay等人提出了一种通用的异常检测体系结构GANomaly。与以往的先进方法相比该结构在多个基准图像数据集上具有显著的优越性和有效性 [10]给予我们在工业领域的异常检测一些启发。下面是对GANomaly的简要介绍。该模型中其生成器由“编码器–解码器–编码器”三子网构成训练半监督网络该结构使用深度卷积生成对抗网络(DCGAN) [18]并在生成器中使用三个损失函数来捕获输入图像和潜在空间中的特征。该算法的特点之一是不考虑异常样本并在图像数据集中实现了优异的异常检测性能。论文的其余结构如下。第三部分提出了基于GAN的异常检测框架。第四节和第五节分别介绍了实验装置和实验结果。第六部分为结论和未来工作。 3. 项目方法图2是本文提出的方法概述。图中可以看出在训练阶段这个系统模型只考虑正常样本。本文使用数据转换器来对样本进行处理并提取有用的特征这些特征经过转换可以更好的被模型学习。系统中生成器采用编码器–解码器–编码器三子网判别器则是基于DCGAN网络结构。在检测阶段异常样本可以通过比正常样本更高的异常分数来识别。 3.1. 方法介绍 Figure 2. The proposed method framework 图2. 本文方法框架在训练的步骤中用 DtrainDtrain 训练一个GAN-Based模型M。训练过程的目标是最小化 DtrainDtrain 中每个子数据集的输出。在训练过后用于测试的数据集 DtestDtest 将会放入模型M。训练后的生成器将对故障样本和正常样本进行相应的编码和解码。由于训练后的网络只学习了正常数据的可能表示模式如果用异常数据样本 DutestDtestu 作为输入那么模型M的输出与正常输入 DvtestDtestv 的输出相比会有很大的偏差。这个偏差值最终帮助确定异常样本的存在。 3.2. 训练的过程本文提出的方法中其训练阶段的主要目的是正常条件下生成尽可能小的样本分数的模型。本文方法的网络结构由数据转换器、生成器和判别器三部分组成。基本网络架构用DCGAN表示。在生成器的设计中开发了一种由“Encoder-Decoder-Encoder”组成的三子网。在将数据输入生成器之前需要设计一个数据转换器将一维的时间序列数据转为二维的图像数据可以帮助DCGAN更好的提取和学习样本特征。基于普适性原则不对原始数据进行其他处理因此任何时间序列都可以封装到这些特征中。在训练过程中首先在正常条件下提取时间序列的特征然后利用本文设计的异常检测器获得这些特征的数据分布和可能的代表模式。在测试阶段将异常样本输入训练好的异常检测器异常数据的特征分布会得到比正常样本更高的分数以此为差异来识别和诊断。 3.2.1. 生成器和判别器在生成器中第一个编码器用于学习样本原始特征F的表征第二个编码器用于生成再生特征F^。同时解码器 GdGd 用于试图重建F^。整个过程如下该生成器保证了原始特征集F的特征不变的同时可以得到潜在向量Z的模式。判别器(Discriminator)采用DCGAN中引入的标准判别器网络用于判断输入数据是真实的还是生成的。根据判别器的反馈再对生成器进行调整和训练。在定义了整个网络架构之后本文将称述如何定义训练的损失函数。 3.2.2. 目标函数在训练阶段因为只训练正常数据集 DtrainDtrain所以模型M只会获得正常数据集下的模式。但是在测试阶段M需要通过输出更高的异常分数来确定异常样本。那就意味着 GdGd 和 GeGe 将会解码潜在表示Z和重新编码F^这与在训练阶段获得的模式类似。之后F^和Z^将不可避免地与原来的F和Z产生差异这样有助于我们识别异常故障。由于生成器的结构是采用“Encoder-Decoder-Encoder”组成的三个子网络因此生成器的最终损失函数将由欺骗损失(Fraud Loss)、表面损失(Apparent Loss)和潜在损失(Latent Loss)三部分组成接下来将会分别对三个损失函数进行说明。欺骗损失在这里引入fraud loss的目的是为了诱导判别器将生成器生成的样本误判为真实的工业样本。将生成的样本输入判别器通过判别器输出计算的fraud loss公式如下 3.3. 测试步骤在测试阶段我们的模型使用潜在损失和表面损失对检测到的测试数据样本进行评分。判定样本分数的公式可以定义为在这一部分中我们使用 ωaωa ωlωl 的比率作为合适的加权值超参数 λλ意思是此处使用最好的训练结果即最小的生成器损失和判别器损失。因为本文提出的方法只在正常数据样本上训练异常检测器所以实验中的异常检测器将只学习和识别正常样本的潜在模式和数据分布。在这个判定公式中正常样本得到的T(F)将接近于0而对于异常样本公式得到的值将相对大很多。在测试中通过公式T(F)的值的波动可以很容易地找到异常。 4. 实验设置为了评估本文方法的可行性和有效性实验和测试将在凯斯西储大学(CWRU)获得的滚动轴承数据上进行实验台如图3所示。 Figure 3. Testing bed in CWRU 图3. CWRU实验台 4.1. 数据集描述这是一个基准轴承异常检测数据集通过在电机上使用加速度计测量轴承的振动信号得到。采用电火花加工方法对电机轴承进行了故障样本创建。分别在内滚道(IR)滚动部件(i.e. Ball)和外滚道(OR)创建了直径范围在0.007英寸到0.028英寸的故障点。故障轴承被重新安装到测试电机中并记录电机负载从0到3马力(电机速度从1720到1797 rpm)。数据集的采样频率为48 kHz每个数据集文件由三种类型的信号组成即驱动端加速度计信号、风扇端加速度计信号和基础加速度计信号。表1总结了实验中数据集的详细信息。 CWRU数据信号类型振动信号信噪比高采样频率(kHz) 48 运转速度(rmp) 1730175017721797 故障直径 0.0070.0140.0210.028 故障类型 IRORB Table 1. Data parameters collected by CWRU 表1. CWRU数据集的参数 4.1. 数据集处理我们将正常数据样本分为训练集和测试集两个部分。对于来源于CWRU的滚动轴承数据集得到的初始训练数据集 DtrainDtrain 都是传感器在一段时间t内记录的样本。这些数据可以写成矩阵型式在项目的实际训练中发现样本的数量以及样本的多样性需要得到进一步扩充因此采用了对初始数据进行分割的方法来处理数据集。将时间t内记录的样本进行分割依次取连续不间断的3136个数据点作为新样本。这个新数据样本是一个1 × 3136的矩阵 Dti[Xi1,Xi2,Xi3,⋯,Xi3136]Dti[Xi1,Xi2,Xi3,⋯,Xi3136]。然后将数据转换成4 × 28 × 28的矩阵此处可以理解为将一维的原始数据转变成了4张尺寸为1 × 28 × 28的图像数据作为输入模型的训练数据经过处理得到训练集 Dtrain∈Rt×bDtrain∈Rt×b (b是训练样本的数量)。众所周知GAN这一网络模型最初就是在图像识别领域展现了优异的性能因此对数据进行该项处理可以优化模型对样本特征的学习和提取。对应的测试样本是 Dtest[Dvtest,Dutest]∈Rt×(vu)Dtest[Dtestv,Dtestu]∈Rt×(vu)v和u分别是正常样本和异常样本的数量。所以这个项目的样本总数n可以表示为 nbvunbvu。在CWRU的数据集中实验使用正常状态条件下b 400的样本来训练异常检测器同时设置了v 541和u 383的没有标签的样本用于测试集。 4.3. 实施细节实验的具体实施放在PyTorch中并使用了Adam优化网络来实现本文提出的方法。首先设定训练模型的参数初始化学习率设为 lr0.0001lr0.0001动量 β1,β2β1,β2 的值分别设为0.5和0.999。对于两个数据集每个模型在训练时epochs都设为50batch-size即一次训练样本的数量设为32。本文提出的方法的具体网络结构在表2中进行了详细的说明。 Table 2. Model network structure 表2. 模型网络结构 Ks/S−1 Kernel Size/Stride. 5. 实验结果在实验时将凯斯西储大学(CWRU)收集的滚动轴承数据输入本文方法构建的系统中生成器经过训练集数据的训练生成初始的网络模型接着将生成器生成的样本输入判别器根据判别器反馈的结果对生成器进行新的训练直到判别器能成功被生成器生成的样本所欺骗此时生成器的训练收敛。接着调用生成器训练后的网络模型对测试样本进行测试得到并输出该样本数据的得分情况。所提出方法的CWRU数据集得分如图4所示。 Figure 4. CWRU data experimental results 图4. CWRU数据实验结果从这张输出结果图中可以看出因为滚动轴承的故障情况不同所以每种情况所得分值也明显不同。同时表示阈值的蓝色虚线清晰的分隔了正常和异常样本。红色的数值点是正常样本在生成器中的得分情况可以清楚的看出正常样本的Scores值区间小于0.02并总体呈均匀分布此处可以进一步验证该生成器的训练收敛了。图中紫色的点代表内滚道故障样本的得分情况该类型样本的整体分布较为混乱得分区间在[0.04, 0.06]之间。图中黄色的点代表外滚道故障样本的得分情况该类型的整体得分情况最为分散。此外图中绿色的点代表滚动部件故障样本的得分情况此故障的得分情况相较其余两种较为稳定得分区间在[0.08, 0.10]之间。该得分结果还表明滚动故障(图中的Ball fault)数据的模式与正常样本数据的模式最接近而外滚道故障(图中的OR fault)与正常数据模式的差异最大。 6. 项目结论本文提出了一种基于生成对抗网络(GAN)的针对工业时间序列不平衡的异常检测体系结构。与当前大多数的深度学习方法相比这种体系结构的特点是只需要使用正常的数据样本进行训练不用考虑工业系统中样本分类不均衡的问题。在异常检测之前我们根据本项目工业数据的特征和网络模型的特点设计了一个数据转换器。然后利用“Encoder-Decoder-Encoder”构建的生成器输出较大的异常分数来检测异常样本的存在。该网络结构在CWRU滚动轴承数据集上实现了100%的测试精度。随着工业领域技术的进步以及设备的计算能力和存储能力的提高工业中的传感器现在可以收集比以往更多更复杂的多元时间序列数据。在未来的工作中针对多元的时间序列数据如何将不同维度的信息进行融合或者如何对这些工业数据进行多进程的学习和识别会有更多的想法和尝试。关注微信公众号人工智能技术与咨询。了解更多咨询

查看全文

http://www.zqtcl.cn/news/583461/