• 中国科技核心期刊(中国科技论文统计源期刊)

基于轻量化特征增强网络的焊缝缺陷检测方法

傅留虎

傅留虎. 基于轻量化特征增强网络的焊缝缺陷检测方法[J]. 焊接, 2024(7):38 − 49, 57. DOI: 10.12073/j.hj.20240307002
引用本文: 傅留虎. 基于轻量化特征增强网络的焊缝缺陷检测方法[J]. 焊接, 2024(7):38 − 49, 57. DOI: 10.12073/j.hj.20240307002
Fu Liuhu. Weld defect detection method based on lightweight feature enhancement network[J]. Welding & Joining, 2024(7):38 − 49, 57. DOI: 10.12073/j.hj.20240307002
Citation: Fu Liuhu. Weld defect detection method based on lightweight feature enhancement network[J]. Welding & Joining, 2024(7):38 − 49, 57. DOI: 10.12073/j.hj.20240307002

基于轻量化特征增强网络的焊缝缺陷检测方法

基金项目: 山西省基础研究计划(自由探索类)项目(自然科学研究面上项目)(20210302123216)
详细信息
    作者简介:

    傅留虎,硕士,高级工程师;中国机械总院集团“百人计划”优秀复合型人才;主要从事检验检测方面的工作;研发了10个专利,已发表论文10余篇;fuliuhu@126.com

  • 中图分类号: TG409

Weld defect detection method based on lightweight feature enhancement network

  • 摘要:
    目的 

    为进一步提高深度特征增强模型对焊缝超声信号的特征完备性、关联性表达及模型超参数自适应全局优化效率,该文开展了基于轻量化特征增强网络的焊缝缺陷检测方法研究。

    方法 

    通过构建焊缝缺陷检测模型,丰富了焊缝特征及不同空间域特征的关联性表征;引入基于全局寻优策略改良的麻雀搜索算法,进一步提高模型超参数自适应寻优的效率和性能;同时使用改良后的优化算法对所构建模型的所需的4个关键模型参数进行自适应寻优,最终构建出适用于焊缝缺陷空间域特征且具备自学习能力的检测模型。

    结果 

    试验结果表明,该文模型在识别准确率为95.54%的情况下,对单个样品的平均测试时间仅为1.4 ms,较其他基线模型取得了更好的检测效果,可满足不锈钢焊缝缺陷在线实时识别要求,验证了其有效性和泛化性。

    结论 

    该方法减少了人工网络设计对参数、性能、学习能力、成本消耗的影响,可广泛用于不同缺陷检测行业自动模型构建研究中,为工业现代化提供了有利的技术支持与保障。

    Abstract:

    [Objective] In order to further improve feature completeness and correlation expression of depth feature enhancement model for ultrasonic signals of welds and global optimization efficiency of model parameter adaptation, a weld defect detection method based on lightweight feature enhancement network was carried out in this paper. [Methods] By constructing weld defect detection model, correlation characterization of weld characteristics and different spatial features was enriched. Sparrow search algorithm based on global optimization strategy was introduced to further improve efficiency and performance of parameter adaptive optimization. At the same time, the improved optimization algorithm was used to self-optimize four key model parameters required by the constructed model, and finally the detection model suitable for spatial characteristics of weld defects with self-learning ability was constructed. [Results] The experimental results showed that the proposed model had a recognition accuracy of 95.54%, and average test time of a single sample was only 1.4 ms, which achieved better detection effect than other baseline models, and could meet requirements of online real-time identification of stainless steel weld defects, verifying its effectiveness and generalization. [Conclusion] This method reduced impact of artificial network design on parameters, performance, learning ability and cost consumption, and could be widely used in researching automatic model construction in different defect detection industries, which provided favorable technical support and guarantee for industrial modernization.

  • 奥氏体不锈钢作为一种重要国家资源,在建筑、汽车、航空航天等领域中使用广泛,但在不锈钢工件焊接过程中,由于局部不可见性,焊缝常会产生夹渣、未焊透、未熔合等缺陷,会对工业生产和人身安全造成很大威胁,随着对各种钢铁工业设备需求的增加,由此产生的安全问题越来越突出。因此,快速及时检测出不锈钢焊缝内部缺陷是当前重中之重,超声波焊缝缺陷自动检测是目前非破坏性技术中用于检测焊缝缺陷最多的一种。

    传统的焊缝缺陷检测大都是基于机器学习的人工焊缝缺陷特征提取方法,与传统的手工检查相比,具有高效和准确的优点。例如,Song等学者[1]提出了一种邻域评价完备局部二值模式的噪声鲁棒特征描述器,在东北大学缺陷数据集NEU-CLS上,通过支持向量机对缺陷类型进行检测,最终取得不错的效果。Xiao等学者[2]首先基于灰度共现矩阵和Gabor滤波器进行特征提取,然后在NEU-CLS数据集上使用贝叶斯核进化分类器进行表面缺陷分类。然而,大多数基于机器学习的方法需对焊缝缺陷图片做精密的缺陷标记工作,严重依赖于设计师的主观经验[3],而由此产生的手工设计的特性并不具有较高的通用性。所以,这些方法对表面瑕疵的不同类型难以适应,局限性相当大。

    随着在图像分类方面卷积神经网络深度学习显示出的优势,学者们在自动化检测缺陷方面开始尝试应用他们的技术。Tang等学者[4]提出了一种基于改进一维卷积神经网络的超声波引导波管裂缝识别模型,该模型采用多尺寸卷积核代替传统的单尺寸核。可有效提取裂纹信息,实现端到端识别。王睿等学者[5]提出了一种基于轻量级倒残差结构的YOLO-M模型,该方法利用多尺度预测机制对焊缝缺陷图像中的不同特征进行分层预测,最终检测准确率可达93.5%。Liang等学者[6]首先对超声波缺陷信号的波形进行小波包分解,得到特征向量的缺陷类型特征化;然后,引入人鱼群优化算法并对其进行改进,通过该算法对建立的支持向量机缺陷检测模型超参数进行优化;最终试验结果表明:在该缺陷分类模型中,不同深度超声波缺陷信号的识别率为94.67%。Yang等学者[7]建立了一种基于图像预处理和改进VGG-19的轻型太阳能电池板故障诊断系统,应用于3 344张太阳能板图像组成的数据集上;结果表明:该方法的准确率为87.8%。通过以上研究分析,上述所有在缺陷检测中表现优异的卷积神经网络均由特定领域的专家根据主观经验人工设计,进行大量的超参数重复调整及评估,以提高网络的诊断性能,既费时费力又难以保证网络的鲁棒性和自适应性。除此之外,目前大多研究以超声波回波信号为基础,分析超声信号的时域或频域形式,其余一维超声波信号的高维映射方式相关研究较少。

    综上所述,该文开展了一种基于轻量化特征增强网络的焊缝缺陷超声检测方法研究。该文的主要贡献如下:①为丰富一维超声检测时域信号所包含的焊缝缺陷特征信息,契合卷积神经网络更适用于对二维图像进行深度特征提取的特性,对初始一维时域信号进行格拉姆角场域、马尔科夫转移场域、递归域等高维空间域特征表征,以更具体的纹理和颜色格式呈现原始焊缝缺陷的特征。②为增强不锈钢焊缝缺陷的非线性特征及其前后相关性,充分挖掘缺陷高维空间域信息,提出一种面向焊缝缺陷检测的轻量化特征增强网络。创新性地采用可变形卷积的方法从二维空间域图像中提取纹理特征,设计特征融合模块获取不同尺度下特征信息,采用注意力机制对焊缝缺陷的重要特征进行赋值,以此获得更有价值的信息,保证后续检测结果的准确性。③为进一步提升麻雀搜索算法搜索神经网络最优超参数的速度及全局寻优效果,根据神经网络的特性,提出一种模型超参数自优化策略,构建最优位置扰动策略、迭代映射初始化策略及参数自适应调整策略对算法进行改良并应用于模型中,实现4个关键参数的自适应优化,增强模型设计的可解释性和泛化性,避免人为调参带来的高时间成本和高计算成本。

    该文整体框架如图1所示。其中第一部分为一维超声检测信号的多域表征,丰富焊缝缺陷数据的特征表达,见第2节;第二部分为面向焊缝缺陷检测的轻量化特征增强网络(Feature enhancement network based on lightweight, LNet)构建,迭代式多尺度地挖掘出更深的信息,见第3节;第三部分为基于麻雀搜索算法的全局自动寻优机制,对焊缝缺陷检测模型的4个关键参数自适应构建,得到构建后的基于轻量化自适应特征增强网络(Adaptive feature enhancement network based on lightweight, ALNet)用以焊缝缺陷类型识别,见第4节。

    图  1  整体框架图
    Figure  1.  Overall fram

    通常超声焊缝一维信号只是利用单一时域、频域进行分析,存在提取特征单一、网络无法有效抑制无效信息等问题,因此,该文将焊缝一维信号样本映射入多个空间域中以得到更多的特征信息。高维空间域:时频域(Short-time Fourier transform, STFT)[8]和递归域(Recurrence plot field, RPF)[9]、格拉姆角场域(Gramain angular summation field, GASF)[1011]、(Gramain angular difference field, GADF)[1213]、马尔科夫域(Markov transition field, MTF)[14]。多域转换图见表1

    表  1  多域转换图
    Table  1.  Multi-domain conversion image
    Time STFT RPF
    GASF GADF MTF
    下载: 导出CSV 
    | 显示表格

    STFT实质是加窗的傅里叶变换。假定非平稳信号在分析窗的短时间隔内是平稳的,通过窗函数$\omega \left( m \right)$在时间轴上的移动,对信号进行逐段分析得到信号的一组局部“频谱”。变换函数表达式如式(1)所示。

    $$ X\left( {n,\omega } \right) = \mathop \sum \limits_{n = - \infty }^{n = \infty } x\left( m \right)\omega \left( {n - m} \right){{\text{e}}^{ - j\omega m}} $$ (1)

    式中:$x\left( m \right)$是输入信号;$\omega\left( m \right)$是分析窗,分析窗具有重要的作用,特别是在STFT的分析合成中。

    RPF可以将数据样本的内部结构、相似性及预测性等相关知识分离出来,是分析信号序列周期性、混沌性和非平稳性的有效方法。变换函数表达式如式(2)所示。

    $$ R = {{\Theta }}\left( {{{\varepsilon }} - \parallel {x_i} - {x_j}\parallel } \right) $$ (2)

    式中:${{\Theta }}$为Heaviside函数;$\varepsilon $为递归阈值。

    GAF在一个极坐标系统中将时间序列转换成一个编码,以显示样本的各种信息粒度。在Gramain矩阵中,每一个元素都是对应角度的三角函数值,由此衍生出GASF和GADF两种不同的实现方式。变换表达式如式(3)和式(4)所示。

    $$ \begin{split} {G_{{\text{GASF}}}} =&\left[ {\begin{array}{*{20}{c}} {{\text{cos}}\left( {{\theta _1} + {\theta _2}} \right)}\quad \cdots \quad{{\text{cos}}\left( {{\theta _1} + {\theta _n}} \right)} \\ \vdots \qquad\quad \ddots \qquad\quad \vdots \\ {{\text{cos}}\left( {{\theta _n} + {\theta _1}} \right)}\quad \cdots \quad{{\text{cos}}\left( {{\theta _n} + {\theta _n}} \right)} \end{array}} \right] \\\qquad\;\;\, = &{{\tilde X}^T}\tilde X - {\sqrt {1 - {{\tilde X}^2}} }^T\sqrt {1 - {{\tilde X}^2}} \\[-1pt] \end{split} $$ (3)
    $$ \begin{split} {G_{{\text{GADF}}}} = &\left[ {\begin{array}{*{20}{c}} {{{\sin}}\left( {{\theta _1} - {\theta _2}} \right)}\quad \cdots\quad {{\text{sin}}\left( {{\theta _1} - {\theta _n}} \right)} \\ \vdots\qquad\quad \ddots\qquad\quad \vdots \\ {{\text{sin}}\left( {{\theta _n} - {\theta _1}} \right)}\quad \cdots\quad {{\text{sin}}\left( {{\theta _n} - {\theta _n}} \right)} \end{array}} \right] \\\qquad\;\;\, =& {\sqrt {1 - {{\tilde X}^2}} }^T\tilde X - {{\tilde X}^T}\sqrt {1 - {{\tilde X}^2}} \\[-1pt] \end{split} $$ (4)

    式中:$\tilde X$为转换后的极坐标序列。

    MTF是基于一阶马尔科夫链的变体,主要为解决马尔科夫转移矩阵对序列样本的时间特点的不敏感问题。长度为$n$的信号序列$X\left( t \right)$将会被映射到每个对应的值域${q_j}$中,由${q_j}$结合每个样本紧邻的频率${w_{ij}}$构建出相应的转移矩阵,接着转换得到马尔科夫域。式(5)为转换表达式。

    $$ M = \left[ \begin{gathered} \left. {{w_{ij}}} \right|{X_1}\left( t \right) \in {q_i},{X_1}\left( t \right) \in {q_j} \cdots \left. {{w_{ij}}} \right|{X_1}\left( t \right) \in {q_i},{x_n} \in {q_j} \\ \left. {{w_{ij}}} \right|{X_2}\left( t \right) \in {q_i},{X_1}\left( t \right) \in {q_j} \cdots \left. {{w_{ij}}} \right|{X_2}\left( t \right) \in {q_i},{x_n} \in {q_j} \\ \vdots \\ \left. {{w_{ij}}} \right|{X_n}\left( t \right) \in {q_i},{X_1}\left( t \right) \in {q_j} \cdots \left. {{w_{ij}}} \right|{X_n}\left( t \right) \in {q_i},{x_n} \in {q_j} \\ \end{gathered} \right] $$ (5)

    该文提出的轻量特性增强网络框架LNet如图2所示,包含特征提取模块、特征融合模块、特征增强模块和分类模块。首先,采用可变形卷积的方法从特征图中提取缺陷特征,接着利用特征融合模块获取不同尺度下更有价值的焊缝缺陷征信息;然后,采用卷积模块注意力机制(Convolutional block attention module, CBAM),将不同尺度下得到的特征进行权重分配,并将其进行融合;最后,为了降低模型的复杂性和加快推理速度,采用一个全局池化结构替代传统的全连接结构来实现焊缝缺陷类型的输出。

    图  2  轻量化特征增强网络框架LNet
    Figure  2.  A lightweight feature-enhancing network framework LNet

    不同类型的焊缝缺陷空间域图像特征呈现出不同的几何线性结构,现有的卷积神经网络模型大多是基于对象数据中固有的多样性适应几何变形的,而非适应这些变形的内部机制。因此,该文建立了一个基于可变形卷积的特征提取层,可以更好地学习空间域图像中不同纹理形状的特征信息。

    可变形卷积具体结构如图3所示,主要分为上下两部分,上部分是基于输入的特征图生成xy方向的offset,下部分是基于特征图和offset通过可变形卷积获得输出特征图。

    图  3  可变形卷积示意图
    Figure  3.  Deformable convolution

    该文中,$ R $表示膨胀率为1,感受野大小为3×3的卷积核。在标准卷积中,对于输入特征图xp0位置的输出特征图y定义如式(6)所示。

    $$ y\left({p}_{0}\right)=\sum _{{p}_{n\in R}}w\left({p}_{n}\right)\cdot x\left({p}_{0}+{p}_{n}\right) $$ (6)

    式中:$ {p}_{n} $为$ R $中的点;$ w\left(\cdot \right) $为采样点的权重。

    可变形卷积将偏移量$ \Delta {p}_{n} $添加到标准卷积的采样点上,定义如式(7)所示。

    $$ y\left({p}_{0}\right)=\sum _{{p}_{n\in R}}w\left({p}_{n}\right)\cdot x\left({p}_{0}+{p}_{n}+\Delta {p}_{n}\right) $$ (7)

    该模块还采用了批处理归一化的方法,以加速训练过程,减少模型过拟合。对于信号v,可通过式(8)~式(11)操作。

    $$ \mu =\dfrac{1}{m}\sum _{i=1}^{m}{v}_{i} $$ (8)
    $$ {\sigma }^{2}=\dfrac{1}{m}\sum _{i=1}^{m}{\left({v}_{i}-{\mu }_{i}\right)}^{2} $$ (9)
    $$ {\mu }_{i}=\dfrac{{v}_{i}-\mu }{\sqrt{{\sigma }^{2}+\varepsilon }} $$ (10)
    $$ {o}_{i}=\gamma {\mu }_{i}+\beta $$ (11)

    式中:$ \mu $为均值;$ \sigma $为方差;$ m $为样本量;$ {\mu }_{i} $为归一化值;$ {o}_{i} $为缩放$ {\mu }_{i} $后的输出;$ \gamma $和$\; \beta $为缩放系数。

    为最大限度地获取多通道、多维度特征,该文设计了基于多尺度特征融合的信息提取模块。该结构并行使用几个不同大小的卷积核扩展网络,提高了网络模型对输入特征映射的适应性,保证了网络模型能够从特征中提取出更多的特征信息。

    特征融合模块由不同大小的卷积核组成的3个通道构成。第一个通道为3个5×5的卷积层堆叠在一起,第二个通道使用3个3×3的卷积层堆叠在一起,在这2个通道中进行3次卷积操作后均设置批处理归一化层,以提高网络的整体性能。在第三个通道中,通过平均池化对特征图通进行降采样操作,接着进行卷积操作。最后,该模块的输出$ g $如式(12)所示。

    $$ g=concat\left({g}_{1}\text{,}{g}_{2}\text{,}{g}_{3}\right) $$ (12)

    式中:$ {g}_{1},{g}_{2},{g}_{3} $为3个通道。此外,为确保卷积计算前后特征信息维度的一致性,采用了卷积计算中的零填充准则。如式(13)所示。

    $$ O=\dfrac{\left(I-K+2P\right)}{S}+I $$ (13)

    式中:$ O $为输出特征的维度;$ I $为输入特征的维度;$ K $为卷积核大小;$ P $为零填充的大小;$ S $为滑动窗口的步幅。

    考虑到不同通道特征的重要性,须动态地为每个通道分配权重值,以确保最终输出的准确性。此外,位置信息在输入特征图中同样重要。基于此,该文在网络引入了CBAM,使网络在检测过程中能够更多地关注兴趣目标。图4显示了CBAM的结构,其中包括2种注意力模块:通道注意力模块有助于增强不同通道的特征表征;空间注意力模块有助于提取空间中不同位置的关键信息。输入特征图依次通过上述2种模块生成精细化的特征图。$ \otimes $表示逐元素的乘法。

    图  4  CBAM结构示意图
    Figure  4.  CBAM structure

    在通道注意力模块中,首先,对输入维度为H×W×C的特征图F执行全局最大池化和全局平均池化操作,生成2个包含通道数的一维向量,分别表示每个通道的最大和平均特征;然后,将2个一维向量输入到多层感知器中得到一维通道注意力特征图$ {M}_{\mathrm{c}}\in{R}^{C\times 1\times 1} $;最后,将$ {M}_{\mathrm{c}} $与F相乘,得到通道注意力特征图$ {F}' $。在空间注意力模块中,首先,将全局最大池化和全局平均池化操作连接起来,并对输入的特征图$ {F}' $同样执行该操作生成具有不同尺度上下文信息的2个二维向量;然后,将这2个二维向量通过标准卷积层并沿着通道维度进行拼接和卷积,生成二维空间注意力特征图$ {M}_{\mathrm{s}}\in {R}^{1\times H\times W} $;最后,将$ {M}_{\mathrm{s}} $与$ {F}' $相乘,得到最终的特征图$ {F}'' $,计算过程如式(14)~式(17)所示。

    $$ {F}'={M}_{\mathrm{c}}\left(F\right)\otimes F $$ (14)
    $$ {F}''={M}_{\mathrm{s}}\left({F}'\right)\otimes {F}' $$ (15)
    $$\begin{split} {M}_{\mathrm{c}}\left(F\right)=&\sigma \left(MLP\left(AvgPool\left(F\right)\right)+MLP\left(MaxPool\left(F\right)\right)\right)\\=&\sigma \left({W}_{1}\left({W}_{0}\left({F}_{\mathrm{a}\mathrm{v}\mathrm{g}}^{c}\right)\right)+{W}_{1}\left({W}_{0}\left({F}_{\mathrm{m}\mathrm{a}\mathrm{x}}^{c}\right)\right)\right) \\[-1pt]\end{split}$$ (16)
    $$\begin{split} {M}_{\mathrm{s}}=&\sigma \left({f}^{7\times 7}\left(\left[AvgPool\left(F\right)\text{;}MaxPool\left(F\right)\right]\right)\right)\\=&\sigma \left({f}^{7\times 7}\left(\left[{F}_{\mathrm{a}\mathrm{v}\mathrm{g}}^{s}\text{;}{F}_{\mathrm{m}\mathrm{a}\mathrm{x}}^{s}\right]\right)\right)\\[-1pt]\end{split} $$ (17)

    式中:c为通道注意力模块;s为空间注意力模块$ ;\otimes $为元素相乘法$ \sigma $为sigmoid激活函数;AvgPool,MaxPool为平均池化和最大池化;$ {W}_{0} $和$ {W}_{1} $为MLP的权重;$ {F}_{\mathrm{a}\mathrm{v}\mathrm{g}}^{x} $和$ {\mathrm{F}}_{\mathrm{m}\mathrm{a}\mathrm{x}}^{x} $分别为平均池化的合并特征和最大池化的合并特征,其中$ x=c,s $。上述过程能够有效地提取原始图像中的时域特征和频域特征,以及图像中的纹理特征。

    为降低模型计算复杂性,提高运行速度,该文设计了一个降维结构。首先,对特征融合模块的输出进行卷积核为3×3,步幅为2的平均池化操作;然后,进行2个卷积核大小为3×3、步幅为1的卷积操作,以及1个卷积核大小为3×3、步幅为2的平均池化操作;最后,应用全局平均池化操作来进一步降低特征的维度。与全连接层不同,该操作主要用于减少参数量和结构复杂度,避免过拟合[15]。该层的特征提取原理如图2所示。给定前一层的特征张量(W, H, V)它将该张量的维数减小为(1, 1, V)。

    麻雀搜索算法(Sparrow search algorithm, SSA)是由Xue等学者[16]在2020年以麻雀捕食和反捕食为灵感,以少参数、简单原理、快速收敛为主要特点,提出的一种新型群体智能优化算法,因其参数少、原理简单、收敛速度快而得到广泛应用。具体算法可将麻雀抽象为发现者、追随者及警戒者3种个体,三者迭代公式分别如式(18)~式(20)所示。

    $$ {X}_{id}^{t+1}=\left\{\begin{array}{l}{X}_{id}^{t}\cdot \mathrm{exp}\left(-\dfrac{i}{\alpha \cdot T}\right),{R}_{2}<ST\\ {X}_{id}^{t}+\Gamma \cdot L ,{R}_{2}\geqslant ST\end{array}\right.$$ (18)
    $$ X_{id}^{t + 1} = \left\{ {\begin{array}{*{20}{l}} {\Gamma \cdot \exp \left( {\dfrac{{X_{{W_d}}^t - X_{id}^t}}{{{i^2}}}} \right),i > n/2} \\ {X_{{P_d}}^{t + 1} + \left| {X_{id}^t - X_{{P_d}}^{t + 1}} \right|{A^ + } \cdot L,otherwise} \end{array}} \right. $$ (19)
    $$ {X}_{id}^{t+1}=\left\{\begin{array}{c}X{b}_{d}^{t}+\beta \left|{X}_{id}^{t}-X{b}_{d}^{t}\right| ,{f}_{i}\ne {f}_{g}\\ {X}_{id}^{t}+K\dfrac{\left|{X}_{id}^{t}-X{w}_{d}^{t}\right| }{\left({f}_{i}-{f}_{w}\right)+\varepsilon } ,{f}_{i}={f}_{g}\end{array} \right.$$ (20)

    式中:$n$为麻雀个体的数目;$X_{id}^t$为第$i$只麻雀在第$d$维的位置;$ t $为当前迭代次数;$T$为最大迭代次数;$X_{{W_d}}^t$为第$t$次迭代时麻雀在第$d$维的最劣位置;$X_{{P_d}}^{t + 1}$为种群$t + 1$次迭代时麻雀在$d$维上的最优位置;$Xb_d^t$为当前的全局最优位置;$\;\beta $为服从正态分布的随机数;$\alpha \in \left( {0,1} \right]$的随机数;$ K \in \left[ {-1,1} \right] $的随机数;$ {{\Gamma }} $为服从标准正态分布的随机数;$L$为一维的全1矩阵;$ {R_2} \in \left[ {0,1} \right] $为预警值的范围;$ST \in \left[ {0.5,1.0} \right]$为安全值的范围;$ \varepsilon $为一个极小常数;${f_i}$为当前种群个体的适应度值;${f_{\text{g}}}$为当前中群的全局最优值;${f_{{W}}}$为全局最差值。

    SSA具有全局寻优好,收敛速度快等特点,但根据神经网络的特性,实际使用中仍具有搜索最优构件速度慢、寻优效果较差等问题。因此,该文从优化全局寻优策略的角度出发研究基于麻雀搜索算法的全局自动寻优机制(Global automatic optimization mechanism based on SSA, PASSA),以此改善寻优效果差的问题。算法流程如图5所示。

    图  5  PASSA算法流程图
    Figure  5.  Flow chart of PASSA algorithm

    该节从以下3个方面对麻雀优化算法进行改进。

    (1)最优位置扰动策略

    每轮迭代的最优麻雀容易陷入局部最优,导致算法无法得到全局最优,而随机游走算法[17]具备操作简单且不易陷入局部最优值的优点。将随机游走算法与SSA整合在一起,利用该算法对个体的最优位置进行扰动,使其在每个回合中不断迭代,以增强其搜索性,防止陷入局部最优。过程如式(21)所示。

    $$ {X_i}\left( t \right) = \left[ {0,cussum\left( {2r\left( t \right) - 1} \right), \cdots ,cussum\left( {2r\left( t \right) - 1} \right)} \right] $$ (21)

    式中:${X_i}\left( t \right)$为最优麻雀第$i$维随机游走$t$步的位置集;$t$为总迭代次数;$cussum$为计算累加和;$r\left( t \right)$为一个随机函数,如式(22)所示。

    $$ r\left( t \right) = \left\{ {\begin{array}{*{20}{c}} {1,rand > 0.5} \\ {0,rand \leqslant 0.5} \end{array}} \right. $$ (22)

    式中:$rand \in \left[ {0,1} \right]$的随机数

    迭代开始时,随机游走的边界较大有助于扩大搜索范围。随着迭代次数增加,麻雀个体越来越接近最优值,因此,随机游走范围应逐渐变小。由于可行域存在边界,无法直接用原式更新麻雀位置。为确保在可行域范围内随机游走,需根据式(23)对麻雀位置进行计算并归一化。

    $$ X_i^t = \dfrac{{\left( {{X_i}\left( t \right) - {a_i}} \right)}}{{{b_i} - {a_i}}}X_i^t + c_i^{} $$ (23)

    式中:$X_i^t$为第$t$次迭代最优麻雀第$i$维的位置;${a_i}$,${b_i}$分别为最优麻雀第$i$维随机游走位置集中的最小值、最大值;$c_i^{}$为最优麻雀第$i$维的下边界。

    (2)迭代映射初始化策略

    原始SSA中的原始麻雀个体都是随机在搜寻空间中产生的,要想获得较好的初始种群多样性是非常困难的,可能会造成初始个体差异化小、算法收敛性能差、局部寻优能力弱等问题。而混沌映射[18]拥有遍历空间均匀、收敛速度快等优点,该文采用迭代映射产生混沌序列来初始化种群,提高初始种群多样性,如式(24)所示。生成由混沌初始化的种群后将混沌个体转换到对应的搜索空间中,转换式如式(25)所示。

    $$ X_d^{\left( {i + 1} \right)} = \sin \dfrac{{a{\text{π }}}}{{X_d^i}},d = 1,2, \cdots ,D $$ (24)
    $$ X_d^{\left( {i{\text{ + }}1} \right)} = {X_{lb,d}} + \left( {{X_{ub,d}} - {X_{lb,d}}} \right)X_d^{\left( {i{\text{ + }}1} \right)},d = 1,2, \cdots ,D $$ (25)

    式中:$X_d^i$为第$i$个个体的第$d$个维度;$X_d^{\left( {i + 1} \right)}$为第$i + 1$个个体的第$d$个维度;${X_{ub,d}}$,${X_{lb,d}}$分别为第$d$个维度个体的上下边界。一维迭代映射运行多次的结果如图6所示,其中横坐标为迭代次数e,纵坐标为一维迭代映射结果β。通过迭代映射,麻雀个体在初始化时被分散到整个搜索空间中,增大了种群的多样性和搜索范围。

    图  6  迭代结果
    Figure  6.  Iterative results

    (3)基于深度强化学习(Deep Q-learning,DQN)算法的参数自适应调整策略

    强化学习通过与环境的反复互动和试错,不断优化决策。目前,Q-learning[19]算法显现出一定的不足,如当动作过多时就无法用Q表格进行存储,DQN[20]算法在其技术上将Q表格替换为神经网络,解决了数据量过大Q表格无法存储的问题,因此,该文使用DQN算法。

    SSA中每轮迭代开始时均会随机初始化式(18)中的${R_2}$,选取哪一个公式来更新麻雀发现者位置与${R_2}$的随机值具有很大的关系,因此,随机参数与SSA的寻优性能关系密切。该文针对SSA中的警戒值${R_2}$,提出了一种基于DQN算法的参数自适应调整策略,利用强化学习与种群环境进行交互,使得参数变化符合种群进化的需求。

    DQN算法设置如下:①状态空间定义为2位小数表示的警戒值${R_2} \in \left( {0.00,1.00} \right)$;②动作空间设置为3种:警戒值的减小、不变、增大,动作幅值设置为0.01;③奖励机制的主要依据适应度值指标,奖励$R$计算如式(26)所示:

    $$ R = \left\{ {\begin{array}{*{20}{l}} {1,{f_b} - f > 0} \\ { - 1,{f_b} - f < 0} \\ {0,{f_b} - f = 0} \end{array}} \right. $$ (26)

    式中:${f_b}$为种群最优适应度值;$f$为当前个体的适应度值。

    大多数模型选择都是基于人工选择,依靠大量专家经验在确定内部参数时进行调试,面对不同类型的缺陷时很可能需要重新构建模型。对此,该文提出一种模型自适应寻优机制,并构建了适应度函数${F_g}$使PASSA寻优效果更佳,极大减少了工作量和模型可解释性。

    该文通过改进后的麻雀优化算法PASSA对LNet网络模型4个关键超参数进行寻优,得到优化后的模型ALNet,提高模型自适应寻优能力。4个关键超参数包含:候选空间域、学习率、批次大小、优化器。根据PASSA中各麻雀位置信息建立优化后的模型。式(27)中$ y\left(i\right) $为预测标签,$ t\left(i\right) $为真实标签,$ batch $为批次大小。求取出$ f $作为PASSA中的适应度函数进行种群更新,最优个体信息会被用来建立最终的模型。

    $$ f=\dfrac{1}{batch}\sum _{i=1}^{batch}|y\left(i\right)-t\left(i\right)| $$ (27)

    为验证PASSA算法的寻优性能,将其与SSA、蜻蜓优化算法(Dragonfly algorithm, DA)[21]、灰狼优化算法(Grey wolf optimizer, GWO)[22]、向日葵优化算法(Sunflower optimization, SFO)[23]、平衡优化器优化算法(Equilibrium optimizer, EO)[24]5种算法在10个基准函数上进行对比仿真试验。每类算法的种群规模设定为100,迭代次数上限为1 000,问题维度为30。在验证PASSA方法稳定性的同时,为了排除偶然因素的影响,将独立运行各基准函数30次并作为试验结果使用。将各个算法的平均值和标准差作为最终评价指标,较优结果用粗黑体进行表示。10个基准函数包括:SchwefelN1.2(F1), SchwefelN2.21(F2), Rosenborck(F3), Step(F4), Quartic(F5) 5个高维单峰基准函数,以及Schwefel(F6), Rastrigin(F7), Ackley(F8), Griewank(F9), Penalized(F10) 5个高维多峰基准函数。对比结果分别见表2表3

    表  2  单峰基准函数试验结果
    Table  2.  Experimental results of single-peak functions
    基准
    函数
    SSA DA GWO
    平均值 标准差 平均值 标准差 平均值 标准差
    F1 1.648×10−26 8.040×10−26 213.7 429.1 1.569×10−8 1.515×10−8
    F2 2.652×10−14 1.221×10−13 1.895 1.012 2.024×10−8 1.173×10−8
    F3 8.360×10−2 1.988×10−6 2.197 0.950 1 26.45 1.376×10−4
    F4 1.580×10−3 1.541×10−10 1.167 1.408 0.222 3 0.184 8
    F5 5.110×10−4 1.660×10−4 1.790×10−3 0.1051 8.752×10−4 4.663×10−4
    基准
    函数
    SFO EO PASSA
    平均值 标准差 平均值 标准差 平均值 标准差
    F1 2.064×10−13 7.743 9.556×10−23 0.064 0.0 0.0
    F2 1.053×10−8 9.865×104 1.022×10−20 1.085 0.0 0.0
    F3 2.702×10−6 14.65 24.41 35.43 2.442×10−8 1.112×10−7
    F4 8.550×10−3 17.36 9.455×10−7 6.384×10−4 1.261×10−7 1.655×10−12
    F5 5.125×10−5 5.536×10−5 1.473×10−3 2.641×10−3 1.463×10−5 1.001×10−5
    下载: 导出CSV 
    | 显示表格
    表  3  多峰基准函数试验结果
    Table  3.  Experimental results of multi-peak functions
    基准
    函数
    SSA DA GWO
    平均值 标准差 平均值 标准差 平均值 标准差
    F6 −7 953 720.4 −1 990 1 701 −1 702 147.3
    F7 0.0 0.0 12.18 5.908 3.047 3.716
    F8 8.882×10−16 0.0 2.204 2.167 7.021 2.751×10−14
    F9 0.0 0.0 0.338 1 1.243×10−2 13.25 4.741×10−3
    F10 3.352×10−12 2.853×10−11 0.501 4 0.331 3 0.182 6 1.422×10−4
    基准
    函数
    SFO EO PASSA
    平均值 标准差 平均值 标准差 平均值 标准差
    F6 −1.250×104 1.677 −8 398 0.501 7 −1.255×104 6.007×10−2
    F7 2.273×10−13 1.216×10−4 0.0 0.0 0.0 0.0
    F8 4.702×10−6 0.501 7 3.996×10−15 0.267 4.440×10−16 0.0
    F9 2.386×10−14 0.118 2 0.0 0.0 0.0 0.0
    F10 1.535×10−2 4.443×10−6 4.849×10−7 0.450 2 1.483×10−7 1.003×10−10
    下载: 导出CSV 
    | 显示表格

    表2分析可知,对于基准函数F1及F2,PASSA都可以稳定地得到它的理论最优解法。在求解F3,F4和F5时,尽管PASSA未能找到理论上的最优解法,但在均值和标准差这两个评估指标上,PASSA在数量级上与其他算法相比还是有优势的。证明在单峰类函数中,经过改进的PASSA具有比其他算法更强的性能和稳定性。

    表3分析可知,对高维多峰基准函数F7及F9,PASSA与SSA均可稳定收敛于全局最优值。PASSA在F8基准函数上,有显著的改进,比其他算法更优越。在对F10的求解中,PASSA在2个评价指标上略逊于SSA,但与其它对比算法相比,PASSA的优势非常大。因此,无论在单峰基准函数还是多峰基准函数,PASSA可以在多次的寻优过程中表现出更好的寻优性能,表明PASSA具备高效的全局寻优能力和局部探索能力,能够充分高效的探寻搜索空间。

    为了避免对SSA算法改进过多造成的性能下降或相互抵消的问题,该文对SSA算法的修改进行了详细的消融试验,证明了修改的可行性和正确性。PASSA改进消融试验结果见表4,表中结果均为不同算法在10个基准函数运行30次的平均适应度值和运行时间。

    表  4  PASSA改进消融试验
    Table  4.  PASSA-modified ablation experiment
    类别 A B C D
    SSA
    +最优位置扰动
    +迭代映射初始化
    +参数自适应调整
    F 平均值 时间t0/s 平均值 时间t0/s 平均值 时间t0/s 平均值 时间t0/s
    F1 1.648×10−26 20.05 7.123×10−79 23.88 1.421×10−36 25.78 0.0 15.05
    F2 2.652×10−14 6.43 2.001×10−39 7.71 2.004×10−51 6.65 0.0 6.55
    F3 8.360×10−2 7.12 7.127×10−2 7.30 5.122×10−2 7.45 2.442×10−8 7.20
    F4 1.580×10−3 6.50 4.150×10−4 6.88 5.150×10−3 6.76 1.261×10−7 6.49
    F5 5.110×10−4 7.63 4.610×10−4 7.88 4.710×10−4 7.87 1.463×10−5 7.46
    F6 −2 737 6.51 −2 731 7.03 −2 703 6.81 −1.255×104 6.41
    F7 0.0 6.40 0.0 6.85 0.0 6.99 0.0 6.03
    F8 8.882×10−16 7.02 4.440×10−16 7.55 4.440×10−16 7.64 4.440×10−16 6.89
    F9 0.0 7.28 0.0 7.81 0.0 7.95 0.0 6.91
    F10 2.352×10−3 8.50 2.731×10−3 8.99 2.718×10−3 9.98 1.483×10−7 8.17
    下载: 导出CSV 
    | 显示表格

    从消融试验中可以得出该文修改后的算法寻优效果对比原算法均有不同程度的提高,其中加入基于DQN算法的参数自适应调整策略提高效果最为明显。此外,为防止引入模块可能产生时间复杂度过高的问题,该文对各算法运算时间进行了对比。改进B,C除F3函数外较A时间差别不大。引入改进D较其他算法运行时间大幅缩短且能够极快地收敛到精度合适的最优解,运行时间与原算法时间差距不大但性能大幅提高,尤其在F1函数上较A运算时间减少25%。因此,该算法可以应用于该文对焊缝缺陷检测网络模型中的自适应寻优问题中且在具有较大的实用价值。

    该文试验在Intel Core CPU I5-10500H,16 GB内存、64位Windows操作系统、PyCharm2020.1.3上进行,所使用的数据集来源于在山西机电设计研究院有限公司所搭建试验平台采集到的超声A扫不锈钢焊缝缺陷数据,然后经过数据可视化、使用巴特沃斯滤波器进行滤波等一系列操作获得的。其原理是利用超声波在物体中的反射、折射和传播等物理现象,通过接收和分析回波信号来推断物体内部的缺陷类型。该次共收集到544个超声缺陷数据,包括未熔合、夹渣、未焊透、裂纹、气孔,并通过巴特沃斯滤波器进行滤波处理,之后将采集到的一维超声信号数据进行可视化处理,通过咨询无损检测领域专家截取一维超声检测信号,得到如图7所示的时域数据,避免电磁耦合信号对缺陷信号特征提取造成干扰,确保不遗漏一维回波信号,并按照4∶1的比例划分训练集和验证集。

    图  7  一维超声检测时域数据
    Figure  7.  Time-domain data of one-dimensional ultrasonic testing

    该文利用经试验验证后的高性能PASSA对LNet进行模型自适应寻优得到优化后的模型ALNet。PASSA的参数搜索范围见表5,将种群个体的4个维度分别对应于模型的4个待优化参数:候选空间域、学习率、批次大小和优化器,初始种群大小为10,最大迭代次数为5。使用PASSA所搜寻到的最优模型与其他基线模型进行对比,见表6

    表  5  LNet模型待优化参数及范围
    Table  5.  Parameters and scope of LNet model to be optimized
    待优化参数 搜索范围
    候选空间域 “RPF”, “GASF”, “GADF”, “MTF”
    学习率 [1×10−3,1×10−5]
    批次大小 [4,8]
    优化器 “Adam”, “SGD”, “Adamx”, “Adadelta”, “AdamW”,
    “ASGD”, “RMSprop”
    下载: 导出CSV 
    | 显示表格
    表  6  LNet模型使用PASSA优化后的最优模型组件
    Table  6.  LNet model uses the optimal model components optimized by PASSA
    待优化模型组件优化后的最优模型最优组件
    候选空间域“MTF”
    学习率0.000 089
    批次大小8
    优化器“Adam”
    下载: 导出CSV 
    | 显示表格

    为了充分证明该文所提方法的有效性,将用于图像分类的主流轻量化卷积神经网络ShuffleNet[25],SqueezeNet[26],MobileNetV3[27]及常规卷积神经网络DenseNet[28],ResNet18[29],ViT[30],EfficientNetV2[31]与该文设计的LNet,ALNet网络从参数量、模型训练时间、单个样品测试时间及准确率4个方面进行比较,结果见表7。该文方法分类准确率高于所有基线模型,相较于轻量级卷积神经网络ShuffleNet,SqueezeNet,MobileNetV3,ALNet的参数量比他们略高;相较于常规卷积神经网络DenseNet,ResNet18等,ALNet在模型参数具有较大优势;而相较于未使用基于麻雀搜索算法的全局自动寻优机制的网络LNet,得益于该文提出的该机制,ALNet在训练时间方面具有巨大优势,证明所提方法的高效性及有效性。除此之外,ALNet模型对单个样品的平均测试时间仅为1.4 ms,可满足不锈钢焊缝缺陷在线实时识别的要求。

    表  7  网络模型性能对比试验
    Table  7.  Comparative experiments on performance of network model
    网络
    模型
    参数量
    N(106)
    训练时间
    t1/min
    测试时间
    t2/ms
    准确率
    η(%)
    ShuffleNet 4.8 145 2.9 68.39
    SqueezeNet 4.5 131 2.8 88.12
    MobileNetV3 4.0 113 2.4 91.80
    DenseNet 7.0 206 14 90.90
    ResNet18 11.0 233 16 91.57
    ViT 86.0 562 10 92.45
    EfficientNetV2 24.0 342 7 93.24
    LNet(该文) 2.9 34 1.9 94.06
    ALNet(该文) 7.3 20 1.4 95.54
    下载: 导出CSV 
    | 显示表格

    (1)开展了基于轻量化特征增强网络的焊缝缺陷检测方法研究。构建面向焊缝缺陷检测的特征增强网络,将一维语音信号信息映射至多个空间域后将表征能力最好的域作为输入特征图,增强了深度焊缝检测模型对超声信号特征完备性、关联性的表达,更深层次的抑制了卷积模型提取无效信息。同时,引入经过全局寻优策略改进的PASSA,针对语音增强模型的4个关键参数进行适应性优化,避免了时间成本过高、计算成本过高等人为调参带来的问题。提高了模型的泛化性和可解释性。经过PASSA自适应优化后的焊缝缺陷检测模型在自构建的数据集下较其他基线模型来说,准确率和参数量两大指标均有提升,验证了该文方法的有效性且减少了人工参数设计对性能、学习能力、成本消耗的影响。

    (2)该文的主要局限性是该不锈钢焊缝缺陷模型仍为人工主观经验设计检测领域。在未来的工作中将会引入神经架构自动搜索方法,针对于不同缺陷检测行业自动构建检测模型,为工业现代化提供技术支持。

  • 图  1   整体框架图

    Figure  1.   Overall fram

    图  2   轻量化特征增强网络框架LNet

    Figure  2.   A lightweight feature-enhancing network framework LNet

    图  3   可变形卷积示意图

    Figure  3.   Deformable convolution

    图  4   CBAM结构示意图

    Figure  4.   CBAM structure

    图  5   PASSA算法流程图

    Figure  5.   Flow chart of PASSA algorithm

    图  6   迭代结果

    Figure  6.   Iterative results

    图  7   一维超声检测时域数据

    Figure  7.   Time-domain data of one-dimensional ultrasonic testing

    表  1   多域转换图

    Table  1   Multi-domain conversion image

    Time STFT RPF
    GASF GADF MTF
    下载: 导出CSV

    表  2   单峰基准函数试验结果

    Table  2   Experimental results of single-peak functions

    基准
    函数
    SSA DA GWO
    平均值 标准差 平均值 标准差 平均值 标准差
    F1 1.648×10−26 8.040×10−26 213.7 429.1 1.569×10−8 1.515×10−8
    F2 2.652×10−14 1.221×10−13 1.895 1.012 2.024×10−8 1.173×10−8
    F3 8.360×10−2 1.988×10−6 2.197 0.950 1 26.45 1.376×10−4
    F4 1.580×10−3 1.541×10−10 1.167 1.408 0.222 3 0.184 8
    F5 5.110×10−4 1.660×10−4 1.790×10−3 0.1051 8.752×10−4 4.663×10−4
    基准
    函数
    SFO EO PASSA
    平均值 标准差 平均值 标准差 平均值 标准差
    F1 2.064×10−13 7.743 9.556×10−23 0.064 0.0 0.0
    F2 1.053×10−8 9.865×104 1.022×10−20 1.085 0.0 0.0
    F3 2.702×10−6 14.65 24.41 35.43 2.442×10−8 1.112×10−7
    F4 8.550×10−3 17.36 9.455×10−7 6.384×10−4 1.261×10−7 1.655×10−12
    F5 5.125×10−5 5.536×10−5 1.473×10−3 2.641×10−3 1.463×10−5 1.001×10−5
    下载: 导出CSV

    表  3   多峰基准函数试验结果

    Table  3   Experimental results of multi-peak functions

    基准
    函数
    SSA DA GWO
    平均值 标准差 平均值 标准差 平均值 标准差
    F6 −7 953 720.4 −1 990 1 701 −1 702 147.3
    F7 0.0 0.0 12.18 5.908 3.047 3.716
    F8 8.882×10−16 0.0 2.204 2.167 7.021 2.751×10−14
    F9 0.0 0.0 0.338 1 1.243×10−2 13.25 4.741×10−3
    F10 3.352×10−12 2.853×10−11 0.501 4 0.331 3 0.182 6 1.422×10−4
    基准
    函数
    SFO EO PASSA
    平均值 标准差 平均值 标准差 平均值 标准差
    F6 −1.250×104 1.677 −8 398 0.501 7 −1.255×104 6.007×10−2
    F7 2.273×10−13 1.216×10−4 0.0 0.0 0.0 0.0
    F8 4.702×10−6 0.501 7 3.996×10−15 0.267 4.440×10−16 0.0
    F9 2.386×10−14 0.118 2 0.0 0.0 0.0 0.0
    F10 1.535×10−2 4.443×10−6 4.849×10−7 0.450 2 1.483×10−7 1.003×10−10
    下载: 导出CSV

    表  4   PASSA改进消融试验

    Table  4   PASSA-modified ablation experiment

    类别 A B C D
    SSA
    +最优位置扰动
    +迭代映射初始化
    +参数自适应调整
    F 平均值 时间t0/s 平均值 时间t0/s 平均值 时间t0/s 平均值 时间t0/s
    F1 1.648×10−26 20.05 7.123×10−79 23.88 1.421×10−36 25.78 0.0 15.05
    F2 2.652×10−14 6.43 2.001×10−39 7.71 2.004×10−51 6.65 0.0 6.55
    F3 8.360×10−2 7.12 7.127×10−2 7.30 5.122×10−2 7.45 2.442×10−8 7.20
    F4 1.580×10−3 6.50 4.150×10−4 6.88 5.150×10−3 6.76 1.261×10−7 6.49
    F5 5.110×10−4 7.63 4.610×10−4 7.88 4.710×10−4 7.87 1.463×10−5 7.46
    F6 −2 737 6.51 −2 731 7.03 −2 703 6.81 −1.255×104 6.41
    F7 0.0 6.40 0.0 6.85 0.0 6.99 0.0 6.03
    F8 8.882×10−16 7.02 4.440×10−16 7.55 4.440×10−16 7.64 4.440×10−16 6.89
    F9 0.0 7.28 0.0 7.81 0.0 7.95 0.0 6.91
    F10 2.352×10−3 8.50 2.731×10−3 8.99 2.718×10−3 9.98 1.483×10−7 8.17
    下载: 导出CSV

    表  5   LNet模型待优化参数及范围

    Table  5   Parameters and scope of LNet model to be optimized

    待优化参数 搜索范围
    候选空间域 “RPF”, “GASF”, “GADF”, “MTF”
    学习率 [1×10−3,1×10−5]
    批次大小 [4,8]
    优化器 “Adam”, “SGD”, “Adamx”, “Adadelta”, “AdamW”,
    “ASGD”, “RMSprop”
    下载: 导出CSV

    表  6   LNet模型使用PASSA优化后的最优模型组件

    Table  6   LNet model uses the optimal model components optimized by PASSA

    待优化模型组件优化后的最优模型最优组件
    候选空间域“MTF”
    学习率0.000 089
    批次大小8
    优化器“Adam”
    下载: 导出CSV

    表  7   网络模型性能对比试验

    Table  7   Comparative experiments on performance of network model

    网络
    模型
    参数量
    N(106)
    训练时间
    t1/min
    测试时间
    t2/ms
    准确率
    η(%)
    ShuffleNet 4.8 145 2.9 68.39
    SqueezeNet 4.5 131 2.8 88.12
    MobileNetV3 4.0 113 2.4 91.80
    DenseNet 7.0 206 14 90.90
    ResNet18 11.0 233 16 91.57
    ViT 86.0 562 10 92.45
    EfficientNetV2 24.0 342 7 93.24
    LNet(该文) 2.9 34 1.9 94.06
    ALNet(该文) 7.3 20 1.4 95.54
    下载: 导出CSV
  • [1]

    Song Kechen, Yan Yunhui. A noise robust method based on completed local binary patterns for hot-rolled steel strip surface defects[J]. Applied Surface Science, 2013, 285: 858 − 864. doi: 10.1016/j.apsusc.2013.09.002

    [2]

    Xiao Mang, Jiang Mingming, Li Guangyao, et al. An evolutionary classifier for steel surface defects with small sample set[J]. EURASIP Journal on Image and Video Processing, 2017, 48: 2017.

    [3] 马艳春, 刘永坚, 解庆, 等. 自动图像标注技术综述[J]. 计算机研究与发展, 2020, 57(11): 2348 − 2374. doi: 10.7544/issn1000-1239.2020.20190793

    Ma Yanchun, Liu Yongjian, Xie Qing, et al. Review of automatic image annotation technology[J]. Journal of Computer Research and Development, 2020, 57(11): 2348 − 2374. doi: 10.7544/issn1000-1239.2020.20190793

    [4]

    Tang R, Zhang S, Wu W, et al. Explainable deep learning based ultrasonic guided wave pipe crack identification method[J]. Measurement, 2023, 206: 112277. doi: 10.1016/j.measurement.2022.112277

    [5] 王睿, 胡云雷, 刘卫朋, 等. 基于边缘AI的焊缝X射线图像缺陷检测[J]. 焊接学报, 2022, 43(1): 79 − 84.

    Wang Rui, Hu Yunlei, Liu Weipeng, et al. Defect detection of weld X-ray image based on edge AI[J]. Transactions of the China Welding Institution, 2022, 43(1): 79 − 84.

    [6]

    Liang Haibo, Cheng Gang, Zhang Zhidong, et al. Research on ultrasonic defect identification method of well control manifold pipeline based on IAFSA-SVM[J]. Measurement, 2022, 194: 110854. doi: 10.1016/j.measurement.2022.110854

    [7]

    Yang Xiyun, Zhang Qiao, Wang Shuyan, et al. Detection of solar panel defects based on separable convolution and convolutional block attention module[J]. Energy Sources, Part A: Recovery, Utilization and Environmental Effects, 2023, 45(3): 7136 − 7149. doi: 10.1080/15567036.2023.2218301

    [8]

    Tao Hongfeng, Wang Peng, Chen Yiyang, et al. An unsupervised fault diagnosis method for rolling bearing using STFT and generative neural networks[J]. Journal of the Franklin Institute, 2020, 357(11): 7286 − 7307. doi: 10.1016/j.jfranklin.2020.04.024

    [9]

    Meng Xianjia, Qiu Shi, Wan Shaohua, et al. A motor imagery EEG signal classification algorithm based on recurrence plot convolution neural network[J]. Pattern Recognition Letters, 2021, 146(4): 134 − 141.

    [10]

    Wang Z, Oates T. Encoding time series as images for visual inspection and classification using tiled convolutional neural networks[C]//Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence, Austin, Texas, USA: 2015: 1 − 9.

    [11]

    Zhang Rui, Bai Xiaolu, Pan Lihu, et al. Zero-small sample classification method with model structure self-optimization and its application in capability evaluation[J]. Applied Intelligence., 2021, 2021: 1 − 22.

    [12]

    Liu Lu, Wang Zhiguang. Encoding temporal Markov dynamics in graph for time series visualization[J]. arXiv preprint, 2016, arXiv: 1610.07273v3.

    [13]

    Zhao Yulian, Li Jian, Li Weishi, et al. MS-IAF: Multi-scale information augmentation framework for aircraft detection[J]. Remote Sensing, 2022, 14(15): 3696. doi: 10.3390/rs14153696

    [14]

    Zhao Yuliang; Li Jian; Zhang Qingyu, et al. Simultaneous detection of defects in electrical connectors based on improved convolutional neural network[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 3511710.

    [15]

    Senthil Pandi S, Senthilselvi A, Gitanjali J, et al. Rice plant disease classification using dilated convolutional neural network with global average pooling[J]. Ecological Modelling, 2022, 474: 110166. doi: 10.1016/j.ecolmodel.2022.110166

    [16]

    Xue Jiankai, Shen Bo. A novel swarm intelligence optimization approach: sparrow search algorithm[J]. Systems Science and Control Engineering, 2020, 8(1): 22 − 34. doi: 10.1080/21642583.2019.1708830

    [17]

    Xu Cong, Sun Jingru, Wang Chunhua. An image encryption algorithm based on random walk and hyperchaotic systems[J]. International Journal of Bifurcation and Chaos, 2020, 30(4): 2050060. doi: 10.1142/S0218127420500601

    [18]

    Li Chengqing, Feng Bingbing, Li Shujun, et al. Dynamic analysis of digital chaotic maps via state-mapping networks[J]. IEEE Transactions on Circuits and Systems I: Regular Papers, 2019, 66(6): 2322 − 2335. doi: 10.1109/TCSI.2018.2888688

    [19]

    Deng Zhen, Guan Haojun, Huang Rui, et al. Combining model-based Q-learning with structural knowledge transfer for robot skill learning[J]. IEEE Transactions on Cognitive and Developmental Systems, 2019, 11(1): 26 − 35. doi: 10.1109/TCDS.2017.2718938

    [20]

    Diallo E A O, Sugiyama A, Sugawara T. Coordinated behavior of cooperative agents using deep reinforcement learning[J]. Neurocomputing, 2020, 396: 230 − 240. doi: 10.1016/j.neucom.2018.08.094

    [21]

    Wang Lin, Shi Ronghua, Dong Jian. A Hybridization of dragonfly algorithm optimization and angle modulation mechanism for 0-1 knapsack problems[J]. Entropy, 2021, 23(5): 598. doi: 10.3390/e23050598

    [22]

    Sm A, Smm B, Al A. Grey wolf optimizer[J]. Advances in Engineering Software, 2014, 69: 46 − 61. doi: 10.1016/j.advengsoft.2013.12.007

    [23]

    Gomes G F, Da Cunha S S, Ancelotti A C. A sunflower optimization (SFO) algorithm applied to damage identification on laminated composite plates[J]. Engineering with Computers, 2019, 35(2): 619 − 626. doi: 10.1007/s00366-018-0620-8

    [24]

    Faramarzi A, Heidarinejad M, Stephens B, et al. Equilibrium optimizer: a novel optimization algorithm[J]. Knowledge-Based Systems, 2020, 191: 105190. doi: 10.1016/j.knosys.2019.105190

    [25]

    Zhang Xiangyu, Zhou Xinyu, Lin Mengxiao, et al. Shufflenet: an extremely efficient convolutional neural network for mobile devices[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 2018: 6848-6856.

    [26]

    Landola, F, Han S, Moskewicz M, et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and < 0.5 MB model size[J]. arXiv preprint, 2016, arXiv: 1602.07360.

    [27]

    Howard A, Sandler M, Chen B, et al. Searching for mobilenetv3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV), Seoul, Korea (South), 2019: 1314 − 1324.

    [28]

    Huang G, Liu Z, Van Der Maaten L, et al. Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, USA, 2017: 4700 − 4708.

    [29]

    He Kaiming, Zhang Xiangyu, Ren Shaoqing, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA, 2016: 770 − 778.

    [30]

    Dosovitskiy A, Beyer L, Kolesnikov A, et al. An image is worth 16x16 words: transformers for image recognition at scale[J]. arXiv preprint, 2020, arXiv: 2010.11929.

    [31]

    Tan M, Le Q. Efficientnetv2: smaller models and faster training[J]. arXiv preprint, 2021, arXiv: 2104.00298.

  • 期刊类型引用(1)

    1. 王勇. 基于超声相控阵的金属管道焊缝缺陷自动检测. 自动化与仪表. 2025(05): 80-83+104 . 百度学术

    其他类型引用(0)

图(7)  /  表(7)
计量
  • 文章访问数:  64
  • HTML全文浏览量:  21
  • PDF下载量:  57
  • 被引次数: 1
出版历程
  • 收稿日期:  2024-03-06
  • 刊出日期:  2024-07-24

目录

/

返回文章
返回