2024, 35(8):785-792. DOI: 10.16136/i.joel.2024.08.0858
摘要:针对现有的基于深度学习的图像质量评价方法,因为标注数据不足而存在的过拟合与泛化性能不足的问题,提出了一种基于多任务自监督学习的图像质量评价方法。首先,通过算法合成17种失真类型图像,并以全参考MDSI(mean deviation similarity index)得分和失真类型作为合成失真图像的2个标签;随后,在ViT(vision transformer)上进行预测MDSI得分和失真类型的多任务自监督学习;最后,将训练得到的模型在下游任务上进行微调,将上游任务学习到的语义特征迁移到下游任务。将本文方法与主流无参考图像质量评价(no reference image quality assessment,NR-IQA) 方法在多个公开的图像质量评价数据集上进行了充分比较,在LIVE、CSIQ、TID2013以及CID2013等数据集上的测试 结果相比于表现最好的算法均提升了1—2个百分点,这表明提出的算法优于大多数主流的NR-IQA算法。
2024, 35(8):793-802. DOI: 10.16136/i.joel.2024.08.0852
摘要:为了提升目标检测算法在多尺度学习方面的能力,尤其是对小目标的检测能力,本文提出了一种基于改进YOLOv5的超分辨率和多尺度融合目标检测算法。首先,该算法使用子像素卷积代替原YOLOv5模型的上采样操作,提高图像的分辨率,并尽可能保留小目标的信息。其次,使用并行快速多尺度融合(parallel fast multi-scale fusion,PFMF)模块实现深层特征和浅层特征的双向融合,将原YOLOv5算法的3尺度预测升级为4尺度预测,以此提高模型多尺度特征学习能力和对小目标的检测效果。实验结果表明,与YOLOv5s相比,改进后的模型在PASCAL VOC数据集中,mAP@0.5提高了2.8个百分点,mAP@0.5∶0.95提高了3.5个百分点;在MS COCO数据集中,mAP@0.5提高了4.3个百分点,mAP@0.5∶0.95提高了5.2个百分点。改进后的 YOLOv5模型在多尺度检测,尤其是小目标的检测效果方面得到了提升,并具有一定的应用价值。
2024, 35(8):803-809. DOI: 10.16136/j.joel.2024.08.0865
摘要:模糊图像复原是计算机视觉和图像处理领域的重要任务。针对思维进化算法(mind evolutionary algorithm,MEA)和小波神经网络(wavelet neural network,WNN)相结合的图像复原模型中,MEA的得分函数相对差别小、选优功能较弱等问题,提出了一种改进的MEA-WNN图像复原方法。该方法采用逻辑回归函数进行幂律变换,增加得分之间的差别,从而增强MEA的选优功能。将改进的模型与传统的基于WNN和MEA-WNN的图像复原模型进行对比,改进的模型把复原图像峰值信噪比(peak signal-to-noise ratio,PSNR)分别提高15%和6.5%、结构相似性(structural similarity,SSIM)提高了6.1%和5%,实验结果证明改进模型的有效性和优越性。
2024, 35(8):810-816. DOI: 10.16136/i.joel.2024.08.0814
摘要:为了进一步有效地提升低照图像的亮度、对比度和清晰度,提出了加权平台直方图均衡化的低照图像增强方法。该方法充分利用HSV颜色空间中明度分量V与色调H和饱和度S的独立性,将图像转换到HSV颜色空间;用具有良好边缘保持能力的双边滤波,将明度分量V通过Retinex算法分解为光照图像L和反射图像R;对光照图像L进行加权双平台直方图均衡化,其中,上、下平台阈值由正态分布的3σ原则自适应地确定,加权系数反比于灰度级对应的直方图频次。实验结果显示,相对于部分现有方法,本文方法增强后的图像效果较好,对应的信息熵和平均梯度分别比现有方法高出0.35和12以上,证明了本文方法具有更优的低照图像增强性能。
2024, 35(8):817-821. DOI: 10.16136/i.joel.2024.08.0376
摘要:为提升自动驾驶系统车道线检测的速度,提出了一种利用卷积神经网络进行特征提取,结合分类网络实现多车道线虚实线分类的方法。使用高效残差分解网络(efficient residual factorized ConvNet,ERFNet) 对图像进行卷积操作和下采样,采用无瓶颈一维卷积残差结构,利用纵、横两个方向一维卷积穿插提升非线性函数的泛化性能,依据可变填充比获得多尺度上下文信息完成图像特征提取。基于反卷积与上采样结果进行特征解码,恢复原图像尺度并输出分割后的图像。相较于传统语义分割算法,本方法可减少大量特征参数,增强模型的学习能力,在提升检测速度的同时保证检测精度。在直行、转弯、上坡、下坡,道路颠簸,光照不均匀等工况下的仿真测试实验表明,本文方法检测精度可达到95.14%,检测速度较主流算法有较好提升。
2024, 35(8):822-827. DOI: 10.16136/i.joel.2024.08.0822
摘要:为了研究不同色散模型对含孔隙TiO2薄膜的椭偏光谱分析的影响,分别采用5种色散模型对溶胶-凝胶法制备的TiO2薄膜在1.55—4 eV波长范围内的椭偏光谱进行拟合分析,并利用斜反射谱对各模型的拟合结果进行验证。结果表明:不同色散模型的选择对薄膜厚度和孔隙率的拟合结果均有影响,折射率色散的拟合结果受色散模型影响明显,New-Amorphous、Tauc-Lorentz、Adachi-New Forouhi模型均适用于溶胶-凝胶法TiO2薄膜在整个测试波段上的椭偏光谱拟合,而Cauchy Absorbent、Sellmeier Absorbent模型无法在整个测试波段得到较好的椭偏光谱拟合,适用波段较窄。该研究结果为含孔隙的溶胶-凝胶TiO2薄膜的椭偏光谱分析提供了色散模型选择参考。
2024, 35(8):828-835. DOI: 10.16136/i.joel.2024.08.0864
摘要:海洋立管是海洋工程中的重要结构,为了确保立管的正常工作,本文提出了利用弱光纤布拉格光栅传感光缆完成立管形态重构的方法,并利用有限元仿真实验进行了验证。首先将传感光缆按照背负式管道的形式沿立管轴向安装,基于Frenet-Serret框架设计了立管的形态重构算法;然后构建了立管监测有限元模型,求解并提取了多种变形情况下传感光缆内部应变数据,结合算法完成了立管的三维形状重建;最后对形态重构误差进行了分析和计算。结果表明,设计的立管形态重构方法的尾端误差控制在1.7%以内。该方法的立管形态重建效果较好,监测形式简单,具有一定工程应用价值。
2024, 35(8):836-843. DOI: 10.16136/i.joel.2024.08.0788
摘要:针对居民区用电负荷随机性强、稳定性差等问题,综合考虑各因素对居民用电负荷的影响,提出一种免疫支持向量机(support vector machine,SVM)算法负荷预测模型。以居民区历史用电量及相关气候数据为处理对象,使用PCA(principal component analysis)算法对电网历史数据进行处理,并结合免疫算法对电网历史数据进行预处理,形成数据簇并划定标签提供给预测模型进行训练。为提高模型精度,采用生物免疫优化算法对SVM模型参数进行优化,并在负荷预测环节,将预测误差作为调优依据,对预测模型进行反馈调优。将预测效果与常用于负荷预测的BP(back propagation)神经网络、SVM算法模型进行对比,免疫SVM算法负荷预测模型的短期、中期预测精准度均在98%以上,具有较好的精度与鲁棒性。
2024, 35(8):844-850. DOI: 10.16136/i.joel.2024.08.0455
摘要:针对四波横向剪切干涉(quadriwave lateral shearing interference,QLSI)相位重建中现有常规滤波窗提取差分相位时存在易受噪声、频谱泄漏和其他级次频谱串扰影响等问题,提出了一种采用菱形高斯组合窗滤波的相位重建方法。通过由频谱面内的菱形窗和垂直于频谱面的一系列二维高斯窗组合而成的滤波窗,从QLSI干涉图中提取两正交方向的差分相位,最终由两个差分相位通过基于最小二乘的傅里叶变换法重建出待测相位。采用标准样品进行实际测量,比较了使用菱形高斯组合窗和其他四种常规滤波窗滤波对重建相位的重建相位差、均方根误差(root mean square error, RMSE)和峰谷(peak to vally,PV)误差的影响。结果表明:本文提出的方法重建相位的相位差最接近样品标称值,重建相位的RMSE误差和PV误差均取得最小值,可以有效提高相位重建质量。
2024, 35(8):851-860. DOI: 10.16136/i.ioel.2024.08.0324
摘要:针对现有的基于自编码器和生成对抗网络的无监督深度学习算法在色织物缺陷检测任务中,存在普适性差、漏检率和误检率偏高等问题,提出一种U型注意力门自编码器(U-shaped attention gate auto-encoder,UAGAE)的色织物缺陷检测算法。首先,采用轻量化网络EfficientNet-B6作为特征提取模块来获取输入图像更具代表性的特征,通过引入注意力门(attention gate,AG)机制来抑制无关区域的特征响应,以解码器的特征作为参考剔除跳跃连接中的冗余信息来辅助图像重构;然后,在训练阶段使用组合的损失函数保证重构图像的结构和细节;最后,在检测阶段通过自适应阈值分割和数学形态学处理获得最终检测结果。所提算法在公共数据集YDFID-1上实现了53.45%的准确率(precision,P)、61.58%的召回率(recall,R)、53.63%的分数(F1-measure,F1)和40.83%的平均交并比(intersection over union,IoU),在14个花型上实现了最佳的F1和IoU。对比实验结果表明,UAGAE算法相较于其他几种缺陷检测算法能够更好地完成色织物的缺陷检测与定位。
2024, 35(8):861-867. DOI: 10.16136/i.joel.2024.08.0800
摘要:量子定位系统(quantum positioning system,QPS)具有定位精度高、安全系数高的特点,然而沙尘暴会使得光量子纠缠度产生较大变化,进而影响到量子定位系统的定位误差。为了降低这种误差,本文基于双卫星星地链路切换策略提出了抵抗沙尘暴干扰的最优纠缠度自适应(optimal entanglement degree adaptive,OEDA)策略。建立了沙尘暴各参数、传输距离与纠缠度之间的关系,并且将沙尘暴整体特征对系统的定位误差在自适应调整前后进行对比。仿真结果表明,当沙尘暴整体特征聚合因子为10,传输距离为10 km时,采用OEDA算法后,系统定位误差由0.14 m缩减至0.02 m,因而可知经过OEDA策略后可以提高沙尘暴天气下QPS的精确度。
2024, 35(8):868-873. DOI: 10.16136/i.joel.2024.08.0813
摘要:为了研究线偏振超短超强激光脉冲中高能电子运动和辐射的后向对称性,基于经典非线性Thomson散射的框架,借助数值模拟软件绘制了电子轨迹、空间辐射能量的角分布和空间频率分布直方图。研究发现,当激光脉冲短至只有几个周期时,非线性Thomson散射受激光初始相位的影响十分显著,其能量空间分布和运动轨迹具有很强的相关性,并且相对于驱动激光的初始相位具有“三重对称”的特性。高次谐波频谱的截止可以达到1×106ω0,而频谱峰值的对称性则可为实际激光参数的选择提供可行的思路。研究表明,通过激光脉冲包络相位调制获得理想的非线性Thomson后向散射空间辐射角分布和高次谐波幅度峰值是可行的。
2024, 35(8):874-879. DOI: 10.16136/j.joel.2024.08.0049
摘要:涡旋光场调控对涡旋光在激光通信、生物操控等领域的应用研究具有重要意义。为了揭示透镜球差对拉盖尔-高斯(Laguerre-Gaussian,LG)涡旋光束传输特性的影响,本文基于菲涅尔衍射理论,模拟研究了不同透镜球差系数下的LG光束聚焦场的强度、相位以及螺旋谱分布。结果表明:光学系统初级球差系数的增大恶化了LG光束聚焦场的强度分布和螺旋相位,弥散了轨道角动量(orbital angular momentum,OAM) 。由此,本文提出了一种光阑补偿方案,通过在透镜前添加大小合适的圆孔光阑,以消除透镜像差。光阑补偿后的LG光束聚焦场由星芒状空心分布恢复为空心圆环分布,OAM态保持单一稳定。本研究工作为改善透镜像差对涡旋光的传输影响提供了解决方案。
2024, 35(8):880-884. DOI: 10.16136/i.joel.2024.08.0437
摘要:圆锥角膜是一种进展性的角膜疾病,多发于青春期,会造成不规则散光以及视力下降,晚期致盲需进行角膜移植,因此圆锥角膜的早期精准筛查是阻止疾病进展避免恶化的必要条件。神经网络作为一种经典的算法是圆锥角膜诊断的有效工具。但随着圆锥角膜病例数据日益增长,为了充分利用新增数据,往往需要对所有样本重新训练,这将耗费大量的时间。为了解决上述问题,本文提出集成神经网络的增量式学习算法,以实现圆锥角膜的智能诊断。此外,本文还引入欠采样和代价敏感思想,用于解决已有增量式学习算法无法处理不均衡数据的问题。实验结果表明,本文提出的算法识别精度达到97%,并且所需训练时间短、存储空间少,因此本算法能够更高效地辅助圆锥角膜诊断。
2024, 35(8):885-896. DOI: 10.16136/i.joel.2024.08.0107
摘要:m波段掺Er3+激光增益介质凭借其独特的优点在生物医学、环境探测及非线性光学等领域有着重要的应用。但由于Er3+的4I13/2下能级寿命长于上能级4I11/2 ,导致激光阈值高、热效应严重等问题,众多研究者采取退激活、热键合、单晶光纤(single crystal fiber,SCF) 、级联激光及低声子能量等方式致力于探索低阈值、高光束质量的增益介质。近10年来,相较于同波段的其他介质,掺Er3+激光增益介质发展成熟,相应的激光性能日渐提升,有望在其应用领域得到进一步的发展。本文综述了以YAG(Y3Al5O12)、YSGG(Y3Sc2Ga3O12)、YAP(YAlO3)等为主的Er3+掺杂激光晶体、以Y2O3、Lu2O3为主的Er3+掺杂透明陶瓷和以ZBLAN(ZrF4-BaF2-LaF3-AlF3-NaF)为主的Er3+掺杂氟锆玻璃的研究进展情况,其中重点介绍了相关结果与实验方案并对未来的发展趋势进行了展望。