针对目前单目图像在深度估计中依然存在边缘以及深度最大区域预测不准确的问题,提出了一种基于金字塔分割注意力网络的单目深度估计方法(PS-Net)。首先,PS-Net以边界引导和场景聚合网络(BS-Net)为基础,引入金字塔分割注意力(PSA)模块处理多尺度特征的空间信息并且有效建立多尺度通道注意力间的长期依赖关系,从而提取深度梯度变化剧烈的边界和深度最大的区域;然后,使用Mish函数作为解码器中的激活函数,以进一步提升网络的性能;最后,在NYUD v2(New York University Depth dataset v2)和iBims-1(independent Benchmark images and matched scans v1)数据集上进行训练评估。iBims-1数据集上的实验结果显示,所提网络在衡量定向深度误差(DDE)方面与BS-Net相比减小了1.42个百分点,正确预测深度像素的比例达到81.69%。以上表明所提网络在深度预测上具有较高的准确性。
针对交通标志识别模型检测速度与识别精度不均衡,以及受遮挡目标和小目标难以检测的问题,对YOLOv5模型进行改进,提出一种基于坐标注意力(CA)的轻量级交通标志识别模型。首先,通过在主干网络中融入CA机制,有效地捕获位置信息和通道之间的关系,从而更准确地获取感兴趣区域,避免过多的计算开销;然后,通过在特征融合网络中加入跨层连接,在不增加成本的情况下融合更多的特征信息,提高网络的特征提取能力,并改善对遮挡目标的检测效果;最后,引入改进的CIoU函数计算定位损失,以缓解检测过程中样本尺寸分布不均衡的现象,并进一步提高对小目标的识别精度。在TT100K数据集上应用所提模型时,识别精度达到了91.5%,召回率达到了86.64%,与传统的YOLOv5n模型相比分别提高了20.96%和11.62%,且帧处理速率达到了140.84 FPS。实验结果比较充分地验证了所提模型在真实场景中对交通标志检测与识别的准确性与实时性。
针对人脸编辑存在的编辑结果不自然、生成图像变化较大等问题,提出了一种有闭解的可控人脸编辑算法。首先,随机采样 n 个潜在向量来构造样本矩阵,并计算出该矩阵的前 k 个主成分向量;然后,利用ResNet-50得到人脸图像的5个属性,并通过支持向量机(SVM)计算出各属性的语义边界;最后,计算这些属性的可解释方向向量,这些向量在尽量靠近主成分向量的同时也尽量远离对应属性的语义边界,从而减小人脸属性之间的耦合性,并提高编辑过程中的可控性。该算法具有闭解,因此效率较高。实验结果表明,所提算法和语义的闭式分解(SeFa)算法和可解释的生成对抗网络控制(GANSpace)算法相比,在初始分数(IS)上分别增加了19%和26%,在弗雷歇距离(FID)上分别减小了4%和37%,在最大平均差异(MMD)上分别减小了15%和48%。可见,该算法具有较好的可控性和解耦性。
针对犹豫模糊聚类分析存在信息失真、属性权重客观性差、时间复杂度高的问题,提出一种基于犹豫模糊集的凝聚式层次聚类算法(AHCHF)。首先,采用犹豫模糊元的平均值扩充犹豫度小的数据对象;其次,利用原始信息熵和内部最大差异计算数据对象扩充前后的权重,并根据两个权重向量之间的最小鉴别信息确定属性的综合权重;最后,以加权距离和更小为目标,给出犹豫度恒定的中心点构造方法。在具体实例和人造数据集上进行的实验结果表明,相较于经典的犹豫模糊层次聚类算法(HFHC)和较新的模糊层次聚类算法(FHCA),AHCHF的轮廓系数(SC)均值分别提高了23.99%和9.28%,运行时间分别平均减少了27.18%和6.40%。以上结果验证了所提算法可以有效解决信息失真、属性权重客观性差的问题,并较好地提升聚类效果和聚类性能。
针对深度谱聚类模型训练不稳定和泛化能力弱等问题,提出L1正则化的深度谱聚类算法(DSCLR)。首先,在深度谱聚类的目标函数中引入L1正则化,使深度神经网络模型生成的拉普拉斯矩阵的特征向量稀疏化,并提升模型的泛化能力;其次,通过利用参数化修正线性单元激活函数(PReLU)改进基于深度神经网络的谱聚类算法的网络结构,解决模型训练不稳定和欠拟合问题。在MNIST数据集上的实验结果表明,所提算法在聚类精度(CA)、归一化互信息(NMI)指数和调整兰德系数(ARI)这3个评价指标上,相较于深度谱聚类算法分别提升了11.85、7.75和17.19个百分点。此外,所提算法相较于深度嵌入聚类(DEC)和基于对偶自编码器网络的深度谱聚类(DSCDAN)等算法,在CA、NMI和ARI这3个评价指标上也有大幅提升。
针对标准人工蜂群(ABC)算法存在开发能力弱、收敛速度慢的缺点,提出了一种基于多种群组合策略的ABC算法。首先,将异维协同和多维匹配的更新机制引入搜索方程;然后,针对雇佣蜂和跟随蜂分别设计了两种组合策略,组合策略是由侧重于广度探索和深度开发的两个子策略构成。在跟随蜂阶段,将种群划分为自由子集和非自由子集,并使属于不同子集的个体采用不同的子策略,从而平衡算法的探索与开发能力。通过15个标准测试函数将所提改进ABC算法与标准ABC算法和其他3种改进ABC算法进行仿真对比,结果表明所提算法在低维和高维问题中都具有更好的寻优性能。
针对应急前期运输商自有车辆不足的实际背景,采用自有车辆和第三方租用车辆共同配送的运输模式,对混合车辆路径的组合优化问题进行研究。首先,考虑需求点和运输商的不同利益诉求,以系统满意度最大、系统配送时间和总成本最小为优化目标,建立带软时间窗的多目标混合车辆路径优化模型。其次,考虑NSGA-Ⅱ算法在求解该类问题时收敛性差和Pareto前沿分布不均匀的缺点,将蚁群算法的启发式策略和信息素正反馈机制用于生成子代种群,非支配排序策略模型用于指导算法的多目标择优过程,并引入变邻域下降搜索以扩大搜索空间,提出求解多目标的非支配排序蚁群算法以突破原有算法瓶颈。算例表明:构建的模型可对决策者在不同的情境下依据不同的优化目标选择合理的路径提供参考,提出的算法在求解不同规模的问题和不同分布类型的问题中均表现出较好的性能。
为实现亮度不均的复杂纹理背景下表面划痕的鲁棒、精确、实时识别,提出一种基于深度神经网络的表面划痕识别方法。用于表面划痕识别的深度神经网络由风格迁移网络和聚焦卷积神经网络(CNN)构成,其中风格迁移网络针对亮度不均的复杂背景下的表面划痕进行预处理,风格迁移网络包括前馈转换网络和损失网络,首先通过损失网络提取亮度均匀模板的风格特征和检测图像的知觉特征,对前馈转换网络进行离线训练,获取网络最优参数值,最终使风格迁移网络生成亮度均匀且风格一致的图像,然后,利用所提出的基于聚焦结构的聚焦卷积神经网络对生成图像中的划痕特征进行提取并识别。以光照变化的金属表面为例,进行划痕识别实验,实验结果表明:与需要人工设计特征的传统图像处理方法及传统深度卷积神经网络相比,划痕漏报率低至8.54%,并且收敛速度更快,收敛曲线更加平滑,在不同的深度模型下均可取得较好的检测效果,准确率提升2%左右。风格迁移网络能够保留完整划痕特征的同时有效解决亮度不均的问题,从而提高划痕识别精度;同时聚焦卷积神经网络能够实现对划痕的鲁棒、精确、实时识别,大幅度降低划痕漏报率和误报率。
针对路网限制和物体位置的不确定性,提出了路网中位置不确定的二元反kNN查询(PBRkNN),旨在查找一组位置不确定的点,使得每个不确定点的kNN包含给定查询点的概率大于一个阈值。为了解决该问题,首先提出一种基于Dijkstra进行剪枝处理的基本算法,即PE算法;接着在PE算法的基础上通过预处理计算出每个点的kNN从而加快查询速度,即PPE算法;而为了进一步减小PPE算法中范围查询的开销,提出PPEE算法,利用网格索引来索引范围查询中要查询的不确定空间点,从而提升算法的效率。最后,在北京和加州路网数据集上进行了大量实验,结果表明通过一些预处理的策略确实可以有效地处理路网中位置不确定的二元反kNN查询。
针对3D打印中已有自适应分层算法不能有效保留模型特征的问题,提出了一种新的识别和保留模型特征的自适应分层算法。首先,扩展了模型特征的定义,引入了模型特征丢失和偏移的概念;然后,提出了一种特征识别的方法,其识别模型特征的关键在于利用了模型特征出现的地方必然伴随着模型表面复杂度或切片轮廓数的变化这一性质;最后,在已有自适应分层算法的基础上,通过在特征附近用最小的分层厚度处理模型来保留模型的特征。在自主开发的软件Slicer3DP上实现了均匀分层、自适应分层和所提的分层算法,对比发现所提算法能有效解决模型特征的丢失和偏移,兼顾了分层精度和效率。仿真表明该算法可以用于对模型精度要求较高的3D打印中。
针对传统优化链路状态路由(OLSR)协议中利用贪婪算法求解最小多点中继(MPR)集时存在冗余的问题,提出了一种基于全局改进的Global_OP_MPR算法。首先引入了一种基于贪婪算法改进的OP_MPR算法,该算法通过逐步优化MPR集的方法去除冗余,可以简单高效地得到最小MPR集;然后在OP_MPR算法的基础上,将全局因素加入MPR选择判据中,引入"全局优化"代替"局部优化",最终利用该算法可以得到整个网络的最小MPR集。在OPNET上采用Random Waypoint运动模型进行仿真,与传统OLSR协议相比,采用OP_MPR和Global_OP_MPR算法的OLSR协议在整个网络上有效地减少了MPR节点的数量,并且具有更少的网络负担拓扑控制(TC)分组数和更低的网络延时。仿真结果表明,所提出的算法均能优化MPR集的大小,提高协议的网络性能;同时,Global_OP_MPR算法由于考虑了全局因素,达到了更好的网络性能效果。
为了提高粒子群优化算法的求解性能,提出了一种具有柯西种群分布的自适应范围搜索的粒子群优化算法(ARPSO/C)。该算法在种群服从柯西分布的假设下,在每一次迭代中利用个体分布的中位数和尺度参数来自适应地调整种群的搜索范围,从而在局部搜索和全局搜索之间达到了一个很好的平衡。最后的数值实验结果表明:与ARPSO和PSO算法相比,该算法收敛速度得到了显著提高,并且能够有效地克服早熟现象。
基于Parzen窗的朴素贝叶斯在区间不确定性数据分类中存在计算复杂度高、空间需求大的不足。针对该问题,提出一种改进的区间不确定性数据分类方法IU-PNBC。首先采用Parzen窗估计区间样本的类条件概率密度函数(CCPDF);然后通过代数插值得到类条件概率密度函数的近似函数;最后利用近似代数插值函数计算样本的后验概率, 并用于预测。通过人工生成的仿真数据和UCI标准数据集验证了算法假设的合理性以及插值点数对IU-PNBC算法分类精度的影响。实验结果表明,当插值点数大于15时,IU-PNBC算法的分类精度趋于稳定,且插值点数越多,算法分类精度越高;该算法可以避免原Parzen窗估计对训练样本的依赖, 并有效降低计算复杂度;同时由于该算法具有远低于基于Parzen窗的朴素贝叶斯的运行时间和空间需求, 因此适合解决数据量较大的区间不确定性数据分类问题。