重大突发性传染病以它的强传染性、快变异性和高风险性,对人类生命安全与经济发展构成重大威胁。流行病学调查是遏制传染病扩散的关键步骤和落实全链路精准防控的前提。针对现有流调系统存在的人工效率低下、数据质量差、专业知识不足等问题,在现有数字化的基础上结合知识图谱,提出一套辅助流行病学调查的技术应用方案。首先,基于人、地、事、物、组织五大类实体及其关系和属性构建知识图谱;其次,根据病例查风险点位查密接的思路,以病例为起点,以点位为重心,辅助判定风险人群和风险点位;最后,通过对流调数据的可视化分析,实现流调信息落位、传播扩散溯源和疫情态势感知等多个应用,从而辅助重大突发性传染病防控工作的顺利开展。在相同的误差范围内,基于图谱增强的轨迹落位方法的准确率显著高于传统基于人工问询的方法,千米内的判定准确率达到85.15%;基于图谱增强的风险点位和人群的判定方法使得效率显著提升,生成报告的平均耗时降至1 h内。实验结果表明,所提方案有效融合了知识图谱的技术优势,不仅提高了精准疫情防控策略制定的科学性与时效性,更为流行病传染预防领域的实践探索提供了重要的参考价值。
针对宫颈细胞核图像分割中上下文信息联系匮乏和边缘分割不准确且精度低等问题,提出一种基于U-net改进的结合密集块的U型卷积多尺度引导滤波模块的宫颈细胞核分割网络DGU-Net (Dense-Guided-UNet),可以更完整且精确地分割宫颈细胞核图像。首先,以编码器、解码器结构的U-net模型作为网络骨干提取图像特征;其次,引入密集块模块连接不同层之间的特征,实现上下文信息的传递,从而增强模型的特征提取能力;同时,在每次下采样后和上采样前引入多尺度引导滤波模块,从而引入灰度引导图像中明显的边缘细节信息,增强图像细节和边缘信息;最后,在每个解码器路径中都增加一个侧输出层,融合并平均所有输出的特征信息,从而融合不同尺度不同层次的特征信息,提升结果的准确性和完整性。在Herlev数据集上实验,并把所提网络与U-net、PGU-net+ (Progressive Growing of U-net+)和LFANet (Lightweight Feature Attention Network)这3种深度学习模型对比。结果表明,与PGU-net+相比,DGU-Net的准确率提升了70.06%;与LFANet相比,DGU-Net的交并比(IoU)提升了6.75%。可见,DGU-Net在边缘细节信息处理上更准确,并在分割指标上普遍优于对比模型。
现有的烟火检测方法主要依赖员工现场巡视,效率低且实时性差,因此,提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD (YOLOv5s-MPDIoU-RevCol-Dyhead)。首先,采用MPDIoU (Maximized Position-Dependent Intersection over Union)方法改进边框损失函数,以适应重叠或非重叠的边界框回归(BBR),从而提高BBR的准确性和效率;其次,利用可逆柱状结构RevCol(Reversible Column)网络模型思想重构YOLOv5s模型的主干网络,使它具有多柱状网络架构,并在模型的不同层之间加入可逆链接,从而最大限度地保持特征信息以提高网络的特征提取能力;最后,引入Dynamic head检测头,以统一尺度感知、空间感知和任务感知,从而在不额外增加计算开销的条件下显著提高目标检测头的准确性和有效性。实验结果表明:在DFS(Data of Fire and Smoke)数据集上,与原始YOLOv5s算法相比,所提算法的平均精度均值(mAP@0.5)提升了9.3%,预测准确率提升了6.6%,召回率提升了13.8%。可见,所提算法能满足当前烟火检测应用场景的要求。
静态背景信息和运动前景对象的数据分布不平衡通常会引起发生异常的前景区域信息学习不充分问题,进而影响视频异常检测(VAD)的精度。为了解决上述问题,提出一种用于VAD的嵌套U型帧预测生成对抗网络(NUFP-GAN)方法。所提方法使用具有突出视频帧中显著目标能力的嵌套U型帧预测网络架构作为帧预测模块,并在判别阶段设计一个自注意力补丁判别器,应用不同大小的感受野提取视频帧中更重要的外观和运动特征,以提升异常检测的准确性。此外,为保证预测帧和真实帧在高级语义信息上的多尺度特征一致性,引入多尺度一致性损失,以进一步提升方法的异常检测效果。实验结果表明,所提方法在CUHK Avenue、UCSD Ped1、UCSD Ped2和ShanghaiTech数据集上的曲线下面积(AUC)值分别达到了87.6%、85.2%、96.0%和73.3%;与MAMC (Memory-enhanced Appearance-Motion Consistency)方法相比,所提方法在ShanghaiTech数据集上的AUC值提升了1.8个百分点。可见,所提方法能够有效应对VAD中数据分布不平衡带来的挑战。
协议转换通常用于解决不同协议之间的数据交互问题,它的本质是寻找不同协议字段之间的映射关系。传统的协议转换方法存在以下缺点:转换大多是在特定协议的基础上设计的,因而这些转换是静态的,灵活性较差,不适用于多协议转换的场景;一旦协议发生改变,就需要再次分析协议的结构和字段语义以重新构建字段之间的映射关系,从而产生指数级的工作量,降低了协议转换的效率。因此,提出基于语义相似度的通用协议转换方法,旨在通过智能的方法发掘字段间的映射关系,进而提高协议转换的效率。首先,通过BERT (Bidirectional Encoder Representations from Transformers)模型分类协议字段,并排除“不应该”存在映射关系的字段;其次,通过计算字段之间的语义相似度,推理字段之间的映射关系,进而构建字段映射表;最后,提出基于语义相似度的通用协议转换框架,并定义相关协议以进行验证。仿真实验结果表明:所提方法的字段分类精准率达到了94.44%;映射关系识别精准率达到了90.70%,相较于基于知识抽取的方法提高了13.93%。以上结果验证了所提方法的有可行性,该方法可以快速识别不同协议字段之间的映射关系,适用于无人协同中多协议转换的场景。
面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE (Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec (Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。
针对内镜语义分割网络中病灶边缘信息丢失和大面积病灶分割不全的问题,提出一种引入解耦残差自注意力(DRA)的边界交叉监督语义分割网络(BCS-SegNet)。首先,引入DRA,以增强网络对远距离关联性病灶的学习能力;其次,构建跨级交叉融合(CLF)模块,从而将编码结构中的多级特征图逐对组合,进而实现在低计算成本下图像细节与语义信息的融合;最后,使用多方向多尺度的二维Gabor变换提取边缘信息,并使用空间注意力加权特征图中的边缘特征,以监督分割网络的解码过程,从而在像素级别上提供更精准的类内分割一致性。实验结果表明,在ISIC2018皮肤镜和Kvasir-SEG/CVC-ClinicDB结肠镜数据集上,BCS-SegNet的平均交并比(mIoU)和Dice系数分别为84.27%、90.68%和79.24%、87.91%;在自建食管内镜数据集上,BCS-SegNet的mIoU和Dice系数分别为82.73%和90.84%,mIoU相较于U-net和UCTransNet分别提升了3.30%和4.97%。可见,所提网络可以达到更完整的分割区域和更清晰的边缘细节等视觉效果。
在多标签分类任务中,现有模型对依赖关系的构建主要考虑标签在训练集中是否共现,而忽视了标签之间各种不同类型的关系以及在不同样本中的动态交互关系。因此,结合多标签关系图和局部动态重构图学习更完整的标签依赖关系。首先,根据标签的全局共现关系,采用数据驱动的方式构建多标签关系图,学习标签之间不同类型的依赖关系;其次,通过标签注意力机制探索文本信息和标签语义的关联性;最后,对标签图进行动态重构学习,以捕获标签之间的局部特定关系。在3个公开数据集BibTeX、Delicious和Reuters-21578上的实验结果表明,所提模型的宏平均F1(maF1)值相较于MrMP(Multi-relation Message Passing)分别提高了1.6、1.0和2.2个百分点,综合性能得到提升。
注意力机制的引入使得主干网能够学习更具区分性的特征表示。然而,为了控制注意力的复杂度,传统的注意力机制采用的通道降维或减少通道数而增加批量大小的策略会导致过度减少通道数和损失重要特征信息的问题。为解决这一问题,提出通道重洗注意力(CSA)模块。首先,利用分组卷积学习注意力权重,以控制CSA的复杂度;其次,通过传统通道重洗和深层通道重洗(DCS)方法,增强不同组间的通道特征信息交流;再次,使用逆通道重洗恢复注意力权重的顺序;最后,将恢复后的注意力权重与原始特征图相乘,以获得更具表达能力的特征图。实验结果表明,在CIFAR-100数据集上,与添加CA(Coordinate Attention)的ResNet50相比,添加CSA的ResNet50的参数量降低了2.3%,Top-1准确率提升了0.57个百分点;与添加EMA(Efficient Multi-scale Attention)的ResNet50相比,添加CSA的ResNet50的计算量降低了18.4%,Top-1准确率提升了0.27个百分点。在COCO2017数据集上,添加CSA的YOLOv5s比添加CA和EMA的YOLOv5s在平均精度均值(mAP@50)上分别提升了0.5和0.2个百分点。可见,CSA达到了参数量和计算量的平衡,并能够同时提升图像分类任务的准确率和目标检测任务的定位能力。
针对全变分(TV)最小化方法在低剂量计算机断层扫描(LDCT)图像重建中易导致的图像过平滑和块状效应等问题,提出一种基于低秩与TV联合正则化的LDCT图像重建方法,以提升LDCT重建图像的视觉质量。首先,建立一个基于低秩与TV联合正则化的图像重建模型,从而从理论上获得更精确和自然的重建结果;其次,通过引入具有非局部自相似特性的低秩先验克服仅使用TV最小化方法存在的局限性;最后,采用Chambolle-Pock (CP)算法优化求解上述模型,以提高模型的求解效率,并保证模型能有效求解。在3种不同LDCT扫描条件下验证所提方法的有效性。在Mayo数据集上的实验结果表明,与PWLS-LDMM(Penalized Weighted Least-Squares based on Low-Dimensional Manifold)方法、NOWNUNM(NOnlocal Weighted NUclear Norm Minimization)方法和CP方法相比,在25%剂量下,所提方法的视觉信息保真度(VIF)分别提升了28.39%、8.30%和2.93%;在15%剂量下,所提方法的VIF分别提升了29.96%、13.83%和4.53%;在10%剂量下,所提方法的VIF分别提升了30.22%、17.10%和7.66%。可见,所提方法在消除噪声和条纹伪影的同时能保留更多的细节纹理信息,验证了所提方法具有较好的噪声伪影抑制能力。
多模态三维目标检测是计算机视觉的一项重要任务,如何更好地融合不同模态之间的信息一直是该任务的研究重点。现有方法在融合不同模态信息时缺少对信息的筛选,且过多无关与干扰信息会造成模型性能的下降。针对上述问题,提出一种基于多模态信息相互引导补充的雷达-相机三维目标检测模型,以在融合特征时从另一种模态中自适应地挑选信息进行融合。自适应信息融合包括数据层面的相互引导补充和特征层面的相互引导补充。在数据层面的融合中,使用由点云产生的深度图和图像产生的分割掩码作为输入,以分别构建出实例级的深度图与实例级的三维虚拟点用于图像与点云的补充。在特征层面的融合中,使用点云产生的体素特征和图像产生的特征图作为输入,并从另一种模态中为待融合特征选取关键区域并通过注意力机制进行特征融合。实验结果表明,所提模型在nuScenes测试集上取得了良好的效果。相较于BEVFusion和TransFusion等传统非引导的融合模型,所提模型将平均精度均值(mAP)和nuScenes检测分数(NDS)这2个主流评测指标分别提升了0.9~28.9个百分点和0.6~26.1个百分点。以上验证了所提模型可有效提高多模态三维目标检测的准确性。
针对复杂地形环境下的无人机(UAV)路径规划问题,提出一种基于改进鲸鱼优化算法(MWOA)的动态UAV路径规划方法。首先,通过解析山体地形、动态目标和威胁区,建立三维动态环境与UAV航路模型;其次,提出一种自适应步长高斯游走策略,并将该策略用于平衡算法的全局探索与局部发掘的能力;最后,提出一种辅助修正策略对种群最优个体进行修正,并结合差分进化策略,在避免种群陷入局部最优的同时提高算法的收敛精度。为验证MWOA的有效性,使用MWOA与鲸鱼优化算法(WOA)、人工蜂鸟算法(AHA)等智能算法求解CEC2022测试函数,并在设计的UAV动态环境模型中进行验证。仿真结果对比分析表明,与WOA相比,MWOA的收敛精度提高了6.1%,标准差减小了44.7%。可见,所提MWOA收敛更快且精度更高,能有效处理UAV路径规划问题。
为解决工业云存储系统数据遭受篡改等网络主动攻击问题,实现工业数据云端安全共享的目标,并确保工业数据传输与存储过程的机密性、完整性与可用性,提出基于工业云存储系统的数据防篡改批量审计方案。在该方案中,设计基于双线性对映射的同态数字签名算法,使第三方审计者实现对工业云存储系统数据的批量防篡改完整性检测,并及时将防篡改完整性审计结果反馈给工程服务终端用户;此外,通过加入审计者减轻工程服务终端用户的计算负担,同时确保工业加密数据在传输与存储过程中的完整性。安全性分析与性能比较结果表明,所提方案通过设计防篡改检测向量,使得第三方审计者的计算量从O(n)次双线性对操作减少到O(1)次常量级双线性对操作,极大地降低了第三方审计者的计算开销。可见,所提方案适用于需要对大量工业云存储系统核心数据文件进行防篡改检测的轻量级批量审计场景。
构建数字孪生水利建设知识图谱挖掘水利建设对象之间的潜在关系能够帮助相关人员优化水利建设设计方案和决策。针对数字孪生水利建设的学科交叉和知识结构复杂的特性,以及通用知识抽取模型缺乏对水利领域知识的学习和知识抽取精度不足等问题,为提高知识抽取的精度,提出一种基于大语言模型的数字孪生水利建设知识抽取方法(DTKE-LLM)。该方法通过LangChain部署本地大语言模型(LLM)并集成数字孪生水利领域知识,基于提示学习微调LLM,LLM利用语义理解和生成能力抽取知识,同时,设计异源实体对齐策略优化实体抽取结果。在水利领域语料库上进行对比实验和消融实验,以验证所提方法的有效性。对比实验结果表明,相较于基于深度学习的双向长短期记忆条件随机场(BiLSTM-CRF)命名实体识别模型和通用信息抽取模型UIE(Universal Information Extraction),DTKE-LLM的精确率更优;消融实验结果表明,相较于ChatGLM2-6B(Chat Generative Language Model 2.6 Billion),DTKE-LLM的实体抽取和关系抽取F1值分别提高了5.5和3.2个百分点。可见,该方法在保障知识图谱构建质量的基础上,实现了数字孪生水利建设知识图谱的构建。
个性化学习推荐是智慧教育领域的重要研究课题,它的核心目标是利用推荐算法和模型为学习者提供与他们的个人学习需求、兴趣、能力和历史相匹配的有效学习资源,从而提高学习者的学习效果。目前的推荐方法存在冷启动、数据稀疏、可解释性差和过度个性化等问题,而知识图谱与大语言模型的结合为解决上述问题提供了有力支持。首先,对个性化学习推荐的概念、研究现状等内容进行概述;其次,分别讨论知识图谱和大语言模型(LLM)的概念以及在个性化学习推荐中的具体应用;再次,总结知识图谱与LLM在个性化学习推荐中协同应用的方法;最后,展望知识图谱和LLM在个性化学习推荐中的未来发展方向,从而为个性化学习推荐领域的持续发展和创新实践提供借鉴和启示。
随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化的回答,实现“因材施教”。因此,提出一种基于学生能力感知的个性化对话助手框架。该框架包括2个主要模块:学生能力感知模块和个性化回答生成模块。能力感知模块通过分析学生的答题记录来挖掘学生的知识掌握程度,回答生成模块则根据学生的能力生成个性化回答。基于此框架,设计基于指令、基于小模型驱动和基于智能体Agent的3种实现范式,以深入探讨框架的实际效果。基于指令的对话助手利用LLM的推理能力,从学生的答题记录中挖掘知识掌握程度以帮助生成个性化回答;基于小模型驱动的对话助手利用深度知识追踪(DKT)模型生成学生的知识掌握程度;基于Agent的个性化对话助手采用LLM Agent的方式整合学生能力感知、个性化检测、答案修正等工具辅助答案的生成。基于ChatGLM(Chat General Language Model)、GPT4o_mini的对比实验结果表明,应用3种范式的LLM均能为学生提供个性化的回答,其中基于Agent的范式的准确度更高,表明该范式能更好地感知学生能力,并生成个性化回答。
基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成(MSRAG)方法。首先,根据用户输入的查询特点自适应地匹配检索模型来召回相关文本;其次,利用文本过滤器提取出能够回答问题的关键文本片段;再次,使用文本过滤器进行内容有效性判断以启动基于同义词拓展的查询改写,并将初始查询与改写后的信息合并输入检索控制器以进行更有针对性的再次检索;最后,合并能够回答问题的关键文本片段和问题,并使用提示工程输入生成答案模型来生成响应返回给用户。实验结果表明,MSRAG方法在军事领域数据集(Military)和Medical数据集的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence)指标上相较于凸线性组合RAG方法分别提高了14.35和5.83个百分点。可见,MSRAG方法具备较强的通用性和可移植性,能够缓解非必要查询改写导致的语义漂移现象,有效帮助大模型生成更准确的答案。
常识问答(CQA)是利用常识知识对自然语言问句进行自动求解以得到准确答案的任务,属于智能问答领域。该任务通常需要背景常识知识提升模型的求解能力,现有的大多数相关方法依赖于从文本数据中提取和利用常识。然而,常识通常具有隐含性,并不总是直接体现在文本内容中,影响了这些方法的应用范围和效果。因此,提出基于跨模态对比学习的CQA模型,以充分利用跨模态信息丰富常识的表达。首先,设计一个跨模态常识表示模块,以融合常识库和跨模态大模型,从而获取跨模态的常识表示;其次,对问题和选项的跨模态表示进行对比学习,从而增强模型对不同选项之间的区分能力;最后,利用softmax层为问题选项对生成相关性分数,并根据分数的高低确定最终的预测答案。在公开数据集CSQA(CommonSenseQA)和OBQA(OpenBookQA)上进行的实验结果表明,与DEKCOR(DEscriptive Knowledge for COmmonsense question answeRing)相比,所提模型的准确率分别提高了1.46和0.71个百分点。
CTCS-3级(Chinese Train Control System-3)列控车载设备在保障列车安全和提高运行效率方面发挥着重要作用。车载接口设备实现车载列车自动防护(ATP)系统与地面设备、司机和列车的交互,然而它的故障在车载设备故障中占比高。为了确定故障原因并保证行车安全,提出一种基于时序知识图谱补全的列控车载接口设备故障诊断方法。首先,采用引入时序的方式整合行车日志和故障统计数据,从而提取故障现象并对齐实体,构建时序知识图谱;其次,构建基于图谱补全的故障诊断网络,融合时序翻译(T-TransE)向量化算法、双向长短期记忆(Bi-LSTM)网络和自注意力(SA)机制提取时序特征;最后,使用某铁路局近几年的车载接口设备故障数据对T-TransE向量化模型进行预训练,选出效果最佳的时序引入方式。为验证所提方法的优越性以及数据结合方式的有效性,使用车载故障数据对不进行数据结合且不进行时序关系引入的故障诊断网络以及其他常见的故障诊断网络进行测试。实验结果表明,在同一语料的情况下,与其他故障诊断框架相比,基于时序知识图谱补全的故障诊断模型正确率最高,达到96.69%。
遥感图像中目标尺度变化大且目标长宽比差异大,导致遥感图像目标检测困难。针对遥感图像的这一特点,通过改进YOLO框架,提出EW-YOLO(Efficient Weighted-YOLO)提高遥感图像目标检测的精度。首先,在特征融合部分,设计多级特征融合结构,以利用双分支的残差模块促进不同尺度特征的融合,并通过融合模块的级联以及跨层特征的融合设计,增强对不同尺度目标的提取能力,并进一步增强检测能力;其次,在预测部分,提出加权检测头,引入加权检测框融合(WBF),以利用置信度分数对每个候选框进行加权,并融合生成预测框,从而提高不同长宽比目标的检测精度;最后,针对图像尺寸过大的问题,提出图像重采样处理方法,即通过将图像采样至合适大小并参与网络训练,解决由于切割造成的大尺寸目标检测精度较低的问题。在DOTA数据集上进行的实验的结果表明,所提方法的检测平均精度均值(mAP)达到了77.47%,较基于原始YOLO框架的方法提升了1.55个百分点,且优于目前的主流方法。同时,也在HRSC和UCAS-AOD数据集上验证了所提方法的有效性。
近年来,生成对抗网络(GAN)用于低剂量计算机断层成像(LDCT)图像降噪已经表现出显著的性能优势,成为该领域的研究热点。然而,GAN的生成器对LDCT图像中噪声和伪影分布的感知能力不足,导致网络的降噪性能受限。因此,提出一种基于双编码器双解码器生成对抗网络(DualED-GAN)的低剂量CT降噪模型。首先,提出由一对编解码器构成伪影像素级特征提取通道,用于估计LDCT中的伪影噪声;其次,提出由另外一对编解码器构成伪影掩码信息提取通道,用于估计伪影的强度和位置信息;最后,采用伪影图像质量标签图辅助估计伪影的掩码信息,可以为伪影像素级特征提取通道提供补充特征,进而提高GAN降噪网络对伪影噪声分布强度的敏感性。实验结果表明,在mayo测试集上与次优模型DESD-GAN(Dual-Encoder-Single-Decoder based Generative Adversarial Network)相比,所提模型的平均峰值信噪比(PSNR)提高了0.338 7 dB,平均结构相似性度(SSIM)提高了0.002 8。可见,所提模型在伪影抑制、结构保留与模型鲁棒性方面均有更好的表现。
针对基于深度学习的水印方法未充分突显图像的关键特征,以及未有效利用中间卷积层输出特征的问题,为提升含水印图像的视觉质量和抵抗噪声攻击的能力,提出一种融合注意力机制和多尺度特征的图像水印方法。在编码器部分,设计注意力模块关注重要图像特征,以减小水印嵌入引起的图像失真;在解码器部分,设计多尺度特征提取模块,以捕获不同层次的图像细节。实验结果表明,在COCO数据集上与深度水印模型HiDDeN(Hiding Data with Deep Networks)相比,所提方法生成的含水印图像的峰值信噪比(PSNR)和结构相似度(SSIM)分别增加了11.63%和1.29%;所提方法针对dropout、cropout、crop、高斯模糊和JPEG压缩的水印提取平均误比特率(BER)降低了53.85%;此外,消融实验结果验证了添加注意力模块和多尺度特征提取模块的方法有更好的不可见性和鲁棒性。
遥感数据具有高度的时空相关性以及复杂的地物特征,使得这些数据的隐私保护面临挑战。联邦学习作为一种旨在保护参与方数据隐私的分布式学习方法,为应对遥感数据隐私保护面对的挑战提供了有效的解决方案;然而,在联邦学习模型的训练阶段,恶意攻击者可能通过反演推断参与者的隐私信息,进而导致敏感信息的泄露。针对遥感数据在联邦学习训练中存在的隐私泄露问题,提出一种基于本地差分隐私的联邦学习隐私保护方案。首先,对模型进行预训练,计算模型的层重要性,并根据层重要性合理分配隐私预算;然后,通过对模型更新进行裁剪变换,并对裁剪值进行自适应随机扰动,实现本地差分隐私保护;最后,在聚合扰动更新时,采用模型校正以进一步提高模型性能。理论分析和仿真结果表明,所提方案不仅能为各参与方提供合适的差分隐私保护,并有效防止通过反演推断出隐私敏感信息,而且在3个遥感数据集上相较于基于分段机制的扰动方案提升了3.28~3.93个百分点的准确率。可见,所提方案在保证隐私的同时有效保障了模型性能。
将差分隐私应用于联邦学习的方法是保护训练数据隐私的关键技术之一。针对之前多数工作未考虑参数的异质性,对训练参数均匀裁剪使每轮加入的噪声都是均匀的,从而影响模型收敛和训练参数质量的问题,提出一种基于梯度裁剪的自适应噪声添加方案。考虑梯度的异质性,在不同轮次为不同客户端执行自适应的梯度裁剪,从而使噪声大小自适应调整;同时,为进一步提升模型性能,对比传统的客户端随机采样方式,提出一种结合轮盘赌与精英保留的客户端采样方法。结合上述2种方法,提出一种结合客户端选择的自适应差分隐私联邦学习(CS&AGC DP_FL)方法。实验结果表明,在隐私预算为0.5时,相较于自适应差分隐私的联邦学习方法(Adapt DP_FL),所提方法能在相同级别的隐私约束下使最终的模型分类准确率提升4.9个百分点,并且在收敛速度方面,所提方法相较于对比方法进入收敛状态所需的轮次减少了4~10轮。
随着云计算和大数据的普及,越来越多的用户隐私数据被上传到云端计算和处理;然而,由于隐私数据交由不可信的第三方存储和管理,因此面临被泄露的风险,进而导致公民的生命和财产安全乃至国家的安全都受到不利影响。近年来,一些基于密码学算法的隐私计算技术,例如安全多方计算、同态加密(HE)和联邦学习等,解决了隐私数据传输和计算过程中的安全问题,进而实现了隐私数据的“可用不可见”;然而,这些方案由于计算和通信复杂度的原因没能得到广泛部署和应用。许多研究工作致力于利用可信执行环境(TEE)降低隐私计算技术的计算量和通信复杂度,同时保证不影响这些技术的安全性。TEE通过硬件辅助创建可以信赖的执行环境,并保证其中隐私数据和代码的机密性、完整性和可用性。因此,从隐私计算和TEE结合的研究入手。首先,全面分析TEE保护用户隐私数据的系统架构和硬件支持;其次,对比现有TEE架构各自的优势和不足;最后,结合工业界和学术界的最新进展,探讨隐私计算和TEE交叉研究领域的未来发展方向。
鉴于时间序列数据在各个领域的广泛应用,对这些数据的可辨识特征的挖掘和表征至关重要。受数据采集环境和采集设备的影响,许多应用领域的时序数据都存在高噪声的特点,这对数据表征方法的鲁棒性提出了很高的要求。因此,提出一种时间序列的鲁棒形态表征方法(TRS)。该方法采用关键形态(KS)的特征提取方法,在保留可解释性的同时减少噪声的影响,并通过位置距离度量对时间序列进行表征,从而提高整个方法的鲁棒性。在受噪声干扰的时间序列数据上的实验结果表明,TRS所提取的特征在分类上显著均优于现有的方法,与同样基于形态模式提取特征的深度学习模型——对抗动态Shapelet网络(ADSN)相比,平均正确率高出2.1个百分点。可见,TRS提取的特征集更有代表性和鲁棒性。
时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先,在时间序列上构建时间序列事件集合后,根据每个时间序列事件构建突变图、协同图、启发图,以减少噪声对高维特征的干扰;其次,融合多图的特征作为衍生特征,并抽取时间序列事件的多个时间级别的特征;最后,提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明,与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model, BL-HMM)方法相比,TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。
为了解决训练数据有限且类别多的问题,引入小样本学习方法。针对现有密集目标计数方法中存在的密集物体边界不清晰、空间不一致性和模型泛化能力弱等问题,提出一种小样本相似性匹配特征增强密集目标计数网络(SMFENet)。首先,通过特征提取模块提取图像特征,并使用ROI Align方法对齐样例特征;其次,设计相似性比较特征增强模块(SCFEM)计算样例特征和图像特征的相似度,得到相似度图,并将该图作为加权系数用样例特征自适应地增强图像特征,使最终得到的增强特征更关注与样例特征相似的区域;同时,采用内部特征增强、内部尺度增强以及信息合并等方法解决密集物体边界不清晰和空间不一致性问题;最后,利用密度预测模块生成密度图。此外,采用内容感知标注法生成高质量Ground-Truth密度图,以进一步提升模型的准确性。测试时,通过自适应损失调整网络使网络泛化到新类别上。在FSC-147数据集和CARPK数据集上的实验结果表明,与现有的小样本目标计数方法相比,所提模型的平均绝对误差(MAE)降低到13.82,均方根误差(RMSE)降低到45.91;与特定类别计数方法相比,所提模型的MAE降低到4.16,RMSE降低到5.91。以上充分证明SMFENet模型在提高计数的准确性和鲁棒性等方面能取得较好的效果,展示了该模型的实际应用价值。
义原作为最小的语义单位对于标题生成任务至关重要。尽管义原驱动的神经语言模型(SDLM)是主流模型之一,但它在处理长文本序列时编码能力有限,未充分考虑位置关系,易引入噪声知识进而影响生成标题的质量。针对上述问题,提出一种基于Transformer的生成式标题模型Tran-A-SDLM(Transformer Adaption based Sememe-Driven Language Model with positional embedding and knowledge reasoning)。该模型充分结合自适应位置编码和知识推理机制的优势。首先,引入Transformer模型以增强模型对文本序列的编码能力;其次,利用自适应位置编码机制增强模型的位置感知能力,从而增强对上下文义原知识的学习;此外,引入知识推理模块,用于表示义原知识,并指导模型生成准确标题;最后,为验证Tran-A-SDLM的优越性,在大规模中文短文本摘要(LCSTS)数据集上进行实验。实验结果表明,与RNN-context-SDLM相比,Tran-A-SDLM在ROUGE-1、ROUGE-2和ROUGE-L值上分别提升了0.2、0.7和0.5个百分点。消融实验结果进一步验证了所提模型的有效性。
针对无人艇(USV)在地下封闭水体中卫星定位信号缺失、通信受限、环境光线弱等问题,提出一种地下封闭水体内多USV协同的视觉定位方法。首先,设计一种艇载光源合作标志物,并根据艇身结构与应用场景对标志物结构进行优化;其次,采用单目视觉采集标志物图像,并求取特征点的图像坐标;再次,根据摄像机成像模型,基于合作标志物特征点的空间坐标及其对应的图像坐标之间的关系,通过改进直接线性变换方法求解相邻艇间的相对位置;然后,利用前后艇的摄像机进行艇间对视,并通过最小方差算法,融合根据前后艇摄像机图像求解所得的相对位置,以提高相对定位精度;最后,利用场景中已知的绝对坐标,获得各无人艇的绝对位置。仿真实验对影响定位误差的因素进行分析,并把所提方法与传统直接线性变换方法进行对比。结果表明,随着距离的增加,所提方法求解优势更趋明显,在距离15 m时求解的位置方差稳定在0.2 m2以内,验证了所提方法的准确性。静态实验结果表明,所提方法能将相对误差稳定在10.0%以内;地下河道内的动态实验结果表明,所提方法求解的绝对定位的航行轨迹达到与卫星定位相当的精度,验证了所提方法的可行性。