针对多行为推荐研究中存在的数据稀疏和忽视多行为之间复杂联系的问题,提出一种基于级联残差图卷积网络的多行为推荐(CRMBR)模型。首先,从由所有行为的相互作用构建的统一同构图中学习用户和项目的全局嵌入,并将这些嵌入用作初始化嵌入;其次,通过级联残差块捕获不同行为之间的联系,以不断细化不同类型行为的嵌入,从而完善用户偏好;最后,通过2种不同的聚合策略分别聚合用户和项目嵌入,并采用多任务学习(MTL)优化这些嵌入。在多个真实数据集上的实验结果表明,CRMBR模型的推荐性能优于目前的主流模型。与先进的基准模型——多行为分层图卷积网络(MB-HGCN)相比,在Tmall数据集上,所提模型的命中率(HR@20)和归一化折损累积增益(NDCG@20)分别提升了3.1%和3.9%;在Beibei数据集上,则分别提升了15.8%和16.9%;在Jdata数据集上,则分别提升了1.0%和3.3%,验证了所提模型的有效性。
针对小样本学习模型在数据域存在偏移时分类准确度不高的问题,提出一种基于关系网络和ViT (Vision Transformer)的跨域小样本图像分类模型ReViT (Relation ViT)。首先,引入ViT作为特征提取器,并使用经过预训练的深层神经网络解决浅层神经网络的特征表达能力不足的问题;其次,以浅层卷积网络作为任务适配器提升模型的知识迁移能力,并基于关系网络和通道注意力机制构建非线性分类器;随后,将特征提取器和任务适配器进行特征融合,从而增强模型的泛化能力;最后,采取“预训练-元学习-微调-元测试”四阶段学习策略训练模型,有效融合迁移学习与元学习,进一步提升ReViT的跨域分类性能。以平均分类准确率为评估指标的实验结果表明,ReViT在跨域小样本分类问题上有良好的性能。具体地,ReViT的分类准确度在Meta-Dataset的域内场景下和域外场景下相较于次优的模型分别提升了5.82和1.71个百分点,在BCDFSL (Broader study of Cross-Domain Few-Shot Learning)数据集的3个子问题EuroSAT(European SATellite data)、CropDisease和ISIC (International Skin Imaging Collaboration)的5-way 5-shot上相较于次优的模型分别提升了1.00、1.54和2.43个百分点,在EuroSAT、CropDisease和ISIC的5-way 20-shot上相较于次优的模型分别提升了0.13、0.97和3.40个百分点,在CropDisease的5-way 50-shot上相较于次优的模型提升了0.36个百分点。可见,ReViT能在样本量稀少的图像分类任务上保持良好的准确率。
针对图协同过滤推荐方法存在的单一视图局限性和数据稀疏性问题,提出一种基于多视图多尺度对比学习的图协同过滤(MVMSCL)模型。首先,根据用户-项目交互构建初始交互图,并考虑用户-项目中存在的多种潜在意图,以构建多意图分解视图;其次,利用高阶关系改进邻接矩阵,以构建协同邻居视图;再次,去除不重要的噪声交互,以构建自适应增强的初始交互图和多意图分解视图;最后,引入局部、跨层和全局3种尺度的对比学习范式生成自监督信号,从而提高推荐性能。在Gowalla、Amazon-book和Tmall 3个公共数据集上的实验结果表明,MVMSCL的推荐性能均优于对比模型。与最优基线模型DCCF(Disentangled Contrastive Collaborative Filtering framework)相比,MVMSCL的召回率Recall@20分别提升了5.7%、14.5%和10.0%,归一化折损累计增益NDCG@20分别提升了4.6%、17.9%和11.5%。
针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力机制捕获视频片段间的时序依赖性;其次,设计基于高斯混合模型(GMM)的期望最大化(EM)算法捕获视频的上下文信息,同时利用二分游走传播进行全局上下文特征增强,生成高质量的时序类激活图(TCAM)作为伪标签在线监督时序特征增强分支;再次,通过动量更新网络得到体现视频间动作特征的跨视频字典;最后,利用跨视频对比学习提高动作分类的准确性。实验结果表明,交并比(IoU)取0.5时,所提方法在THUMOS’14和ActivityNet v1.3数据集上分别取得了42.0%和42.2%的平均精度均值(mAP),相较于CCKEE (Cross-video Contextual Knowledge Exploration and Exploitation)方法,在mAP分别提升了2.6与0.6个百分点,验证了所提方法的有效性。
基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成(MSRAG)方法。首先,根据用户输入的查询特点自适应地匹配检索模型来召回相关文本;其次,利用文本过滤器提取出能够回答问题的关键文本片段;再次,使用文本过滤器进行内容有效性判断以启动基于同义词拓展的查询改写,并将初始查询与改写后的信息合并输入检索控制器以进行更有针对性的再次检索;最后,合并能够回答问题的关键文本片段和问题,并使用提示工程输入生成答案模型来生成响应返回给用户。实验结果表明,MSRAG方法在军事领域数据集(Military)和Medical数据集的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence)指标上相较于凸线性组合RAG方法分别提高了14.35和5.83个百分点。可见,MSRAG方法具备较强的通用性和可移植性,能够缓解非必要查询改写导致的语义漂移现象,有效帮助大模型生成更准确的答案。
针对大语言模型(LLM)输出内容存在偏见而导致LLM不安全和不可控的问题,从偏见识别、偏见评估和偏见去除3个角度出发深入梳理和分析现有LLM偏见的研究现状、技术与局限。首先,概述LLM的三大关键技术,从中分析LLM不可避免存在内隐偏见(Intrinsic Bias)的根本原因;其次,总结现有LLM存在的语言偏见、人口偏见和评估偏见三类偏见类型,并分析这些偏见的特点和原因;再次,系统性回顾现有LLM偏见的评估基准,并探讨这些通用型评估基准、特定语言评估基准以及特定任务评估基准的优点及局限;最后,从模型去偏和数据去偏2个角度出发深入分析现有LLM去偏技术,并指出它们的改进方向,同时,分析指出LLM偏见研究的3个方向:偏见的多文化属性评估、轻量级的偏见去除技术以及偏见可解释性的增强。
小开放阅读框(sORFs)在多种生物学过程中发挥着关键作用,且准确识别编码sORFs和非编码sORFs是基因组学中一项重要且有挑战性的任务。针对目前大多数编码sORFs预测算法严重依赖基于先验生物知识的手工特征且缺乏通用性的问题以及原始sORFs的序列长度长短不一而无法直接输入预测模型的问题,提出一种基于sORF-Graph图编码方式的端到端的深度学习框架DeepsORF预测编码sORFs。首先,通过sORF-Graph将所有sORFs序列编码成对应的图,并将序列信息编码成图元素特征,从而对输入序列进行标准化处理;其次,引入基于卷积与残差的流注意力机制捕获sORFs中碱基远距离之间的相互作用,以更有效地表达sORFs的特征,并提高模型的预测精度。实验结果证明,DeepsORF框架在6个独立测试集上的性能均得到提升,与csORF-finder方法相比,DeepsORF在D.melanogaster nonCDS-sORFs测试集上的准确率、马修斯相关系数(MCC)以及精确率分别提升了9.97、19.49与13.07个百分点,验证了DeepsORF模型在识别编码sORFs和非编码sORFs任务中的有效性以及良好泛化能力。
随着区块链单链协同向多链扩张的生态转化,跨链技术正在成为推动应用创新和增强系统能力的关键途径。然而,多链架构的分布式账本缺乏统一的身份认证方案,导致在资产跨链交易过程中可能面临隐私保护问题。因此,提出一种基于隐私保护的随机共识资产跨链方案。该方案引入随机公证人多签(RNMS)架构的跨链模型,并通过椭圆曲线迪菲-赫尔曼(ECDH)密钥协商算法来确保交易双方能够安全地协商共享密钥。此外,考虑到中间信任问题,设计一种基于改进Algorand的随机公证人选取算法,将该算法的轮盘式标号随机选取公证人的方式改进为可验证的伪随机方式,以降低伪随机选取风险,并确保跨链交互的安全性和去中心化。通过改进拜占庭协议(BA)降低共识的通信代价,进行BFT-Simulation平台算法仿真实验。实验结果表明:相较于Algorand算法,所提方案的验证节点私密性更高,跨链消息共识效率提高了89%,且用公证人机制验证让节点消息通信量减少了80%,可有效提高跨链安全性。
区块链平台上的智能合约是为链上各方提供安全可信赖服务的去中心化应用程序,而智能合约漏洞检测能确保智能合约的安全性。然而,现有的智能合约漏洞检测方法在样本数量不均衡和语义信息挖掘不全面时,会出现特征学习不足和漏洞检测准确率低的问题,而且,这些方法无法对新的合约漏洞进行检测。针对上述问题,提出一种基于回声状态网络(ESN)的智能合约漏洞检测方法。首先,根据合约图,对不同语义、语法边进行学习,并利用Skip-Gram模型训练得到特征向量;其次,结合ESN和迁移学习,实现对新合约漏洞的迁移扩展,以提高漏洞检测率;最后,在Etherscan平台搜集的智能合约数据集上进行实验。实验结果表明,所提方法的准确率、精确率、召回率和F1分数分别达到了94.30%、97.54%、91.68%和94.52%,与双向长短时记忆(BLSTM)网络、自注意力机制的双向长短时记忆(BLSTM-ATT)相比,所提方法的准确率分别提高了5.93和11.75个百分点,漏洞检测性能更优。消融实验也进一步验证了ESN对智能合约漏洞检测的有效性。
针对自动国际疾病分类(ICD)编码中医学电子健康记录(EHR)的结构多样性以及编码间复杂的关联关系等特点,提出一种融合异构信息的自动ICD编码方法AIC-HI(Automatic ICD Coding integrating Heterogeneous Information)。首先,针对编码任务中结构化编码、半结构化描述、非结构化医学文本这3种异构数据的不同特性设计了多种特征提取器;其次,构建编码知识图谱拟合编码的层次结构关系,将不同分支间关联关系转化为包含头尾编码的三元组;再次,运用表征学习融合编码和描述信息计算标签特征;最后,通过注意力机制提取在非结构化文档中与编码标签最为相关的特征表示。实验结果表明,与次优的基线模型MARN(Multitask bAlanced and Recalibrated Network)相比,AIC-HI在真实临床数据集MIMIC-Ⅲ上所有编码的微观F1值提升了4.3个百分点。
满足公众高质量出行需求是智能交通系统(ITS)的主要挑战之一。目前,针对公共交通出行需求预测问题,现有模型大多采用固定结构的图描述出行需求的空间相关性,忽略了出行需求在不同尺度下具有不同的空间依赖关系。针对上述问题,提出一种多尺度时空图卷积网络(MSTGCN)模型。该模型首先从全局尺度和局部尺度构建全局需求相似图和局部需求相似图,这2种图可以捕获公共交通出行需求长期内较为稳定的全局特征和短期内动态变化的局部特征。利用图卷积网络(GCN)提取2种图中的全局空间信息和局部空间信息,并引入注意力机制融合两种空间信息。为了拟合时间序列中潜藏的时间依赖关系,利用门控循环单元(GRU)捕捉公共交通需求的时变特征。采用纽约市出租车订单数据集和自行车订单数据集进行实验,结果表明MSTGCN模型在自行车订单数据集上均方根误差(RMSE)、平均绝对误差(MAE)和皮尔逊相关系数(PCC)达2.788 6、1.737 1、0.799 2,在出租车订单数据集上RMSE、MAE、PCC达9.573 4、5.861 2、0.963 1。可见,MSTGCN模型可以有效地挖掘公共交通出行需求的多尺度时空特性,对未来公共交通出行需求进行准确预测。
在大数据与云计算时代,时态大数据的查询分析面临许多重要挑战。针对其中时态聚合范围查询性能不佳和不能有效利用索引等问题,提出一种用于时态聚合范围查询的分布式时态索引(DTI)。首先,采用随机或轮询策略对时态数据分区;其次,采用基于时间位数组前缀的分区内索引构造算法建立索引,同时记录包括时间跨度在内的分区统计信息;再次,利用谓词下推筛选时间跨度与查询时间区间重叠的数据分区,扫描索引进行预聚合;最后,将各分区得到的预聚合值按时间归并并聚合。实验结果表明,索引的分区内构造算法处理时间密度2 400条每单位时间和0.001条每单位时间的数据的执行时间相近。索引的聚合查询算法相较于ParTime算法:在查询时间线前75%的数据时,每一步用时都至少减少22%;执行选择型聚合函数时,每一步用时都至少减少11%。因此,索引在多数时态聚合范围查询任务中具有更高的速度,它的分区内构造算法能解决数据稀疏问题且执行效率高。
针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。
在基于深度学习的三维点云语义分割算法中,为了加强提取局部特征细粒度能力和学习不同局部邻域之间的长程依赖性,提出一种基于注意力机制和全局特征优化的神经网络。首先,通过加性注意力的形式设计单通道注意力(SCA)模块和点注意力(PA)模块,前者通过自适应调节单通道中各点特征加强对局部特征的分辨能力,后者通过调节单点特征向量之间的重要程度抑制无用特征并减少特征冗余;其次,加入全局特征聚合(GFA)模块,聚合各局部邻域特征,以捕获全局上下文信息,从而提高语义分割精度。实验结果表明,在点云数据集S3DIS上,所提网络的平均交并比(mIoU)相较于RandLA-Net(Random sampling and an effective Local feature Aggregator Network)提升了1.8个百分点,分割性能良好,具有较好的适应性。
针对具有未知干扰和非线性动态的多智能体系统,研究了它基于事件触发的固定时间一致性问题。在传统的静态事件触发策略的基础上,通过引入一个可调节的动态变量,提出一种基于动态事件触发策略的固定时间一致性协议,给出各个智能体基于状态信息和动态变量的动态事件触发函数,只有当各智能体的测量误差满足给定的触发函数时,事件才会被触发。引入的动态变量是可调节的阈值参数,能够进一步减少事件的触发次数,更有效地利用系统有限的资源。利用图论、固定时间一致性理论和李雅普诺夫稳定性理论推导出系统达到固定时间一致性时,一致性协议和触发函数中的参数需要满足的条件,同时证明了系统不存在芝诺行为。最后,数值仿真结果验证了理论分析的正确性与有效性。
群智能算法的优化是提升群智能算法性能的一个主要途径,随着群智能算法越来越广泛地运用到各类模型优化、生产调度、路径规划等问题中,对智能算法性能的要求也越来越高。亚群策略作为一种优化群智能算法的重要手段,能够灵活地平衡算法的全局勘探能力和局部开发能力,已经成为群智能算法的研究热点之一。为了促进亚群优化策略的发展和应用,对动态亚群策略、基于主从范式的亚群策略和基于网络结构的亚群策略进行了详细调查,阐述了各类亚群策略的结构特点、改进方式和应用场景。最后,总结了亚群策略目前存在的问题以及未来的研究趋势和发展方向。
为完善云环境下众测(众包测试)数据共享体系,解决众测领域存在的数据安全与隐私保护问题,提出基于区块链与基于密文策略的属性加密(CP-ABE)策略隐藏的众测任务隐私保护(CTTPP)方案。将区块链和属性基加密相结合,以提高众测数据共享的隐私性。首先,利用末端内部节点构造访问树表达访问策略,配合CP-ABE中的指数运算和双线性配对运算实现策略隐藏,以提高众测场景下数据共享的隐私保护能力;其次,调用区块链智能合约自动化验证数据访问者的合法性,与云服务器共同完成对任务密文访问权限的验证,进一步提高众测任务的安全性。性能测试结果表明,与同类型访问树策略隐藏算法相比,平均加密解密时间更短,加解密的计算开销更小;另外,当解密请求频率达到每秒1 000笔时,区块链的处理能力开始逐渐饱和,数据上链和数据查询的最大处理时延为0.80 s和0.12 s,适用于轻量级的商业化众测应用场景。
针对现有产学研绩效评价体系及方法中存在的评价指标覆盖范围单一、评价样本特征表达不充分、评价模型自优化能力待提高的问题,提出主客观产学研综合绩效智能评价的评价体系及方法。首先,围绕三方合作主体,挖掘产学研合作过程中影响绩效的要素及这些要素之间的联系,自主构建主客观产学研绩效三级评价体系;其次,通过将收集到的离散序列评价样本映射至极坐标空间、马尔可夫转移矩阵等不同高维空间域,增强离散样本特征表征;然后,通过基于精英反向翻筋斗觅食的混沌优化策略设计,提高深度模型冗余压缩和超参数的全局寻优效率,构建轻量压缩及高维超参数的自适应寻优的ParNet(AParNet)分类模型;最后,将模型应用于产学研绩效评价中,实现高性能的绩效智能评价。实验结果表明,所提方法很好地贴合了离散序列非线性分类应用,同时模型中加入优化策略后,在减少计算量的同时提高了分类性能,具体体现在:与ParNet相比,AParNet中的参数量减少了10.8%,较好地实现了模型的压缩,且它在产学研绩效评价中的分类准确率可达到98.6%。在产学研绩效智能评价应用中,该方法提高了评价模型的自适应能力,能够实现准确、高效的产学研绩效评价。
针对现有基于注意力机制的弱监督动作定位方法对动作边界处的片段容易错误分类的问题,提出一种融合片段对比学习的弱监督动作定位方法。首先,引入三个分支的注意力机制,分别测量每个视频帧是动作实例、上下文以及背景的可能性;其次,基于得到的注意力值构建对应分支的类激活序列;然后,通过片段挖掘算法构造正负样本对;最后,利用片段对比学习引导网络将模糊片段正确归类。实验结果表明,当交并比(IoU)取值0.5时,在THUMOS14与ActivityNet1.3两个公共数据集上,所提方法的平均检测精度(mAP)分别达到了33.9%和40.1%,相较于DGCNN(Dynamic Graph modeling for weakly-supervised temporal action localization Convolutional Neural Network)弱监督动作定位模型在上述两个数据集上分别提升1.1和2.9个百分点,验证了所提方法的有效性。
全景视频由于独特的沉浸式、交互式体验受到广泛关注。全景视频传输所需的高带宽、低时延给现有网络传输系统带来了挑战。基于tile(块)的视口自适应传输可以有效缓解全景视频所带来的传输压力,成为当前的主流方案和研究热点。通过分析基于tile的视口自适应传输方案的研究现状和发展趋势,对该传输方案的两个重要模块,即视口预测与码率分配进行论述,从不同视角归纳总结相关领域的方法。首先,基于全景视频传输框架对相关技术进行阐明;其次,从主、客观两个维度分别介绍评估传输系统性能的用户体验质量的指标;再后,分别从视口预测、码率分配两方面进行归纳,系统梳理经典的研究方法;最后,基于当前研究现状讨论全景视频传输的未来发展趋势。
针对属性基可搜索加密(ABSE)方案大都基于非国密算法设计,且无法抵抗内部算法替换攻击(ASA)的问题,提出一种支持密码逆向防火墙的基于SM9的属性基可搜索加密方案(SM9ABSE-CRF)。该方案将国密算法SM9扩展至ABSE领域,实现了细粒度数据访问控制,并引入密码逆向防火墙(CRF)技术有效抵御ASA。分析了SM9ABSE-CRF在判定性Diffie-Hellman(DBDH)假设下满足了选择关键词下的不可区分性,并形式化证明了CRF的部署满足维持功能性、保留安全性以及抵抗泄漏性。理论分析和仿真实验结果表明,与提供CRF的ABSE方案cABKS-CRF (consistent Attribute-Based Keyword Search system with CRF)相比,SM9ABSE-CRF具有更高的安全性,并且在索引与陷门生成阶段也表现出显著的性能优势。
长期时间序列预测在多个领域中具有广泛的应用需求。但是,时间序列的长期预测过程中表现出的非平稳性问题是影响预测准确性的关键因素。为了提高时间序列长期预测精度,以及预测模型的普适性,构建了基于序列分解的多尺度融合注意力神经网络预测网络(MSDFAN)模型。该模型采用时间序列分解提取输入数据中的季节成分和趋势成分,对不同数据成分进行不同的预测建模,能够对具有多尺度稳定特征的非平稳时间成分进行建模和预测。实验结果表明,与FEDformer相比,MSDFAN在5个基准数据集上的预测结果的均方误差(MSE)和平均绝对误差(MAE)分别平均下降了12.95%和8.49%,MSDFAN模型在多变量时间序列上取得了更好的预测精度。
多视图聚类由于能从多个角度利用数据的信息引起了广泛的关注。然而,目前的多视图聚类算法普遍存在以下几个问题:1)专注数据的属性特征或结构特征,没有充分结合这两种信息,以提高潜在嵌入的质量;2)基于图神经网络的方法虽然能同时利用属性和结构数据,但是基于图卷积或图注意力的模型在网络层数过深时会产生过度平滑的问题。为了解决以上问题,提出一个图对比学习引导的多视图聚类网络(MCNGCL)。首先,使用多视图自编码器模块捕捉每个视图的私有表示;其次,通过自适应加权融合构造公共表示;再次,结合图对比学习模块,使相邻节点在聚类时更容易被划分为同簇,同时缓解网络在聚合邻居节点信息时产生的过度平滑的问题;最后,使用自监督聚类模块,使公共表示和视图的私有表示向有利于聚类的方向优化。实验结果表明,MCNGCL在多个数据集上都取得了不错的效果,在3sources数据集上,与次优的CMGEC(Consistent Multiple Graph Embedding for multi-view Clustering)相比,MCNGCL的准确率指标提升了2.83个百分点,规范化互信息(NMI)指标提升了3.70个百分点;消融实验和参数敏感性分析结果也验证了MCNGCL的有效性。
针对一类具有磁滞输入的多智能体系统协同控制问题,设计一种基于动态面的神经网络有限时间性能渐近控制补偿算法。首先,通过Funnel控制结合有限时间性能函数,确保一致性误差可以在有限时间内进入预定义范围。其次,使用径向基函数神经网络(RBFNN)和不等式变换消除系统内未知非线性函数和未知外部扰动带来的不利影响。此外,通过估计一些未知变量的上界,大幅减少设计过程中所需自适应律数;同时,提出一种具有双曲正切函数的非线性滤波器,避免传统反步控制中的“微分爆炸”问题,并消除滤波器误差。最后,基于所提非线性滤波器设计一种磁滞伪逆补偿信号,在不需要构建磁滞逆的情况下有效补偿未知磁滞。利用李雅普诺夫稳定性理论,验证了闭环系统内所有信号都有界,一致性误差渐近收敛至零。仿真实例也表明了所提算法的有效性。
实时语义分割方法常利用双分支结构分别保存图像的浅层空间信息和深层语义信息。然而,当前基于双分支结构的实时语义分割方法重点研究语义特征的挖掘,忽略了空间特征的保持,导致网络无法精准地捕捉图像内物体的边界和纹理等细节特征,最终分割效果欠佳。针对以上问题,提出基于细节增强的双分支实时语义分割网络(DEDBNet),多阶段增强空间细节信息。首先,提出细节增强双向交互(DEBIM)模块,在分支间的交互阶段使用轻量空间注意力机制增强高分辨率特征图对细节信息的表达能力,促进空间细节特征在高低两分支上的流动,以加强网络对细节信息的学习能力;其次,设计局部细节注意力特征融合模块(LDAFF),在两分支末端特征融合的过程中同时建模全局语义信息和局部空间信息,解决不同层次特征图之间细节不连续的问题;此外,引入边界损失,在不影响模型速度的情况下引导网络浅层学习物体边界信息。所提网络在Cityscapes验证集上以92.3 frame/s的帧速率(FPS)获得78.2%的平均交并比(mIoU),在CamVid测试集上以202.8 frame/s获得79.2%的mIoU;与深度双分辨率网络(DDRNet-23-slim)相比,mIoU分别提高了1.1和4.5个百分点。实验结果表明,DEDBNet能够准确地分割场景图像,且满足实时性要求。
为探索自监督特征提取方法在骨骼X线影像异常检测方面的可行性,提出了基于自监督特征提取的骨骼X线影像异常检测方法。将自监督学习框架与ViT(Vision Transformer)模型结合用于骨骼异常检测的特征提取,并通过线性分类器进行异常检测分类,在特征提取阶段可有效避免有监督模型对大规模有标注数据的依赖性。在公开的骨骼X线影像数据集上进行实验,采用准确率分别评估预训练的卷积神经网络(CNN)和自监督特征提取的骨骼异常检测模型。实验结果表明,自监督特征提取模型相较于一般的CNN模型效果更优,在7个部位分类结果与有监督的CNN模型ResNet50相差无几,但在肘部、手指、肱骨的异常检测中准确率均取得了最优值,平均准确率提升了5.37个百分点。所提方法易于实现,可以作为放射科医生初步诊断的可视化辅助工具。
随着基于位置的社交网络(LBSN)迅速发展,作为缓解信息过载的有效手段,兴趣点(POI)推荐备受关注。由于用户签到数据是隐式反馈数据,且十分稀疏,为了有效地从用户签到数据中捕获用户POI偏好,提出了一个基于地理偏好排序的POI混合推荐模型。首先,考虑用户签到数据的隐式反馈特性及用户活动的空间约束,利用传统贝叶斯个性化排序(BPR)模型计算POI距离对POI排序的影响,提出加权BPR(GWBPR)模型;然后,针对用户签到数据的稀疏性,融合GWBPR模型和逻辑矩阵分解(LMF)模型,提出混合模型GWBPR-LMF。在两个真实数据集Foursquare和Gowalla上的实验结果表明,GWBPR-LMF模型的性能优于BPR、LMF、SAE-NAD(Self-Attentive Encoder and Neighbor-Aware Decoder)等对比模型。与较优的对比模型SAE-NAD相比,GWBPR-LMF模型的POI推荐的精确率、召回率、F1值、平均精度均值(mAP)、归一化折损累积增益(NDCG)在数据集Foursquare上分别平均提升了44.9%、57.1%、78.4%、55.3%和40.0%,在数据集Gowalla上分别平均提升了3.0%、6.4%、4.6%、11.7%和4.2%。
针对现有长链非编码RNA (lncRNA)-疾病关联预测模型在综合利用异构生物网络的交互、语义信息上存在局限性的问题,提出一种基于语义与全局双重注意力机制的lncRNA-疾病关联预测模型(SGALDA)。首先,基于相似性和已知关联构建一个lncRNA-疾病-微小RNA(miRNA)异构网络,并基于消息传递类型设计特征提取模块来提取和融合异构网络上同质、异质节点的邻域特征,以捕捉异构网络上的多层面交互关系。其次,基于元路径将异构网络分解为多个语义子网络,并分别在各个子网络上应用图卷积网络(GCN)来提取节点的语义特征,以捕捉异构网络上的高阶交互关系。然后,基于语义与全局双重注意力机制融合节点的语义和邻域特征,以获得更具代表性的节点特征。最后,利用lncRNA节点特征和疾病节点特征的内积运算重建lncRNA-疾病关联。5折交叉验证结果显示,SGALDA的受试者工作特征曲线下面积(AUROC)为0.994 5±0.000 2,PR曲线下面积(AUPR)为0.916 7±0.001 1,在所有对比模型中均为最高,验证了SGALDA良好的预测性能。对乳腺癌、胃癌的案例研究进一步证实了SGALDA识别潜在lncRNA-疾病关联的能力,说明SGALDA有潜力成为一种可靠的lncRNA-疾病关联预测模型。