在当今社会中,频发的汽车交通事故依然是一个严峻的现实问题。为了确保车载电子证据的可信保全和合法使用,必须采取先进的安全技术手段和严格的访问控制机制。针对车载设备电子证据的保全与共享需求,提出一种基于联盟链的证据保全及访问控制方案。首先,基于联盟链技术和星际文件系统(IPFS)实现电子证据的链上链下存储,并通过对称密钥保证证据的机密性和哈希值验证证据的完整性;其次,在电子证据的上传、管理和下载过程中,引入融合属性和角色的访问控制机制,实现细粒度和动态的访问控制管理,从而确保证据的合法访问与共享;最后,对比方案与分析性能。实验结果表明,所提方案具备机密性、完整性和不可否认性,并且在高并发请求数的情况下具有稳定性。
为应对联盟链中身份信息和交易数据隐私泄露的挑战,提出一种基于SM2可链接环签名的联盟链隐私保护方法(PPMCB-SM2LRS)。首先,针对可链接环签名(LRS)方案存在安全性不足、追溯性差的问题,结合SM2数字签名重新设计LRS,旨在增强交易方身份隐私保护的同时还能够追溯作恶的交易用户;其次,基于优化后的Paillier同态加密算法提出一种分级加密策略,实现隐私数据的“可见不可用”,以提高联盟链中交易数据验证的隐私性和机密性。安全性分析表明,所提方法具备正确性、不可伪造性、条件匿名性和可链接性。实验结果表明,与同类型LRS方案相比,PPMCB-SM2LRS具有更小的计算开销,且在签名生成与确认阶段的平均耗时有显著降低,同时符合密码技术发展的自主可控性原则。
针对多行为推荐研究中存在的数据稀疏和忽视多行为之间复杂联系的问题,提出一种基于级联残差图卷积网络的多行为推荐(CRMBR)模型。首先,从由所有行为的相互作用构建的统一同构图中学习用户和项目的全局嵌入,并将这些嵌入用作初始化嵌入;其次,通过级联残差块捕获不同行为之间的联系,以不断细化不同类型行为的嵌入,从而完善用户偏好;最后,通过2种不同的聚合策略分别聚合用户和项目嵌入,并采用多任务学习(MTL)优化这些嵌入。在多个真实数据集上的实验结果表明,CRMBR模型的推荐性能优于目前的主流模型。与先进的基准模型——多行为分层图卷积网络(MB-HGCN)相比,在Tmall数据集上,所提模型的命中率(HR@20)和归一化折损累积增益(NDCG@20)分别提升了3.1%和3.9%;在Beibei数据集上,则分别提升了15.8%和16.9%;在Jdata数据集上,则分别提升了1.0%和3.3%,验证了所提模型的有效性。
针对现有的问诊推荐方法未能充分利用医患间丰富的对话信息和无法捕捉患者实时的健康需求和偏好的问题,提出一种基于知识图谱和对话结构的问诊推荐方法(KGDS)。首先,构建包含评论情感分析和医学专业知识的医疗知识图谱(KG),增强医生和患者的细粒度特征表示;其次,在患者表示学习部分,设计一种患者查询编码器,从词级和句级这2个层面提取查询文本的关键特征,并通过注意力机制加强医患向量间的高阶特征交互;再次,建模诊断对话,充分利用医患间丰富的对话信息增强医患特征表示;最后,设计基于对比学习的对话模拟器,捕捉患者的动态需求和实时偏好,利用模拟的对话表示辅助推荐得分的预测。在真实数据集上的实验结果表明,KGDS相较于最优基线方法在曲线下面积(AUC)、平均值倒数秩(MRR@15)、推荐多样性(Diversity@15)、调和平均值(F1@15)、命中率(HR@15)和归一化折损累计增益(NDCG@15)上分别提高了1.82、1.78、3.85、3.06、10.02和4.51个百分点,验证了KGDS的有效性,且可见情感分析和KG的纳入增强了推荐结果的可解释性。
针对图协同过滤推荐方法存在的单一视图局限性和数据稀疏性问题,提出一种基于多视图多尺度对比学习的图协同过滤(MVMSCL)模型。首先,根据用户-项目交互构建初始交互图,并考虑用户-项目中存在的多种潜在意图,以构建多意图分解视图;其次,利用高阶关系改进邻接矩阵,以构建协同邻居视图;再次,去除不重要的噪声交互,以构建自适应增强的初始交互图和多意图分解视图;最后,引入局部、跨层和全局3种尺度的对比学习范式生成自监督信号,从而提高推荐性能。在Gowalla、Amazon-book和Tmall 3个公共数据集上的实验结果表明,MVMSCL的推荐性能均优于对比模型。与最优基线模型DCCF(Disentangled Contrastive Collaborative Filtering framework)相比,MVMSCL的召回率Recall@20分别提升了5.7%、14.5%和10.0%,归一化折损累计增益NDCG@20分别提升了4.6%、17.9%和11.5%。
针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力机制捕获视频片段间的时序依赖性;其次,设计基于高斯混合模型(GMM)的期望最大化(EM)算法捕获视频的上下文信息,同时利用二分游走传播进行全局上下文特征增强,生成高质量的时序类激活图(TCAM)作为伪标签在线监督时序特征增强分支;再次,通过动量更新网络得到体现视频间动作特征的跨视频字典;最后,利用跨视频对比学习提高动作分类的准确性。实验结果表明,交并比(IoU)取0.5时,所提方法在THUMOS’14和ActivityNet v1.3数据集上分别取得了42.0%和42.2%的平均精度均值(mAP),相较于CCKEE (Cross-video Contextual Knowledge Exploration and Exploitation)方法,在mAP分别提升了2.6与0.6个百分点,验证了所提方法的有效性。
区块链平台上的智能合约是为链上各方提供安全可信赖服务的去中心化应用程序,而智能合约漏洞检测能确保智能合约的安全性。然而,现有的智能合约漏洞检测方法在样本数量不均衡和语义信息挖掘不全面时,会出现特征学习不足和漏洞检测准确率低的问题,而且,这些方法无法对新的合约漏洞进行检测。针对上述问题,提出一种基于回声状态网络(ESN)的智能合约漏洞检测方法。首先,根据合约图,对不同语义、语法边进行学习,并利用Skip-Gram模型训练得到特征向量;其次,结合ESN和迁移学习,实现对新合约漏洞的迁移扩展,以提高漏洞检测率;最后,在Etherscan平台搜集的智能合约数据集上进行实验。实验结果表明,所提方法的准确率、精确率、召回率和F1分数分别达到了94.30%、97.54%、91.68%和94.52%,与双向长短时记忆(BLSTM)网络、自注意力机制的双向长短时记忆(BLSTM-ATT)相比,所提方法的准确率分别提高了5.93和11.75个百分点,漏洞检测性能更优。消融实验也进一步验证了ESN对智能合约漏洞检测的有效性。
城市公路交通流的预测受到历史交通流量和相邻车道交通流量的影响,蕴含了复杂的时空特征。针对传统交通流预测模型卷积长短时记忆(ConvLSTM)网络进行交通流预测时,未将时空特征分开提取而造成的特征提取不充分、特征信息混淆和特征信息缺失等问题,对ConvLSTM模型作出改进。首先,提取每个采样时刻的交通流数据的短期时间特征和空间特征,并在特定的维度下将交通流的短期时空特征融合;其次,进行残差映射;最后,将映射后的短期时空特征交由Transformer模型捕捉交通流数据长期的时空特征,并根据所捕捉的长期特征对未来时刻每个采样点交通流进行预测。使用加州城市快速路数据对模型进行验证,以平均绝对误差(MAE)作为模型评价指标时,所提模型相较于Conv-Transformer模型,预测精度提高了18%,验证了所提模型的有效性。
针对多模态情感分析任务中模态内信息不完整、模态间交互能力差和难以训练的问题,将视觉语言预训练(VLP)模型应用于多模态情感分析领域,提出一种融合自监督和多层交叉注意力的多模态情感分析网络(MSSM)。通过自监督学习强化视觉编码器模块,并加入多层交叉注意力以更好地建模文本和视觉特征,使模态内部信息更丰富完整,同时使模态间的信息交互更充分。此外,通过具有感知意识的快速、内存效率高的精确注意力FlashAttention解决Transformer中注意力计算高复杂度的问题。实验结果表明,与目前主流的基于对比文本-图像对的模型(CLIP)相比,MSSM在处理后的MVSA-S数据集上的准确率提高3.6个百分点,在MVSA-M数据集上的准确率提高2.2个百分点,验证所提网络能在降低运算成本的同时有效提高多模态信息融合的完整性。
在基于传统的排序、回归的年龄估计方法中,存在不能有效利用人脸的演化特征、构建不同排序标签之间的相关性,且二分类方法进行年龄估计会产生排序不一致的问题。基于上述问题,提出一致性保留的集成排序年龄估计方法,充分利用年龄与排序值之间的相关性,抑制排序不一致问题;并提出新指标——排序不一致样本比例,用于评估二分类排序方法中排序不一致问题。首先,通过设计的编码方法将年龄类别转换成排序矩阵形式;然后,使用残差网络ResNet34(Residual Network)特征提取网络提取面部特征,再通过提出的编码学习模块进行编码学习;最后,通过基于度量方法的排序解码器将网络预测结果解码成图片的预测年龄。在MORPH Ⅱ数据集上的实验结果达到平均绝对误差(MAE)2.18,并在其他公开数据集上与同样基于排序、有序回归方法的OR-CNN(Ordinal Regression with CNN)、CORAL(COnsistent RAnk Logits)等方法相比,所提方法有更准确的预测结果,同时抑制了排序不一致样本的比例,排序不一致度量性能比OR-CNN方法提升了约65%。
在线购买预测旨在预测用户的购买行为,为购物网站带来可观的商业价值。针对传统模型学习用户历史行为中隐含的兴趣偏好不准确的问题,提出基于两阶段动态兴趣识别的购买行为预测模型,以预测用户购买商品的概率。首先,模型的第一阶段构建用户-商品的点击频率图,并利用轻量图卷积网络(LightGCN)学习图的上下文特征作为用户的静态兴趣表征;其次,第二阶段采用带有注意力机制的双向门控递归单元(Bi-GRU)探索用户偏好的转化过程;最后,针对潜在的高维特征,建立一个融合动态兴趣和隐含特征的购买预测模型。在2个真实电子商务数据集上的实验结果表明,所提模型与图卷积网络(GCN)模型相比,准确率至少提升0.3个百分点,F1分数至少提升了2.05个百分点。
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。
在软件工程领域,基于语义相似的代码克隆检测方法可以降低软件维护的成本并预防系统漏洞,抽象语法树(AST)作为典型的代码抽象表征形式,已成功应用于多种程序语言的代码克隆检测任务,然而现有工作主要利用原始AST提取代码的语义,没有深入挖掘AST中的深层语义和结构信息。针对上述问题,提出一种基于依赖增强的分层抽象语法树(DEHAST)的代码克隆检测方法。首先,对AST进行分层处理,将AST划分得到不同的语义层次;其次,为AST的不同层次添加相应的依赖增强边构建DEHAST,将简单的AST变成具有更丰富程序语义的异构图;最后,使用图匹配网络(GMN)模型检测异构图的相似性,实现代码克隆检测。在BigCloneBench和Google Code Jam两个数据集上的实验结果显示,DEHAST能够检测100%的Type-1和Type-2代码克隆、99%的Type-3代码克隆和97%的Type-4代码克隆;与基于树的方法ASTNN(AST-based Neural Network)相比,F1分数均提高了4个百分点,验证了DEHAST可以较好地完成代码语义克隆检测。
基于爬壁机器人对混凝土桥梁健康进行自动巡检是推动桥梁管养智能化的有效途径,而合理的路径规划对机器人全面获取检测数据尤为重要。针对爬壁机器人电源重量限制与巡检时能源补充困难这一工程实际问题,充分考虑主梁、高墩等桥梁构件巡检场景,将能量消耗指标作为性能评价优化目标函数并建立相应约束条件,进而提出全覆盖路径规划评价模型。针对传统灰狼优化(GWO)算法易陷入局部最优的不足,提出一种改进的灰狼优化(IGWO)算法。IGWO算法通过K-means聚类改善了灰狼初始种群在搜索空间难以保持相对均匀分布的特性;以非线性收敛因子提高算法局部开发能力和全局搜索性能;结合粒子群算法个体优越性的思想对位置更新公式进行改进,提升算法的模型求解能力。仿真对比实验结果表明,IGWO算法相较于GWO、差分进化(DE)与遗传算法(GA)等全局优化算法,稳定性更好,能耗降低了10.2%~16.7%,迭代次数与求解时间分别减少了19.3%~36.9%和12.8%~32.3%,路径重复率降低了0.23~1.91个百分点,同时路径长度缩短1.6%~11.0%。
目前较为常用的基于单目视觉的车辆三维检测方法是目标检测结合几何约束的方法,但是几何约束中消失点的位置对结果影响很大。为了获取更加准确的约束条件,提出一种基于地平线检测的车辆三维检测算法。首先,利用车辆图片获取消失点的相对位置,将车辆图片预处理至合适大小;然后,将经过预处理的车辆图片送入消失点检测网络,获得消失点信息热力图组,回归出消失点信息,并计算得出地平线信息;最后,根据地平线信息构建几何约束,在约束空间内对车辆初始尺寸迭代优化计算精确的车辆三维信息。实验结果表明,所述地平线求解算法能够获得更准确的地平线,与随机森林的方法相比,曲线下面积(AUC)提升1.730个百分点;同时,所提地平线约束能够有效地限制车辆三维信息,与使用对角线和消失点约束的算法相比,车辆三维信息的平均精度提升2.201个百分点。可见地平线可以作为几何约束在路侧单目相机的场景下求解车辆三维信息。
为完善云环境下众测(众包测试)数据共享体系,解决众测领域存在的数据安全与隐私保护问题,提出基于区块链与基于密文策略的属性加密(CP-ABE)策略隐藏的众测任务隐私保护(CTTPP)方案。将区块链和属性基加密相结合,以提高众测数据共享的隐私性。首先,利用末端内部节点构造访问树表达访问策略,配合CP-ABE中的指数运算和双线性配对运算实现策略隐藏,以提高众测场景下数据共享的隐私保护能力;其次,调用区块链智能合约自动化验证数据访问者的合法性,与云服务器共同完成对任务密文访问权限的验证,进一步提高众测任务的安全性。性能测试结果表明,与同类型访问树策略隐藏算法相比,平均加密解密时间更短,加解密的计算开销更小;另外,当解密请求频率达到每秒1 000笔时,区块链的处理能力开始逐渐饱和,数据上链和数据查询的最大处理时延为0.80 s和0.12 s,适用于轻量级的商业化众测应用场景。
针对现有基于注意力机制的弱监督动作定位方法对动作边界处的片段容易错误分类的问题,提出一种融合片段对比学习的弱监督动作定位方法。首先,引入三个分支的注意力机制,分别测量每个视频帧是动作实例、上下文以及背景的可能性;其次,基于得到的注意力值构建对应分支的类激活序列;然后,通过片段挖掘算法构造正负样本对;最后,利用片段对比学习引导网络将模糊片段正确归类。实验结果表明,当交并比(IoU)取值0.5时,在THUMOS14与ActivityNet1.3两个公共数据集上,所提方法的平均检测精度(mAP)分别达到了33.9%和40.1%,相较于DGCNN(Dynamic Graph modeling for weakly-supervised temporal action localization Convolutional Neural Network)弱监督动作定位模型在上述两个数据集上分别提升1.1和2.9个百分点,验证了所提方法的有效性。
针对现有的双局域网(LAN)太赫兹无线局域网(Dual-LAN THz WLAN)相关介质访问控制(MAC)协议中存在的某些节点会在多个超帧内重复发送相同的信道时隙请求帧以申请时隙资源以及网络运行的一些时段存在空闲时隙等问题,提出一种基于自发数据传输的高效MAC协议——SDTE-MAC(high-Efficiency MAC protocol based on Spontaneous Data Transmission)。SDTE-MAC通过让各节点都维护一张或多张时间单元链表,使各节点与其余节点在网络运行时间上达到同步,从而获悉各节点应该在信道空闲时隙的什么位置开始发送数据帧,优化了传统的信道时隙分配和信道剩余时隙再分配的流程,提高了网络吞吐量和信道时隙利用率,降低了数据时延,能够进一步提升双LAN太赫兹无线局域网的性能。仿真结果表明,网络饱和时,相较于AHT-MAC(Adaptive High Throughout multi-pan MAC protocol)中的N-CTAP(Normal Channel Time Allocation Period)时段时隙资源分配新机制以及自适应缩短超帧时段机制,SDTE-MAC的MAC层吞吐量提升了9.2%,信道时隙利用率提升了10.9%,数据时延降低了22.2%。
随着物联网与云存储技术的快速发展和广泛应用,每年都有大量的传感器设备被部署到医疗物联网(IoMT)系统,虽然这促进了电子健康记录(EHR)应用的普及,但EHR的安全存储与检索尚未得到妥善的解决。针对以上问题,基于可搜索加密构造长度固定的陷门用于对密文的搜索验证,减小了用户所需的通信开销;采用在线/离线加密技术,减小了用户端在线加密所需的计算开销;同时基于变色龙哈希函数,构造具有抗碰撞、语义安全等特点的私钥,避免了未撤销用户私钥频繁更新的问题,极大地减小了用户的计算开销。理论分析与实验结果表明所提方案在DBDH(Decisional Bilinear Diffie-Hellman)假设下是选择明文攻击是安全的,且与类似属性基加密方案相比,所提方案效率更高,在功能上支持在线加密、高效的用户撤销并具有更低的计算开销和存储开销。
中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练模型与图卷积网络(GCN)并用异构图表示的中医电子病历分类模型TCM-GCN,用于改善中医电子病历特征有效表征的提取与分类。首先,利用LERT层词嵌入的方式将病历转换为句向量融入异构图中,以补全图结构缺失的病历整体语义特征;随后,为了缓解中医电子病历结构特点对特征提取产生的负面影响,异构图将关键词加入节点,使用BM25与点间互信息(PMI)算法构建图中“病历-关键词”“关键词-关键词”的边以表达病历的特征;最后,TCM-GCN依靠LERT-BM25-PMI构建的异构图对病历之间的特征关系进行聚合与抽取,完成病历分类的任务。在中医电子病历数据集上的实验结果表明,相较于次优的LERT,TCM-GCN加权平均后的准确率、召回率、F1值分别提升了2.24%、2.38%、2.32%,验证了算法在捕捉病历间隐含特征与中医电子病历分类工作上的有效性。
针对多智能体在大型仓储环境中进行路径规划时,现有算法有智能体易陷入拥堵区域和耗时长的问题,提出一种改良的基于冲突搜索(CBS)算法。首先,优化现有单一的仓储环境建模方式,在易解决路径冲突的传统的栅格化建模的基础上,提出栅格-热力图的混合建模方式,并通过热力图定位仓储中的拥堵区域,从而解决多智能体易陷入拥堵区域的问题;其次,通过改良的CBS算法,快速求解大型仓储环境下的多智能体路径规划(MAPF)问题;最后,提出基于热力图的显示估计冲突搜索(HM-EECBS)算法。实验结果表明,在warehouse-20-40-10-2-2大型地图集上,当智能体数为500时,相较于显示估计冲突搜索(EECBS)算法和懒惰添加约束的MAPF算法(LaCAM)算法:HM-EECBS算法的求解时间分别减少了约88%和73%;当仓储中存在5%、10%的区域拥堵时,HM-EECBS算法的成功率分别提高了约49%、20%,这表明所提算法适用于解决大规模且拥堵的仓储物流环境下的MAPF问题。
针对属性基可搜索加密(ABSE)方案大都基于非国密算法设计,且无法抵抗内部算法替换攻击(ASA)的问题,提出一种支持密码逆向防火墙的基于SM9的属性基可搜索加密方案(SM9ABSE-CRF)。该方案将国密算法SM9扩展至ABSE领域,实现了细粒度数据访问控制,并引入密码逆向防火墙(CRF)技术有效抵御ASA。分析了SM9ABSE-CRF在判定性Diffie-Hellman(DBDH)假设下满足了选择关键词下的不可区分性,并形式化证明了CRF的部署满足维持功能性、保留安全性以及抵抗泄漏性。理论分析和仿真实验结果表明,与提供CRF的ABSE方案cABKS-CRF (consistent Attribute-Based Keyword Search system with CRF)相比,SM9ABSE-CRF具有更高的安全性,并且在索引与陷门生成阶段也表现出显著的性能优势。
联邦学习(FL)是一种分布式机器学习方法,旨在共同训练全局模型,然而全局模型难以胜任多数据分布情况。为应对多分布挑战,引入聚类联邦学习,以客户端分组方式优化共享多模型。其中,服务器端聚类难以修正分类错误,而客户端聚类则对初始模型的选择至关重要。为解决这些问题,提出自动调整聚类联邦学习(AACFL)框架,所提框架采用双端聚类整合服务器端和客户端聚类。首先用双端聚类将客户端分为可调整集群,其次自动调整局部客户端身份,最后获取正确的客户集群。在非独立同分布下,在3个经典联邦数据集上的评估实验结果表明,AACFL能够在双端聚类结果存在错误的情况下通过调整获得正确集群,当簇数为4,客户端数为100时,与联邦平均(FedAvg)算法、聚类联邦学习(CFL)和IFCA(Iterative Federated Clustering Algorithm)等方法相比,有效地提高模型收敛速度和获得正确聚类结果的速度,准确率平均提升0.20~23.16个百分点。验证了所提框架能够高效聚类,并提高模型收敛速度和准确率。
针对现有电力负荷预测模型建模工作量大、时空联合表征不足、预测精度低等问题,提出了一种结合长短期记忆(LSTM)网络和自注意力机制的图卷积网络(GCN)的短期电力负荷预测模型GCNLS-STLF。首先,利用LSTM和自注意力机制将原始多维时间序列数据转化为包含序列间关联关系的电力负荷图;然后,通过GCN、LSTM和图傅里叶变换(GFT)对电力负荷图进行特征提取;最后,使用全连接层对特征进行重构,并利用残差进行多次预测,以增强原始电力负荷数据的表达能力。在摩洛哥与巴拿马某电站的真实历史电力负荷数据上进行的短期电力负荷预测实验结果显示,与支持向量机(SVM)、LSTM、混合模型CNN-LSTM和基于注意力的CNN-LSTM(CNN-LSTM-attention)等预测模型相比,GCNLS-STLF在摩洛哥全部电力负荷测试集上的平均绝对百分比误差(MAPE)分别降低1.94、0.90、0.49和0.37个百分点;在巴拿马电力负荷测试集上的3月份MAPE分别降低1.39、0.94、0.38和0.29个百分点,6月份MAPE分别降低1.40、0.99、0.35和0.28个百分点。实验结果表明,GCNLS-STLF能有效提取电力负荷的关键特征,预测效果较好。
针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为文本相似度检测提供依据。在Merkle树和布隆过滤器结构的基础上,设计了新的索引结构BHMerkle,减少了区块构建和查询时的计算开销,实现了对交易的快速定位。同时提出多特征权重Simhash算法,提高了词权计算的准确性并提高签名值匹配阶段的效率,从而对具有抄袭行为的恶意用户进行识别,并通过奖惩机制遏制恶意行为的发生。抄袭识别方案在不同主题的新闻数据集上的平均准确率为94.8%,平均召回率为88.3%,相较于多维度Simhash算法和基于信息熵加权的Simhash(E-Simhash)算法,平均准确率分别提升了6.19、4.01个百分点,平均召回率分别提升了3.12、2.92个百分点。实验结果表明,所提方案在抄袭文本的查询及检测效率方面均有所提升,且在抄袭识别方面具有较高的准确性。
为探索自监督特征提取方法在骨骼X线影像异常检测方面的可行性,提出了基于自监督特征提取的骨骼X线影像异常检测方法。将自监督学习框架与ViT(Vision Transformer)模型结合用于骨骼异常检测的特征提取,并通过线性分类器进行异常检测分类,在特征提取阶段可有效避免有监督模型对大规模有标注数据的依赖性。在公开的骨骼X线影像数据集上进行实验,采用准确率分别评估预训练的卷积神经网络(CNN)和自监督特征提取的骨骼异常检测模型。实验结果表明,自监督特征提取模型相较于一般的CNN模型效果更优,在7个部位分类结果与有监督的CNN模型ResNet50相差无几,但在肘部、手指、肱骨的异常检测中准确率均取得了最优值,平均准确率提升了5.37个百分点。所提方法易于实现,可以作为放射科医生初步诊断的可视化辅助工具。
在综合对比传统知识图谱表示学习模型优缺点以及适用任务后,发现传统的单一模态知识图谱无法很好地表示知识。因此,如何利用文本、图片、视频、音频等多模态数据进行知识图谱表示学习成为一个重要的研究方向。同时,详细分析了常用的多模态知识图谱数据集,为相关研究人员提供数据支持。在此基础上,进一步讨论了文本、图片、视频、音频等多模态融合下的知识图谱表示学习模型,并对其中各种模型进行了总结和比较。最后,总结了多模态知识图谱表示学习如何改善经典应用,包括知识图谱补全、问答系统、多模态生成和推荐系统在实际应用中的效果,并对未来的研究工作进行了展望。
边缘计算将计算资源部署在离终端用户更近的边缘计算节点,从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量(QoS)。然而,目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外,在边缘服务的时延等QoS因素的约束下,目前尚没有一种边缘计算节点部署算法能最大限度地提高边缘服务的鲁棒性同时最小化边缘节点部署成本。针对上述问题,首先,通过建立计算节点、用户传输时延和鲁棒性的模型将边缘计算节点放置问题转化为带约束条件的最小支配集问题;随后,提出重合支配的概念,基于重合支配衡量网络鲁棒性,设计了基于重合支配的边缘计算节点放置算法——CHAIN(edge server plaCement algoritHm based on overlApping domINation)。仿真实验结果表明,与面向覆盖的近似算法和面向基站的随机算法相比,CHAIN的系统时延降低了50.54%与50.13%。
针对最近邻分类算法性能受到所采用的相似度或距离度量方法影响大,且难以选择最优的相似度或距离度量方法的问题,提出一种采用多相似度的基于有序规范实数对的K最近邻分类算法(OPNs-KNN)。首先,在机器学习领域中引入有序规范实数对(OPN)这一新的数学理论,利用多种相似度或距离度量方法将训练集和测试集中所有样本全部转换为OPN,使每个OPN均包含不同的相似度信息;然后再通过改进的最近邻算法对OPN进行分类,实现不同相似度或距离度量方法的结合与互补,从而提高分类性能。实验结果表明,在Iris、seeds等数据集上与距离加权K近邻规则(WKNN)等6种最近邻分类的改进算法相比,OPNs-KNN的分类准确率提高了0.29~15.28个百分点,验证了所提算法能大幅提升分类的性能。
人脸识别技术的广泛应用在为用户带来方便的同时,也带来了人脸欺骗和展示攻击等问题。针对经常出现的展示攻击和打印攻击问题,提出了一种基于GhostNet和特征融合的人脸活体检测算法。首先,将GhostNet模型的特征提取过程分为三种不同的阶段,即低等特征、中等特征和高等特征;然后,分别输出每个阶段的特征图信息;最后,将具有不同语义信息的特征图送入特征融合模块进行自适应加权融合,以获得更加具有辨别性的特征映射。在NUAA和CelebA-Spoof两个公开数据集上进行实验,实验结果表明所提算法的准确率分别为99.97%和93.41%,相较于GhostNet模型直接进行训练的算法分别提高了8.00和9.20个百分点。与异构内核的卷积神经网络(HK-CNN)、轻量级卷积神经网络FeatherNet、基于分块的多流网络FaceBagNet等算法相比,所提算法在NUAA和CelebA-Spoof数据集上表现出更好的性能;并且,由于GhostNet是一种轻量化的网络模型,所提算法在CelebA-Spoof数据集上对单张图像进行推理的时间仅需3.6 ms。