机器人定位技术对智能机器人的高效、精确和安全运行至关重要,然而在实际的定位过程中,机器人常面临“绑架”问题。为了应对这一难题,提出一种基于支持向量机(SVM)的自恢复自适应蒙特卡洛定位(SVM-SRAMCL)算法。首先,构建用于识别机器人“绑架”状态的检测模型——基于SVM的绑架检测模型(SVM-KDM);其次,通过自适应蒙特卡洛定位(AMCL)算法所得的粒子集计算粒子特性值,并作为SVM-KDM的输入,一旦检测到“绑架”事件,使用扩展卡尔曼滤波器(EKF)融合惯性测量单元(IMU)和里程计(Odom)的数据估计机器人的新位姿;最后,使用AMCL算法进行粒子预测、更新和重采样,最终实现机器人的重新定位。相较于自恢复蒙特卡洛定位(SR-MCL)算法,绑架后恢复定位所需的更新减少了4.1次,重定位的成功率提高了3个百分点。实验结果验证了所提算法在解决移动机器人的定位“绑架”问题方面具有更高的效率和成功率。
在自动化的工业场景中,大量工业设备产生的时序性日志数据量呈爆炸式增长,业务场景对时序数据的访问需求进一步提升。虽然目前基于分布式列族的数据库HBase能够存储工业时序大数据,但由于未考虑特定业务场景中数据与访问行为特征的关联,现有策略无法较好地满足工业时序数据的特定访问需求。针对上述问题,基于分布式存储系统HBase,利用工业场景中数据与访问行为特征的关联性,提出面向海量工业时序数据的分布式存储性能优化策略。针对工业时序数据特点引发的负载倾斜问题,提出基于冷热数据分区及访问行为分类的负载均衡优化策略。使用逻辑回归模型(LR)对数据进行冷热分类,并将热数据分散存储在不同节点;同时,为进一步降低存储集群中跨节点的通信开销,以提升工业时序数据高维索引的查询效率,提出索引主数据同Region化策略,设计索引RowKey字段及拼接规则,将索引存放到与它对应的主数据相同的Region中。在真实工业时序数据上的实验结果表明,引入优化策略后的数据负载分布倾斜度降低28.5%,查询效率提升27.7%,验证了所提优化策略能够有效地挖掘特定时序数据的访问模式,合理地分配负载,降低数据访问开销,有能力满足对特定时序大数据的访问需求。
网络中存在大量语义相同或者相似的冗余文本,而文本去重能够解决冗余文本浪费存储空间的问题,并能为信息抽取任务减少不必要的消耗。传统的文本去重算法依赖文字重合度信息,而没有较好地利用文本语义信息,同时也无法捕捉长文本中距离较远句子之间的交互信息,去重效果不理想。针对文本语义去重问题,提出一种基于关键词图表示的长文本去重算法。首先,通过抽取文本对中的语义关键词短语,将文本对表示为以关键词短语为节点的图;其次,通过多种方式对节点进行编码,并利用图注意力网络(GAT)学习节点之间的关系,从而得到文本对图的向量表示,并判断文本对是否语义相似;最后,根据文本对的语义相似度进行去重处理。与传统算法相比,所提算法能有效利用文本的语义信息,并能通过图结构将长文本中距离较远的句子用关键词短语的共现关系连接起来,从而增加不同句子之间的语义交互。实验结果表明,所提算法在两个公开数据集CNSE (Chinese News Same Event)和CNSS(Chinese News Same Story)上都取得了比Simhash、BERT (Bidirectional Encoder Representations from Transformers)微调、概念交互图(CIG)等传统算法更好的表现。具体地,所提算法在CNSE数据集上的F1值达到84.65%,在CNSS数据集上的F1值达到90.76%,说明所提算法可以有效提升文本去重任务的效果。
针对目前卫星遥感中夜光藻赤潮识别精度低、实时性差的问题,提出一种基于深度学习的无人机(UAV)影像夜光藻赤潮提取方法。首先,以UAV采集的高分辨率夜光藻赤潮RGB视频影像作为监测数据,在原有UNet++网络基础上,通过修改主干模型为VGG-16,并引入空间dropout策略,分别增强了特征提取能力并防止过拟合;然后,使用ImageNet数据集预先训练的VGG-16网络进行迁移学习,以提高网络收敛速度;最后,为评估所提方法的性能,在自建的赤潮数据集Redtide-DB上进行实验。所提方法的夜光藻赤潮提取总体精度(OA)为94.63%,F1评分为0.955 2,Kappa为0.949 6,优于K近邻(KNN)、支持向量机(SVM)和随机森林(RF)这3种机器学习方法及3种典型语义分割网络(PSPNet、 SegNet和U-Net)。在模型泛化能力测试中,所提方法对不同拍摄设备和拍摄环境的夜光藻赤潮影像表现出一定泛化能力,OA为97.41%,F1评分为0.965 9,Kappa为0.938 2。实验结果表明,所提方法可以实现夜光藻赤潮自动化、高精度的提取,可为夜光藻赤潮监测和研究工作提供参考。
当前的事件检测模型严重依赖于人工标注的数据,在标注数据规模有限的情况下,事件检测任务中基于完全监督方法的深度学习模型经常会出现过拟合的问题,而基于弱监督学习的使用自动标注数据代替耗时的人工标注数据的方法又常常依赖于复杂的预定义规则。为了解决上述问题,就中文事件检测任务提出了一种基于BERT的混合文本对抗训练(BMAD)方法。所提方法基于数据增强和对抗学习设定了弱监督学习场景,并采用跨度抽取模型来完成事件检测任务。首先,为改善数据不足的问题,采用回译、Mix-Text等数据增强方法来增强数据并为事件检测任务创建弱监督学习场景;然后,使用一种对抗训练机制进行噪声学习,力求最大限度地生成近似真实样本的生成样本,并最终提高整个模型的鲁棒性。在广泛使用的真实数据集自动文档抽取(ACE)2005上进行实验,结果表明相较于NPN、TLNN、HCBNN等算法,所提方法在F1分数上获取了至少0.84个百分点的提升。
针对图像混合失真类型判定难的问题,在深度学习多标签分类思想的基础上,提出了一种基于多尺度多分类器卷积神经网络(CNN)的混合失真类型判定方法。首先,从图像中截取得到含有高频信息的图像块,将该图像块输入到不同感受野的卷积层中以提取图像的浅层特征图;其次,将浅层特征图输入到各子分类器结构中以进行深层次的特征提取和融合,将融合的特征通过Sigmoid分类器得到判定结果;最后,将各子分类器的判定结果进行融合得到图像的混合失真类型。实验结果表明,在自然场景混合失真数据库(NSMDID)上,所提方法对图像中存在的混合失真类型的平均判定准确率可以达到91.4%,且对大部分类型的判定准确率都在96.8%以上,可见所提方法能够对混合失真图像中的失真类型进行有效的判定。
针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库WordNet构建特征本体,用特征本体对文本流主题进行建模;其次,提出一种文本流主题矩阵构建算法,实现在线增量主题演化分析;最后,依据该矩阵提出文本流主题本体演化图构建算法,利用特征本体的子图相似度计算主题相似度,从而获得文本流中主题随时间的演化模式。在科技文献上的实验上,满意度同传统在线潜在狄利克雷分配模型(LDA)不相上下,但时间复杂度降低到O(nK+N)。所提出的方法引入了本体,加入了语义关系标注,可图形化展现主题的语义特征,并在此基础上在线增量地实现了主题演化图的构建,在语义解释性和主题可视化方面更具有优势。
针对目前推荐系统效率问题,采用线上、线下分离策略,构建一种新的推荐系统框架.针对推荐系统多目标性和目前众多推荐算法适应性局限等特性,采用混合策略,提出一种新的多目标推荐算法.首先,对多个推荐算法进行加权混合;然后,构建以权重序列为自变量,推荐评价指标F调和率、多样性和新颖度为目标函数的多目标优化模型;其次,采用SPEA2多目标优化算法进行优化求解;最后,基于用户的购物偏好和Pareto解集向用户有针对性地进行购物推荐.实验结果表明:新的推荐算法较子推荐算法在F调和率上持平,在多样性上提高了1%,在新颖度上提高了11.5%;多目标的各个Pareto解在解空间中分布形成了密集邻近的点曲线.该推荐算法能够满足不同购物偏好用户的推荐要求.
针对社会网络中用户群组准确发现难题,提出了一种基于信任链的用户主题群组发现方法.该方法包括3个部分:主题空间发现、群组核心用户发现和主题群组发现.首先,给出了社会网络主题群组的相关形式化定义;然后,通过主题相关度计算发现主题空间,并给出主题空间上用户兴趣度计算方法;其次,提出原子、串联和并联信任链计算模型,并给出主题空间上的信任链计算方法;最后,分别给出主题空间发现算法、核心用户发现算法和主题群组发现算法.实验结果表明,提出的用户群组发现算法相比基于兴趣度的群组发现算法和边紧密度群组发现算法,平均准确率提升4.1%和11.3%,能够有效提升用户群组组织的准确度,在社会网络用户分类识别方面具有较好的应用价值.
为了解决现有判别分析算法对残缺和遮挡等外部干扰比较敏感的问题,从局部稀疏表示的角度,提出一种基于稀疏重构的判别分析(SDA)降维算法。该算法首先利用稀疏表示完成各个类内局部稀疏重构,然后通过非所在类内的样本均值完成各样本的类间局部稀疏重构,最后在降维过程中保持类间和类内的稀疏重构信息之比。在AR和UMIST人脸库人脸数据集上的实验结果表明,与基于图优化的Fisher分析(GbFA)算法和基于重构判别分析(RDA)算法相比,该算法提高了基于近邻分类的最高识别准确率2%~10%。
利用多个超声波传感器组成传感器阵列对行驶车辆的几何参数进行动态扫描,采用D-S证据理论多传感器数据融合算法,对多个传感器采集的数据进行融合,将在DSP上融合的结果上传至上位机,由上位机分析行驶车辆的车长、车宽、车高、车速,为交通管理提供技术保障和原始数据支撑。测试结果表明,该方法可以更准确的测量车辆几何参数。
针对自行设计的全链接模块化B*树(FLPM B*树),充分利用FLPM B*树的模块化结构等特点,设计出模块插入算法、重构算法和分割算法等,这些算法实现了FLPM B*树的操作功能,对于提高系统的性能也至关重要。