期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于语种相似性挖掘的神经机器翻译语料库扩充方法
李灿, 杨雅婷, 马玉鹏, 董瑞
《计算机应用》唯一官方网站    2021, 41 (11): 3145-3150.   DOI: 10.11772/j.issn.1001-9081.2020122039
摘要375)   HTML9)    PDF (759KB)(155)    收藏

针对低资源语言机器翻译任务上一直存在的标注数据资源匮乏问题,提出了基于语种相似性挖掘的神经机器翻译语料库扩充方法。首先,将维吾尔语和哈萨克语作为相似语言对并将其语料进行混合;然后,对混合后的语料分别进行字节对编码(BPE)处理、音节切分处理以及基于音节切分的BPE处理,从而深度挖掘哈语和维语的相似性;最后,引入“开始-中部-结束(BME)”序列标注方法对语料中已切分完成的音节进行标注,以消除音节输入所带来的一些歧义。在CWMT2015维汉平行语料和哈汉平行语料上的实验结果表明,所提方法相较于不进行特殊语料处理以及BPE语料处理训练所得普通模型在维吾尔语-汉语翻译上的双语评估替补(BLEU)值分别提升了9.66、4.55,在哈萨克语-汉语翻译上的BLEU值分别提升了9.44、4.36。所提方案实现了维语和哈语到汉语的跨语言神经机器翻译,提升了维吾尔语-汉语和哈萨克语-汉语机器翻译的翻译质量,可应用于维语和哈语的语料处理。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于稀疏轨迹聚类的自驾车旅游路线挖掘
杨奉毅, 马玉鹏, 包恒彬, 韩云飞, 马博
计算机应用    2020, 40 (4): 1079-1084.   DOI: 10.11772/j.issn.1001-9081.2019081467
摘要667)      PDF (1419KB)(681)    收藏
针对自驾车游客加油轨迹稀疏,还原真实旅游路线困难的问题,提出一种基于语义表示的稀疏轨迹聚类算法,用以挖掘流行的自驾车旅游路线。与基于轨迹点匹配的传统轨迹聚类算法不同,该算法考虑不同轨迹点之间的语义关系,学习轨迹的低维向量表示。首先,利用神经网络语言模型学习加油站点的分布式向量表示;然后,取每条轨迹中所有站点向量的平均值作为该轨迹的向量表示;最后,采用经典的k均值算法对轨迹向量进行聚类。最终的可视化结果表明,所提算法有效地挖掘出了两条流行的自驾车旅游线路。
参考文献 | 相关文章 | 多维度评价
3. 基于Hash函数的移动双向认证协议
陶源, 周喜, 马玉鹏, 赵凡
计算机应用    2016, 36 (3): 657-660.   DOI: 10.11772/j.issn.1001-9081.2016.03.657
摘要641)      PDF (648KB)(542)    收藏
针对移动射频识别(RFID)系统中因无线传输所带来的信道不安全问题,充分考虑到协议的复杂程度和标签的硬件成本,提出一种低成本的移动双向认证协议,实现了标签、读写器和后端服务器三者的相互认证。该协议使用模平方运算动态更新标签标识符,引入读写器标识符,并利用伪随机函数和哈希函数强化读写器和后端服务器之间的身份认证,提高系统移动性。与基于哈希函数的经典协议和标签所有权转移协议相比,该协议可抵抗跟踪、假冒、重放、中间人、拒绝服务器攻击等,能保证标签所有权安全转移,并从计算量和存储量分析效率,结果表明标签计算量减少,存储量较低。
参考文献 | 相关文章 | 多维度评价