期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 多模态预训练模型综述
王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹
《计算机应用》唯一官方网站    2023, 43 (4): 991-1004.   DOI: 10.11772/j.issn.1001-9081.2022020296
摘要1738)   HTML149)    PDF (5539KB)(1404)    PDF(mobile) (3280KB)(111)    收藏

预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM;根据数据融合方式的不同,还可将多模态PTM分为单流模型和双流模型两类。首先,总结了常见的预训练任务和验证实验所使用的下游任务;接着,梳理了目前多模态预训练领域的常见模型,并用表格列出各个模型的下游任务以及模型的性能和实验数据比较;然后,介绍了M6(Multi-Modality to Multi-Modality Multitask Mega-transformer)模型、跨模态提示调优(CPT)模型、VideoBERT(Video Bidirectional Encoder Representations from Transformers)模型和AliceMind(Alibaba’s collection of encoder-decoders from Mind)模型在具体下游任务中的应用场景;最后,总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于图像翻转变换的对抗样本生成方法
杨博, 张恒巍, 李哲铭, 徐开勇
《计算机应用》唯一官方网站    2022, 42 (8): 2319-2325.   DOI: 10.11772/j.issn.1001-9081.2021060993
摘要683)   HTML57)    PDF (1609KB)(306)    收藏

面对对抗样本的攻击,深度神经网络是脆弱的。对抗样本是在原始输入图像上添加人眼几乎不可见的噪声生成的,从而使深度神经网络误分类并带来安全威胁。因此在深度神经网络部署前,对抗性攻击是评估模型鲁棒性的重要方法。然而,在黑盒情况下,对抗样本的攻击成功率还有待提高,即对抗样本的可迁移性有待提升。针对上述情况,提出基于图像翻转变换的对抗样本生成方法——FT-MI-FGSM(Flipping Transformation Momentum Iterative Fast Gradient Sign Method)。首先,从数据增强的角度出发,在对抗样本生成过程的每次迭代中,对原始输入图像随机翻转变换;然后,计算变换后图像的梯度;最后,根据梯度生成对抗样本以减轻对抗样本生成过程中的过拟合,并提升对抗样本的可迁移性。此外,通过使用攻击集成模型的方法,进一步提高对抗样本的可迁移性。在ImageNet数据集上验证了所提方法的有效性。相较于I-FGSM(Iterative Fast Gradient Sign Method)和MI-FGSM(Momentum I-FGSM),在攻击集成模型设置下,FT-MI-FGSM在对抗训练网络上的平均黑盒攻击成功率分别提升了26.0和8.4个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 事件抽取综述
马春明, 李秀红, 李哲, 王惠茹, 杨丹
《计算机应用》唯一官方网站    2022, 42 (10): 2975-2989.   DOI: 10.11772/j.issn.1001-9081.2021081542
摘要1058)   HTML149)    PDF (3054KB)(607)    收藏

将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于短语的维吾尔文文本分类
阿力木江·艾沙 吐尔根·依布拉音 库尔班·吾布力 李哲
计算机应用    2012, 32 (10): 2923-2926.   DOI: 10.3724/SP.J.1087.2012.02923
摘要1057)      PDF (618KB)(521)    收藏
文本特征表示是在文本自动分类中最重要的一个环节。在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机(SVM)算法对维吾尔文文本进行了分类实验。实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔文文本分类的准确率和召回率。
参考文献 | 相关文章 | 多维度评价
5. 快速多阈值图像分割法
李哲学 陈树越
计算机应用    2010, 30 (05): 1335-1337.  
摘要286)      PDF (625KB)(1301)    收藏
大津法对由多个目标组成的图像求最佳阈值时,消耗大量时间。针对此不足,提出简单而快速求多阈值的方法,对已分割的小区间反复利用大津的二分法和方差比值求出需要的阈值。首先,对研究图像的整个灰度值区间利用大津法分成两类;然后,对已分出的两个区间分别应用二分大津法,两类分成四类、八类等。比较实验结果表明,该方法适合图像特征,能快速分割目标图像,可以应用于模式匹配以及人脸识别。
相关文章 | 多维度评价
6. 基于InmarsatD+的船舶遥测监控通信系统的实现与研究
吴东庆,刘就女,李哲林
计算机应用    2005, 25 (02): 466-468.   DOI: 10.3724/SP.J.1087.2005.0466
摘要1196)      PDF (169KB)(1050)    收藏
InmarsatD+是Inmarsat近年推出的一种新颖的用户服务,它在遥测监控通信系统中的应用在国内外都是一种新的技术。通过与现有遥测监控通信系统的比较,阐述了基于InmarsatD+的遥测监控通信系统的优越性及其组成,并以一个基于InmarsatD+的船舶遥测监控通信系统为例,剖析了这种新颖的监控中心系统的体系结构。该系统在国内某船舶管理机构试运行效果良好。
相关文章 | 多维度评价