期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 引入解耦残差自注意力的边界交叉监督语义分割网络
姜坤元, 李小霞, 王利, 曹耀丹, 张晓强, 丁楠, 周颖玥
《计算机应用》唯一官方网站    2025, 45 (4): 1120-1129.   DOI: 10.11772/j.issn.1001-9081.2024040415
摘要56)   HTML5)    PDF (4007KB)(21)    收藏

针对内镜语义分割网络中病灶边缘信息丢失和大面积病灶分割不全的问题,提出一种引入解耦残差自注意力(DRA)的边界交叉监督语义分割网络(BCS-SegNet)。首先,引入DRA,以增强网络对远距离关联性病灶的学习能力;其次,构建跨级交叉融合(CLF)模块,从而将编码结构中的多级特征图逐对组合,进而实现在低计算成本下图像细节与语义信息的融合;最后,使用多方向多尺度的二维Gabor变换提取边缘信息,并使用空间注意力加权特征图中的边缘特征,以监督分割网络的解码过程,从而在像素级别上提供更精准的类内分割一致性。实验结果表明,在ISIC2018皮肤镜和Kvasir-SEG/CVC-ClinicDB结肠镜数据集上,BCS-SegNet的平均交并比(mIoU)和Dice系数分别为84.27%、90.68%和79.24%、87.91%;在自建食管内镜数据集上,BCS-SegNet的mIoU和Dice系数分别为82.73%和90.84%,mIoU相较于U-net和UCTransNet分别提升了3.30%和4.97%。可见,所提网络可以达到更完整的分割区域和更清晰的边缘细节等视觉效果。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于自适应阈值活动语音检测和最小均方误差对数谱幅度估计的低信噪比降噪算法
张皓然, 王学渊, 李小霞
计算机应用    2020, 40 (6): 1763-1768.   DOI: 10.11772/j.issn.1001-9081.2019111880
摘要467)      PDF (2132KB)(517)    收藏
针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估计,对得到的背景噪声进行实时更新并保存;然后,将实时更新的背景噪声作为MMSE-LSA的参考噪声,并对噪声幅度谱进行自适应更新,最后进行降噪处理。通过在真实场景中对四类声信号进行实验,结果表明,该算法在保证对低SNR声信号的实时处理的情况下,相较于传统MMSE-LSA算法,降噪信号的SNR能够提高10~15 dB,且不存在信号过减的情况,可应用于实际工程。
参考文献 | 相关文章 | 多维度评价
3. 基于多尺度核特征卷积神经网络的实时人脸表情识别
李旻择, 李小霞, 王学渊, 孙维
计算机应用    2019, 39 (9): 2568-2574.   DOI: 10.11772/j.issn.1001-9081.2019030540
摘要871)      PDF (1097KB)(576)    收藏

针对人脸表情识别的泛化能力不足、稳定性差以及速度慢难以满足实时性要求的问题,提出了一种基于多尺度核特征卷积神经网络的实时人脸表情识别方法。首先,提出改进的MobileNet结合单发多盒检测器(MSSD)轻量化人脸检测网络,并利用核相关滤波(KCF)模型对检测到的人脸坐标信息进行跟踪来提高检测速度和稳定性;然后,使用三种不同尺度卷积核的线性瓶颈层构成三条支路,用通道合并的特征融合方式形成多尺度核卷积单元,利用其多样性特征来提高表情识别的精度;最后,为了提升模型泛化能力和防止过拟合,采用不同的线性变换方式进行数据增强来扩充数据集,并将FER-2013人脸表情数据集上训练得到的模型迁移到小样本CK+数据集上进行再训练。实验结果表明,所提方法在FER-2013数据集上的识别率达到73.0%,较Kaggle表情识别挑战赛冠军提高了1.8%,在CK+数据集上的识别率高达99.5%。对于640×480的视频,人脸检测速度达到每秒158帧,是主流人脸检测网络多任务级联卷积神经网络(MTCNN)的6.3倍,同时人脸检测和表情识别整体速度达到每秒78帧。因此所提方法能够实现快速精确的人脸表情识别。

参考文献 | 相关文章 | 多维度评价
4. 基于MS-KCF模型的图像序列中人脸快速稳定检测
叶远征, 李小霞, 李旻择
计算机应用    2018, 38 (8): 2192-2197.   DOI: 10.11772/j.issn.1001-9081.2018020363
摘要751)      PDF (1139KB)(664)    收藏
为快速稳定地检测图像序列中角度变化较大、遮挡较为严重的人脸,结合快速精确的目标检测模型MobileNet-SSD (MS)和快速跟踪模型核相关滤波(KCF),提出一种新的自动检测-跟踪-检测(DTD)模式,即MS-KCF人脸检测模型。首先,利用MS模型快速精确地对人脸进行检测,并且更新跟踪模型;其次,将检测到的人脸坐标信息输入到KCF跟踪模型中进行稳定的跟踪,并加快整体的检测速度;最后,为了防止跟踪丢失,跟踪数帧后再次更新检测模型,重新对人脸进行检测。实验显示,在FDDB人脸检测基准中,MS-KCF模型的召回率为93.60%;在WIDER FACE人脸检测基准的Easy、Medium和Hard数据集中,MS-KCF模型的召回率分别为93.11%、92.18%和82.97%,平均速度为193帧/s。实验结果表明,MS-KCF模型具有稳定性和快速性,在图像序列中对严重遮挡和角度变化大的人脸具有很好的检测效果。
参考文献 | 相关文章 | 多维度评价
5. 基于模糊支持向量机的剪接位点识别
孙波 李小霞 李铖果
计算机应用    2011, 31 (04): 1117-1120.   DOI: 10.3724/SP.J.1087.2011.01117
摘要1233)      PDF (592KB)(447)    收藏
为了提高模糊支持向量机(FSVM)对剪接位点的识别精度,提出一种计算样本隶属度的新方法。将样本到两聚类中心的距离比值作为样本的初始隶属度,采用K近邻(KNN)方法计算样本的紧密度,最后将初始隶属度与紧密度的乘积作为样本的最终隶属度,这样既提高了支持向量的隶属度,又降低了噪声样本的隶属度。将此方法应用到剪接位点的识别中,对组成性5′和3′剪接位点的识别精度分别达到了94.65%和 88.79%,与经典支持向量机相比,3′剪接位点的识别精度提高了7.94%。
相关文章 | 多维度评价
6. 基于非线性支持向量机的原核生物基因识别
张继宏 李小霞 孙波
计算机应用    2009, 29 (10): 2748-2750.  
摘要1226)      PDF (525KB)(1703)    收藏
应用非线性最小二乘支持向量机对原核生物进行基因识别,通过寻找序列开放阅读框(ORF),并与可靠基因位点文件进行比较产生训练样本集,然后提取样本GC含量和Z曲线特征,并利用T检验方法检验各特征值所包含的信息量,设计出了非线性最小二乘支持向量机分类器识别基因。结果表明非线性最小二乘支持向量机的识别率比Fisher判别和线性支持向量机在不同的特征组合下分别提高了7.09%~29.97%和10.97%~25.45%,并且在特征值信息量较小的情况下非线性最小二乘支持向量机更能表现其优越性。
相关文章 | 多维度评价