文本正则化是语音合成(TTS)前端分析任务中不可或缺的步骤,而语义歧义性是文本正则化任务面临的主要问题,比如数字、日期、时间等非标准词的语义歧义性。针对该问题,提出一种基于编辑约束的端到端文本正则化方法,并且在充分考虑越南语的语言特点后,设计专门用于越南语的标注方法,以提高模型对上下文语义信息的建模能力。此外,针对神经网络模型容易产生不可恢复性错误的问题,提出一种编辑对齐算法以有效约束非标准词文本的范围,减小解码端的搜索空间,从而避免模型自身局限性所导致的非正则化文本预测错误。选取FastCorrect模型作为基准模型,将各类优化方法应用到基准模型中得到新模型。实验结果表明,所提模型在越南语不同优化方式的对比实验中的精准率相比使用无标注数据的基准模型提高了23.71个百分点,在同类中文实验中的精准率提高了26.24个百分点。可见,所提方法不仅在越南语上表现出色,而且在中文开源数据上也取得了显著的效果,验证了该方法在越南语之外的适用性。而且,与六类基线模型相比,使用所提方法的模型取得了最高的97.14%的精准率,在F1值上超过加权有限状态转换器(WFST)的两阶段方法2.29个百分点,证明了所提方法在文本正则化任务上的优越性。
针对国内外桥梁裂缝测量效率低、成本高、精度低等现状,提出了一种基于双目立体视觉技术的桥梁裂缝测量系统。采用相机标定、图像匹配、三维坐标计算等双目立体视觉技术对桥梁裂缝的宽度和长度进行计算,实现了桥梁裂缝测量系统。实验通过与单目摄像机用图像处理方法计算的桥梁尺寸结果作对比,表明:对于同一条裂缝的宽度与长度,用所提方法在不同拍摄角度下计算结果差别不大,并且与真实值的相对误差分别保持在10%和1%以内,而同一条件下单目测量系统的计算结果则随着拍摄角度的变化相差很大,宽度测量误差最大达到了19.41%,长度测量误差最大达到了54.35%。说明基于双目立体视觉技术的桥梁裂缝测量系统可以应用于实际中,并且鲁棒性更强,测量结果更精确。
摘 要: 模糊支持向量机(FSVM)对传统支持向量机(SVM)在对外围点和噪声数据敏感的缺陷做了重要改进。选取合适的聚类中心计算符合数据本身特征分布的隶属度,能使分类更加准确,提高测试精度。论文基于模糊支持向量机思想,提出一种新的模糊聚类模型—基于熵和蚁群聚类算法的模糊支持向量机(EAFSVM),为聚类中心和隶属度的计算提出了新方法。实验对比传统SVM和FSVM,结果表明EAFSVM测试精度较高,尤其对多类数据、大规模数据具有较好的分类能力。