为了有效地利用RGB-D图像的深度信息,提高BRISK算法的尺度不变性和旋转不变性,提出一种融合深度信息的BRISK改进算法。首先,采用FAST算法提取特征点,并计算每个特征点的Harris角点响应值;然后,将整个图像划分为大小相同的网格,每个网格保留Harris角点响应值最大的特征点;其次,根据图像的深度信息直接计算特征点的尺度因子;最后,计算以特征点为中心的圆的灰度矩心,通过灰度矩心和特征点的位置偏差确定特征点主方向。从尺度不变性和旋转不变性两方面对几种算法进行了对比实验分析。实验结果表明,相比BRISK算法,改进后的算法在图像尺度变化时正确匹配特征点数提高了90%以上,在图像旋转时正确匹配特征点数提高了至少70%。
前端噪声处理直接关系着语音识别的准确性和稳定性,针对小波去噪算法所分离出的信号不是原始信号的最佳估计,提出一种基于子带谱熵的仿生小波变换(BWT)去噪算法。充分利用子带谱熵端点检测的精确性,区分含噪语音部分和噪声部分,实时更新仿生小波变换中的阈值,精确地区分出噪声信号小波系数,达到语音增强目的。实验结果表明,提出的基于子带谱熵的仿生小波语音增强方法与维纳滤波方法相比,信噪比(SNR)平均提高约8%,所提方法对噪声环境下语音信号有显著的增强效果。
近似支持向量机(PSVM)在处理不平衡样本时,会过拟合样本点数较多的一类,低估样本点数较少的类的错分误差,从而导致整体样本的分类准确率下降。针对该问题,提出一种用于处理不平衡样本的改进的PSVM新算法。新算法不仅给正、负类样本赋予不同的惩罚因子,而且在约束条件中新增参数,使得分类面更具灵活性。该算法先对训练集训练获得最优参数,然后再对测试集进行训练获得分类超平面,最后输出分类结果。UCI数据库中9组数据集的实验结果表明:新算法提高了样本的分类准确率,在线性的情况下平均提高了2.19个百分点,在非线性的情况下平均提高了3.14个百分点,有效地提高了模型的泛化能力。
为了提高增强现实场景中虚实融合的真实感,提出一种差异感知的室内场景动态光照在线估计方法。与现有方法直接计算光照参数或生成光照贴图不同,该方法通过估计不同光照条件下场景的光照差异图像实现对于室内场景中光照的动态更新,从而更准确地获取场景动态光照并保留场景中的细节信息。所提方法的卷积神经网络(CNN)包括2个子网络,分别是低动态范围(LDR)图像特征提取网络和光照估计网络。整体网络结构以一张场景内所有主要光源开启时采集的高动态范围(HDR)全景光照贴图作为初始光照贴图,并把该光照贴图与光照变化后的有限视界的LDR图像共同作为输入。首先,基于AlexNet搭建CNN提取LDR图像特征,并在光照估计网络共享编码器中连接这些特征与HDR光照贴图特征;其次,利用U-Net结构,通过引入注意力机制,实现对光照差异图像和光源掩膜的估计,进而实现对场景动态光照的更新。在全景光照贴图的数值评估中,所提方法的均方误差(MSE)指标相较于Gardner方法、Garon方法、EMLight、Guo方法以及耦合的双StyleGAN全景合成网络StyleLight分别降低约79%、65%、38%、17%、87%,其他性能也有所提升。以上从定性和定量方面均证明了所提方法的有效性。