针对监控视频异常的复杂多样性和短时持续性,引入弱监督视频异常检测方法,旨在仅使用视频级别的标签进行异常检测,并提出了基于变分自编码器(VAE)与长短期记忆(LSTM)网络的异常回归网络VLARNet作为异常检测框架,以捕获时序数据中的时间依赖关系、去除冗余信息,保留数据的关键信息。该框架将异常检测视为回归问题,为学习检测特征,设计了异常分数回归的三元中心损失(TCLASR),与动态多实例学习损失(DMIL)相结合以进一步提高特征的区分能力。DMIL能够扩大异常实例与正常实例之间的类间距离,但同时也扩大了类内距离,而TCLASR可使来自同类的实例与类中心的距离更接近,与不同类中心的距离更远。对VLARNet在ShanghaiTech与CUHK Avenue数据集上进行了综合实验。实验结果表明,VLARNet能够有效利用视频数据的各种信息,在两个数据集上获得的受试者工作特征曲线下面积(AUC)分别为94.64%和93.00%,明显优于对比算法。
目前在H.264/AVC压缩域分割领域中常用方法造成局部运动矢量(MV)缺失,而通过全局运动补偿来还原运动矢量导致其时间复杂度提高。为解决此问题,提出一种基于边界聚类的快速凸壳分割(BS-CHSTF)算法。该方法主要利用码流中的运动矢量场信息进行分割,首先,对MV利用时空域滤波(STF)对运动矢量进行预处理,采用八方向自适应搜索算法进行边界搜索确定运动连通域;然后根据每个连通域边界求解凸壳并对其进行连通域填充,之后利用运动矢量与距离信息设定聚类规则,对多个连通域进行聚类;最后,对其进行优化掩膜达到分割运动对象的效果。实验结果表明,与混合高斯模型(GMM)分割算法和压缩域蚁群算法(ACA)比较,在分割准确率上平均提高了近3%,甚至在运动矢量场严重缺失的情况下,提高了近20%;而在分割速度上平均提高了近25%。该方法着重于求得运动对象的完整性与快速性,在运动对象不完整的情况下,能够获得较好分割精准度。