基于距离判定的视频异常事件检测
Real-Time Anomaly Detection and Localization in Crowded Scenes
CVPR 2015的一篇文章,相对有点老了,不过最近在研究综述,拿出来简单了解一下结构方法和思想。
Abstract
本文提出了一种拥挤场景下的实时异常检测与定位方法。每个视频被定义为一组不重叠的立方块,并且使用两个局部和全局描述符来描述。这些描述符从不同方面捕获视频属性。通过结合简单而经济的高斯分类器,我们可以区分视频中的正常活动和异常。局部特征和全局特征基于相邻块之间的结构相似性,并使用稀疏自动编码器以无监督的方式学习特征。实验结果表明,在UCSD Ped2和UMN基准测试上,我们的算法可以与最先进的程序相媲美,但时间效率更高。实验证明,我们的系统能够可靠地检测到视频中出现的异常并及时定位。
主要贡献创新:
:(1)针对视频异常定位任务,提出了一种描述视频的特征学习方法。这种方法对于训练来说是耗时的,但是所学习的特征对于建模正常的补丁是非常有区别的。
(2)引入了一种基于描述符的相邻斑块间相似性度量方法,用于检测时空域中的突变。
(3)从两个不同的角度或视图表示视频补丁。每个视图都使用局部和全局特征集。在最终决定中,这些观点是相互支持。
(4)用高斯分布对所有正态斑块进行建模。对于测试视频,马哈拉诺比斯距离用于计算其与正常补丁的相关性。
(5)实时,能够在测试视频或流中出现异常后立即进行检测和定位。
我们的算法方案(从左到右):输入帧,两个面片视图(全局和局部),使用高斯分布对数据建模,然后做出最终决策。
全局块使用的是自编码器的隐空间特征点,局部块使用的是图像上的切割方式。
对于异常的块文章中提出三个观点:
1.异常斑块与其相邻斑块(即,由空间变化定义)之间的相似性不遵循从正常斑块到其相邻斑块的相同模式。
2.异常斑块的时间变化很可能不会遵循正常斑块的时间变化模式。
3.很明显,异常斑块的出现概率小于正常斑块。
文章中对比块之间的相似性使用的是 SSIM 评估方式,这个是一种用于图像质量评估的方法。
建立两个高斯分类器,对分别对局部和全局块进行分类,并计算马氏距离。当结果值大于阈值时,认为该块为异常块。
当两个分类器都认为该块为异常块时则认为出现异常,并且定位到了异常区域。
放个效果图如下。 比较早的工作了,感觉想法还是可的,当时数据集并不多,感觉有可借鉴的东西。
Abendon: 补充UBnormal 下载链接:http://suo.nz/2Rix5f
二十一克阳光!: 你好,你是怎么处理的数据集啊
ljxxxxxxxxxx: 您好,测试代码最后的'img/q.jpg'是代表什么呀
LSSD,!: 大佬好,为什么我的UNM转换之后的数据全是黑色的一片呀
俗物.: 请问有没有复现这篇论文呢