期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于最近邻域像素梯度的视频背景快速提取

时间:2016-10-04 14:26 文章来源:http://www.lunwenbuluo.com 作者:赵树言等 点击次数:

  摘要:针对嵌入式设备对视频背景的实时提取问题,提出一种基于最近邻域像素梯度(N2PG)稳定性的视频背景快速提取方法。首先,以视频中任意帧作为初始背景,并计算此背景图像的N2PG矩阵;然后,以背景帧之后若干帧图像作为背景更新图像,同理计算N2PG矩阵;最后,将背景图像N2PG矩阵与更新图像N2PG矩阵进行差分,并通过实时估计的梯度稳定性阈值快速判断背景模型中各像素点是静态背景像素点还是非背景像素点,进而对其更新或替换,以得到视频当前背景。经计算机仿真测试,与常用的卡尔曼滤波法和混合高斯法相比,基于N2PG的视频背景提取方法得到相同质量背景仅需10~50帧图像,并且平均处理速度分别提高36%和75%;和改进的视觉背景提取(ViBe)算法相比,在所需帧数和所得背景质量相近的情况下,该算法背景更新速度提升一倍。实验结果表明,基于N2PG的视频背景提取算法具有很强的自适应性,并且速度快、内存消耗小,背景提取准确度达到90%以上,可满足真实自然环境下嵌入式视觉设备的应用。
  关键词:快速背景提取;邻域像素梯度;视频背景;嵌入式系统;机器视觉
  0引言
  随着机器视觉技术的不断发展成熟,以及嵌入式智能视觉设备越来越多的产生和应用,对真实自然环境下视频背景提取的要求也越来越高,尤其需要兼顾背景提取速度和质量[1],比如智能车载监控系统、无人驾驶图像检测系统、移动机器人视觉系统和无人机视觉系统等。因为统计表明视觉系统的研究对象80%均为运动物体,而背景相减法[2]又是对视频中运动物体检测最简单、最有效的方法。
  真实复杂环境下,嵌入式视觉设备对视频背景实时、准确、快速提取和建模的主要困难和挑战在于一方面要求算法复杂度要低、内存消耗要小,另一方面又要求能适应复杂的自然环境变化影响,比如天气、光线和场景、摄像头本身移位、晃动等[3]。而目前已有的背景提取算法多针对于某种特定场景有效,或高度依赖于实验室高性能计算机,或过多依赖于先验知识,相对普适性较低、实时性不强,难以满足嵌入式智能视觉系统的要求。对此,本文提出了一种基于最近邻域像素梯度(Nearest Neighbor Pixel Gradient,N2PG)稳定性的视频背景快速提取方法。
  1相关工作
  目前比较常用的背景提取方法主要可分为两类:基于像素时间分布特征和基于像素空间分布特征。基于像素时间分布特征的背景建模方法主要有均值法[4]、帧间差分法[5]、基于区间分布的自适应算法[6]等;基于空间分布特征的代表性算法如视觉背景提取(Visual Background Extractor, ViBe)算法[7]。
  其中均值法以视频前n帧图像各像素的平均值作为背景图像,该方法简单容易,但过于粗糙,不适合复杂变化环境。后来文献[8]提出了改进的差分均值算法,部分解决了均值法所造成的残影影响,但实用性依然不强。
  对于差分法,在实验室等理想环境可以快速准确提取背景,但是对于有光照影响等自然环境明显失效,也不能解决背景有变化的情况。对此,Koller等[9]提出了卡尔曼滤波法解决了背景光线变化问题,再后来Stauffer等[10]提出的混合高斯法也解决了背景变化问题,但这两种方法都需要比较漫长的背景初始化过程,同时也大大增加了算法复杂度,提高了对硬件的要求,这些不足使其难以应用于实时性要求较高的嵌入式系统。
  区间分布自适应背景建模算法不需要复杂的初始化过程,相对适合实时系统。但是其区间划分数目对先验知识依赖性高,所以普适性较低;而且区间划分多,背景精度才高,这又会大大增加算法复杂度。
  对于基于像素的非参数化随机样本模型算法,即ViBe算法,以及其后的多种改进ViBe算法,如文献[11-12]所述,虽然都具有较好的鲁棒性,尤其对动态背景中的前景检测均有较好的效果,但是ViBe算法是假设相邻像素点具有相似的时空分布,所以对前景与背景的交界处不能较好地作出判断,常常因为误判而导致所得前景轮廓有残缺或拖影现象,这对后续的深度测量和识别等操作都不利。同时,ViBe算法所得背景是一种近似背景,对相似度阈值、邻域半径等参数依赖性大,若采用固定的相似度阈值,通常会降低算法鲁棒性;若采用变化的相似度阈值,又会大大增加运算量。
  2最小邻域像素梯度分析
  2.1相关定义
  若将视频看作是多帧图像的顺序组合,则可以用集合表示为{Ik(x,y)},其中:k表示帧序号,I表示视频的单帧图像。现将单帧图像各像素点的灰度值用坐标表示为v(x,y),则N2PG算法中相关定义如下:
  最近邻域像素:规定某像素点上、下、左、右四个方向最近相邻的n个像素点为该像素的最近邻域像素。依次用该中心像素点坐标表示为vi(x,y)(i=1,2,…,n,习惯以中心像素点邻域由内向外第一层左像素为起点,逆时针顺序编号,默认i取值1~4),以后将该中心像素点称作核像素点。对于每帧图像边缘的像素,为计算方便,默认其所缺失的所有最近邻域像素灰度值等于其核像素值。
  范值矩阵:为计算和描述方便,文中将与视频像素大小相同且只有0和1两种元素的矩阵称为范值矩阵。其中0值元素所对应像素值无效,1值元素所对应像素有效,并且在不同情况会有不同的具体含义。
  2.2最近邻域像素梯度值特征分析
  为了明显地观察视频中各像素点的N2PG值在不同帧间的分布特征,现利用室外自然环境下所拍摄的一段视频前800帧,以各像素点分别为核,对其N2PG值进行统计分析。实验中随机确定核像素点,共统计200个样本。以样本点(99,151)为例(在图1所示两帧抽样图像中均以字母P标出),首先,测量每帧中P像素点灰度值v及其四个最近邻域像素的灰度值v1~v4(本实验中为彩色视频,故以各像素红(R)、绿(G)、蓝(B)三个颜色分量的算数平均值作为该像素灰度值)。再按照式(1)计算P点在各帧的N2PG值;然后对相邻帧的N2PG值作差运算并取绝对值;最后以2维离散点统计图表示出来,如图2所示。通过所有样本点的统计图分析可以得到如下结论:自然场景下的视频图像,其静态背景像素点的最近邻域像素梯度值在邻近帧间有一定的稳定性。  
  图2中第345帧图像如图1(a)所示,第759帧图像如图1(b)所示,可以看到除了第345帧到第356帧之间和756帧到763帧之间的N2PG值有较大跳变之外(临界点分别以A、B、C、D示出),其余N2PG值在邻近帧间变化很小,甚至为零。而从A点所对应第345帧的图像中可以看到一行人正好到达P点(此时称P点为动态进入点);并且,从B所对应第356帧图像中可以观察到该行人恰好完全离开P点(此时称P点为动态退出点)。同样,从图2中C点所对应第756帧图像可以看到正好有一辆汽车要通过P点,在第763帧图像中该汽车正好离开P点。
  通过上述实验很容易得出,N2PG(x,y)值的稳定程度很好地代表了其核像素点的状态特征,可以据此判断出此核像素点在当前帧属于背景像素点还是动态像素点。若图2中以水平实线表示稳定性阈值,则很容易区分出P作为动态像素点所在帧和作为静态背景像素点所在帧,如P作为运动物体轮廓像素时的A、B、C、D点,并且可以很好地容忍自然光照变化等。
  综上实验可知N2PG值具有很好的时空代表性,在空间分布上它代表了核像素点与其邻域像素的相关程度,在时间分布上间接反映了其核像素点的稳定性。
  2.3二值图像模型算法分析
  为了更形象、更直观地分析N2PG算法,此时简化视频模型,假设像素为4×4,并且只有黑白两色(黑色像素值为1,白色像素值为0)。如图3(a)所示,A、B、C为从该视频中依次抽取的三帧原始图像,图像中每个小方格代表一个像素点,黑色像素点表示运动物体,背景像素均为白色。
  首先指定A图像作为背景初始图像,B和C作为背景更新图像。再根据式(1)分别以每帧各像素点为核,求取A、B和C的N2PG矩阵。各N2PG矩阵图像分别如图3(b)中A′、B′和C′所示,图中白色方框表示该像素的N2PG值为0,斜线阴影表示N2PG值为1,黑色方框表示N2PG值为2。

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli