时间:2016-06-24 10:19 文章来源:http://www.lunwenbuluo.com 作者:卢涤非 斯进 王秋 点击次数:
摘要:为了克服传统视频处理技术面临的“语义鸿沟”等难题,借助三维模型时空子空间所蕴含的信息进行视频处理分析,提出了三维模型时空子空间引导的智能视频侦查技术。①在体形子空间的引导下从视频中匹配三维目标模型。②三维模型时空子空间引导下提取视频事件:监控对象视频+三维模型时空子空间→监控对象三维动作。③三维事件库中的动作比对分类:运动数据+三维事件库→视频类型和性质。文章涉及图形学、视频处理和刑事技术,探索了使用三维图形学技术解决视频侦查难题的新渠道。
关键词:智能视频侦查;三维模型时空子空间;运动比对;快速研判;三维事件库;大数据
引言
随着大量视频探头的广泛使用,以视频内容为突破口的视频侦查逐渐成为公安机关侦破案件的重要方法。然而,传统视频侦查的成果多是在花费大量警力和时间的基础上获得的。于是,具备对海量视频有快速研判方法的智能视频侦查成了解决该问题的关键。
1相关研究
智能视频侦查是指借助计算机视觉和视频分析的方法对视频数据进行分析,完成监控目标的定位、识别和跟踪,并判断目标对象的行为,辅助公安机关对疑难案件的侦破面对日益复杂的治安形势,智能视频侦查正逐渐成为“公安技术”学科中继刑事技术、行动技术和网侦技术之后的第四大警务技术支柱。智能视频在技术层面上都包含视频分析和视频理解这两个重要环节,其中视频分析技术主要包括背景减除检测、基于区域的跟踪以及时间差分检测等[1]。
由于二维视频图像丢失了现实场景的深度、方向等信息,这些方法都限制了特定的场景构成、相机配置、动作形式和视点角度等前提条件。在实际刑事案件中,这些前提条件基本上无法保证,导致大多数方法无法有效的处理目标对象被遮挡、短时间内消失,以及多个目标相互交错等复杂情形,因而这些无法直接应用于刑事案件中。
虽然视频分析仍是大多数研究者关注的方向,但人们已注意到视频理解才是智能视频侦查的最终目标,是智能视频侦查的核心。视频理解的关键是视频事件语义描述。视频语义内容分析是抽取用户所关心的语义内容,这会出现计算机自动理解与用户需求之间的矛盾,即语义鸿沟(theSemanticGap)[2]。
传统视频处理技术中存在的这些难题根源在于,视频图像中特征属性和结构化信息的缺失。显然,如果能借助一些先验知识,在三维空间里对视频数据进行分析处理,这些问题就可以迎刃而解。但是依靠现有技术从视频序列中恢复目标对象的三维运动信息和三维结构是非常困难的。究其原因,主要是由于问题本身的困难性所致:包含在视频中的目标对象运动信息是不充分的,不足以用来重构三维动画,这是典型的欠约束问题。
针对于此,在前期工作的基础上[3~8],本文提出了在三维时空子空间中分析处理视频数据的新思路。利用三维时空子空间蕴含的先验知识引导整个处理过程,克服了传统人体运动识别技术需要限定前提条件和行为描述困难的不足。研究的关键问题有:①在体形子空间的引导下在视频中匹配三维目标模型;②在运动子空间引导下进行视频事件跟踪;③在三维事件库中进行动作比对分类。
2系统目标与框架
2.1目标
本系统在尽量少的人工干预下,通过三维模型时空子空间的引导,探索目标体型匹配、视频事件提取以及动作比对分类技术,开拓使用三维图形学的理论和方法处理视频侦查难题的新渠道,完成智能视频侦查的快速研判,图1显示了智能视频侦查的基本工作模式。
2.2框架
人体的运动是符合一定规律的,反向运动学IK(InverseKinematics)[9]是描述人体运动规律的一个比较合适的方法。传统的IK一个比较大问题是定义关节结构不是一件容易的事情,其整个过程也不直观,要花大量的时间用于参数的设置工作。针对这种情况,文献[10]提出了基于网格的反向运动学(Mesh-BasedInverseKinematics)。与基于骨骼体系的传统IK相比,该方法依赖已有的样例网格来隐含地确定各种约束条件。本文直接使用空间序列模型库、时间序列模型库和空间关系模型库来指导人体运动跟踪,通过对仿射变换矩阵的比对来匹配特定的人体运动,图2显示了本系统的总体架构。
2.2.1体形子空间中的模型匹配
选择模型匹配模块主要作用是,对应于复杂视频场景选择最为合适的三维人体模型来跟踪视频,以有效地解决遮挡和多目标交错等问题。研究的关键点有:①人体局部插值算法的建立;②建立从二维图像生成三维人体模型的数学模型。
2.2.2运动子空间中的人体运动视频跟踪
本系统的一个重点就是如何在空间关系模型库的支撑下完成运动子空间中的人体运动视频跟踪。人体运动是遵循运动学规律的,采用运动子空间来描述其反向运动学信息,然后把运动子空间作为运动捕捉的约束条件,以应对复杂的视频场景。研究的关键点为:①运动子空间的约束方程的建立;②动作库模型投影与视频序列匹配的约束方程的建立;③空间关系模型库的约束方程的建立。
2.2.3三维事件库中的动作比对分类
人体运动比对分类是本文的另一个研究重点,其功能就是输入一套人体运动数据,然后在三维事件库中进行动作比对分类,用来确定最相似的动作,以确定目标特点或分析事件性质。
3关键算法
3.1体形子空间中的模型匹配
在跟踪视频人体运动时,首先根据空间序列模型库合成与被跟踪对象体形最为接近的三维人体模型。文献[11]对人体模型进行了比较全面的研究,提出了在指定人体模型间线性插值的方法产生新的模型。本文拓展了文献[11]的算法,其基本方案为:模型Mi可以表示为标准人体模型通过仿射变换获得的结果,把仿射矩阵极分解(PolarDecomposition),对非旋转部分可以直接采用线性插值,而对旋转部分需要先对旋转矩阵求对数,然后对矩阵对数(MatrixLogarithm)线性插值,最后通过矩阵指数(MatrixExponential)把叠加后的值映射回原来的坐标空间。通过这种方法可以在体形子空间上构造一个函数,M是空间序列模型库中的模型集合{M1,…,Mn},ξ是参数向量{ξ1,…,ξn},ξi与Mi一一对应。
联系方式
随机阅读
热门排行