期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于改进特征袋模型的奶牛识别算法

时间:2016-10-04 14:27 文章来源:http://www.lunwenbuluo.com 作者:陈娟娟等 点击次数:

  摘要:针对特征袋(BOF)模型中存在特征计算耗时、识别精度低的不足,提出一种新的改进BOF模型以提高其目标识别的精度和效率,并将其应用于奶牛个体识别。该算法首先引入优化方向梯度直方图(HOG)特征对图像进行特征提取和描述,然后利用空间金字塔匹配原理(SPM)生成图像基于视觉词典的直方图表示,最后自定义直方图交叉核作为分类器核函数。该算法在项目组自行拍摄的数据集(包含15类奶牛、共7500张奶牛头部图像)上的实验结果表明,使用基于SPM的BOF模型将算法的识别率平均提高2个百分点;使用直方图交叉核相比使用高斯核将算法的识别率平均提高2.5个百分点;使用优化HOG特征,相比使用传统HOG特征将算法识别率平均提高21.3个百分点,运算效率为其1.68倍;相比使用尺度不变特征变换(SIFT)特征,在保证平均识别精度达95.3%的基础上,运算效率为其7.10倍。分析结果可知,该算法在奶牛个体识别领域具有较好的鲁棒性和实用性。
  关键词:特征袋模型;图像识别;梯度直方图特征;空间金字塔匹配;尺度不变特征变换特征
  0引言
  互联网的兴起使得现今各行业逐渐朝着工业化、智能化方向发展,其中奶业发展是农业发展中国家十分关注的问题。随着信息技术和多媒体技术的飞速发展与广泛应用,图像数量日益增多,图像识别和分类的研究与应用成为计算机视觉领域中越来越重要的课题[1]。基于计算机视觉技术,利用奶牛图像进行奶牛个体识别和分类是实现奶牛信息化管理的有 效手段,对奶业的飞速发展起着至关重要的作用。
  传统的图像识别与分类算法有很多,特征袋(Bag of Features, BOF)[2]是最具代表性的一类。该算法由文本领域的词袋(Bag of Word, BOW)算法发展而来,其出现为基于内容的图像描述和处理以及对图像的语义理解开拓了新思路。该算法主要用于计算机视觉领域的图像分类、目标识别和图像检索[3-4],近年来,也开始用于显著性区域检测[5]、行为识别[6]、糖尿病患者的食物识别系统[7]和人喉表皮样癌细胞 (HEp-2)的识别分类[8]。随着该算法在各领域的广泛应用,其存在的计算效率低、识别精度有限等问题成为研究者们越来越关注的内容,为此,不断有研究者尝试新的方法以改善上述问题。为提高算法计算效率,有学者提出较快速的局部特征描述子DAISY[9]和快速鲁棒特征(Speeded Up Robust Features, SURF)[10]来替换尺度不变特征变换(Scale Invariant Feature Transform, SIFT)进行图像特征提取以缩短特征提取时间。为提高算法识别率,有学者尝试提高BOF表示的判别力,例如,文献[11]提出利用均值漂移方法对视觉单词进行聚类以产生具有更高判别力的高序语义级视觉词典;文献[12]把视觉单词的空间分布信息考虑在内提出了一种更有判别力的视觉单词空间合并方法;文献[13]提出了一种新的基于直方图向量的无监督降维框架,以创建一个紧凑和有判别力的BOF表示;文献[14]则提出了一种用于目标跟踪的软分配BOF算法,试图利用软分配来提高BOF表示的判别能力;此外,文献[15]提出采用多种特征描述符相结合的方式进行图像特征描述以提高算法的识别精度。
  上述方法在一定程度上提高了BOF算法的识别精度和计算效率,但是这些方法仅适用于某种特定的情境。为进一步提高BOF的计算性能和识别精度并将其应用于奶牛个体识别,本文提出了一种新的改进BOF模型。该模型将优化后的方向梯度直方图(Histogram of Oriented Gradient, HOG)特征[16]引入到基于空间金字塔匹配(Spatial Pyramid Matching, SPM)[17]的BOF模型中,并使用自定义的直方图交叉核(Histogram Intersection Kernel)[18]作为分类器的核函数。使用基于SPM的BOF模型和基于直方图交叉核的分类器可提高算法识别精度;使用本文优化HOG特征相比使用传统HOG特征既提高了算法计算性能,又改善了算法识别性能;相比使用SIFT特征在保证识别精度的基础上大大改善了算法计算性能。将本文算法用于奶牛个体识别,奶牛个体的实验用数据集为该奶牛在不同姿态、不同背景、不同角度下拍摄得到的若干张具有判别力的图像,因此可将奶牛个体视为目标识别中的一个类别来分析处理。实验中,用本文算法分别对5类、8类、10类、12类、15类奶牛识别分类,在每类奶牛有500张图像(80%作训练集,20%作测试集)的情况下,识别精度平均可达95.3%,分析结果表明本文算法在奶牛个体识别领域。
  1基于SPM的BOF模型
  在自然语言处理和信息检索领域中有一种比较常见的用于文本分类的模型——词袋(BOW)模型,该模型将文本看作是若干单词的集合,忽略单词之间的语法和语序关系。随后,图像研究领域的学者将这一思想引入到图像检测和图像识别领域中,将图像看作是局部特征的集合,BOF模型由此诞生。BOF模型应用在图像识别领域主要包括以下步骤:首先是特征提取和特征描述,BOF模型多采用SIFT特征对图像进行描述;然后是构造视觉词典,选择一种聚类算法对图像的特征描述符进行聚类,通常采用的聚类算法是K-均值(K-means);最后是训练分类器对结果识别分类,比较常用的分类器是支持向量机(Support Vector Machine, SVM),常用的核函数有高斯核和线性核。
  将场景分类中常用的空间金字塔匹配原理引入到BOF模型中,即可得到基于SPM的BOF模型[16]。该模型的基本思想是利用空间金字塔对图像进行匹配、识别和分类,其工作原理如图1,图中的圆形、菱形和三角形分别表示三种不同的特征类型,三种不同分层方法的权重分别是1/8,1/4,1/2。空间金字塔匹配方法将特征集映射到多分辨率的直方图空间,在该空间中计算加权的直方图交叉结果,以此寻找特征集的最佳匹配。因此,空间金字塔匹配的核心思想在于将图像的特征集映射到高分辨率的空间内进行匹配,匹配的最终结果是不同分辨率下经过不同加权后匹配结果的和。  
  2改进的BOF模型
  BOF模型存在计算性能差、识别精度低的不足,上述基于SPM的BOF模型虽然提高了该模型的识别精度,但其计算性能仍有待提高。BOF模型的运算耗时主要集中在特征提取和描述阶段,其中SIFT特征维数较高、计算复杂度较大、特征计算耗时、执行效率低是导致算法计算性能差的一个很大因素。为此,本文将优化后HOG特征引入基于SPM的BOF模型替换SIFT特征以改善算法计算性能。优化HOG特征相比SIFT特征减少了特征维度,降低了特征复杂度,缩短了特征计算时间,从而提高了整个算法的计算性能。选择适当的特征提取算法对图像进行特征提取后,需要利用提取到的图像特征完成识别分类任务,此时分类器的选择至关重要。为进一步提高算法识别精度,本文分析对比了基于高斯核和直方图交叉核的两种SVM分类器的识别性能,实验表明后者更适合于本文的奶牛识别算法,因此最终选择后者作为本文算法的分类器。
  2.1优化HOG特征

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli