4支持向量机的脐橙分级检测
4.1支持向量机的识别算法
支持向量机(SVM,Supportvectormachine)是一种新的模式识别方法,具有兼顾训练误差和泛化能力的优点,它在解决小样本、高维度、非线性等模式识别问题中表现出很多优点。其主要思想是利用非线性映射函数将输入样本从低维空间映射到高维的特征空间,并在高维特征空间建立最优分类面[9]。支持向量机采用等式约束替代不等式约束,将误差的二范数作为优化目标的损失函数,把求解二次规划问题转化为求解线性方程组的问题。设目标函数:
?准(?棕,?孜)=■?棕■+C■?孜i(8)
式中,?孜为松弛因子,C为惩罚因子是正常数,约束条件是:
yi[(?棕·xi)+b]≥1-?孜i,i=1,2,…n(9)
为了解决优化问题,引入Lagrange函数:
L(?棕,b,?琢)=■?棕+C■?孜i-■?琢i[yi(?棕·(xi+b))-1+?孜i](10)
为求Lagrange函数的最小值,分别对?棕,b,?琢i,?孜i求偏导数并令它们等于0,这样可得最优分类函数:
y(x)=sign(■aiyik(x,xi)+b)(11)
式中,k(x,xi)为核函数。因高斯径向基函数构成的支持向量机有很高的非线性分类性能,所以核函数选用高斯径向基函数:
k(x,xi)=exp(-■)(12)
在以高斯径向函数构成的SVM分类机中,参数C和?啄对分类效果影响较大,目前还没有统一的方法来确定C的值,一般是通过实验选择合适的C值,再确定?啄的值,本研究在试验的基础上,最后确定C=20,?啄=0.36。
4.2特征的选择和归一化处理
有效表达和特征选择是脐橙品质分级检测的一个关键环节,良好的特征应该具有可区别性、可靠性、独立性和数量少等特点。选取的特征是脐橙的大小特征、果面缺陷面积、3个颜色特征和2个纹理特征为SVM的输入量,在建立分类超平面时,考虑到各特征量的变化范围,同时为避免不平衡的可能造成的计算困难[10],对SVM输入的特征量进行归一化处理,归一化处理的公式为:
Nva=■(13)
式中,Ova为原始特征值,Nva为归一化后的特征值,max(va)、min(va)分别为特征值的最大值和最小值。经过归一化后的特值值取值范围都为[-1,1]。
4.3支持向量机的构建和测试
SVM自动分级过程分为两个步骤,学习和建模过程:选择一批脐橙作为训练样本,把提取的脐橙特征参数值作为SVM的输入,脐橙的人工分级作为SVM期望输出。训练样本通过SVM自学习和参数调整,获得一组SVM最优参数,采用最优参数建立一种输入与输出之间的非线性分级模型。脐橙自动分级及检测过程:将待检测分级的脐橙特征参数作为SVM输入,通过建立好的SVM分类器进行分类,从而得到脐橙的分类等级。
SVM只能处理两类分类问题,而脐橙是多类的分级,为处理多类别分级问题,SVM的扩展主要有以下两种形式:①多对一,即选取类别中的一种作为一个类别,其余n-1类别作为另一个类别,这样分离一个类别,对其余n-1个类别用同样的算法分开。这样处理n个类别需要解n-1个SVM问题。②一对一,在任意两类样本之间设计一个SVM,n个分类就需要n(n-1)/2个SVM进行分类,最后得票最多的类别即为该未知样本的类别。这两种方法各有优缺点,考虑到实际工程的实时性和复杂性,采用前一种方法。为建立SVM的学习模型,以江西赣南地区产的纽荷尔脐橙为对象,根据GB/T21488-2008的要求,把脐橙分为4种等级:特级果、一级果、二级果和等外果(次品)(表1)。训练集脐橙共400个,先根据国家标准对样本进行人工分级,其中特级果、一级果、二级果、等外果各100个。测试样本与训练样本比例为1∶2,整个系统处理流程如图2所示,在建立好SVM分类器后,分别就单个特征向量和多个特征向量的分类效果进行多次测试,取其平均值进行比较,结果如表2所示。从表2可以看出当采用4个特征量进行综合分类时,其识别率最好可达到90.5%,单个脐橙处理时间为165ms。
5小结
采用机器视觉,提取脐橙的大小、果面缺陷、颜色和表面纹理4个特征向量,构建了以这4个特征向量为输入、以脐橙分级等级为输出的SVM分类机。经过试验测试,SVM分类机的识别率最高达90.5%。为基于机器视觉的脐橙品质分类检测提供了可参考的基础数据和技术方案,对脐橙自动分级检测生产具有实际参考价值。但此次的技术方案也存在一个不足,即未对脐橙的糖度进行检测,没有把脐橙的甜度纳入分级参考。
参考文献:
[1]李聪,高海燕,袁超.基于计算机视觉的苹果自动分级方法研究[J].计算机仿真,2012,29(9):293-296.
[2]WHITELOCKDP,BRUSEWITZGH,STONEML.Appleshapeandrollingorientation[J].AppliedEngineeringinAgriculture,2006,22(1):87-94.
[3]郑俊,龚声蓉,刘纯平.一种使用校正模板的非线性摄像机标定方法[J].计算机工程与应用,2011,47(31):192-196.
[4]殷勇,陶凯,于慧春.基于机器视觉的苹果分级中特征参量选择方法[J].农业机械学报,2012,43(6):118-121,127.
[5]POLATK,GUNESS.Breastcancerdiagnosisusingleastsquaresupportvectormachine[J].DigitalSignalProcessing,2007,17(4):694-700.
[6]李革,李斌,王莹,等.基于HIS颜色模型的珍珠颜色分选方法[J].农业工程学报,2008,24(8):284-287.
[7]ZELJKOVICV,PRAKSP.Automaticobjectclassificationandimageretrievalbysobeledgedetectionandlatentsematicmethods[J].SocialandTelecommunicationsEngineering,2012,79:204-205.
[8]孙君顶,郭启强,周雪梅.基于颜色和纹理特征的彩色图像检索[J].计算机工程与应用,2010,46(29):176-178.
[9]白鹏,张喜斌,张斌,等.支持向量机理论及工程应用实例[M].西安:西安电子科技大学出版社,2008.
[10]陈英,杨丰玉,符祥.基于支持向量机和灰度共生矩阵的纹理图像分割方法[J].传感器与微系统,2012,31(9):60-63.