时间:2013-10-08 15:41 文章来源:http://www.lunwenbuluo.com 作者:牛轩 点击次数:
二分类问题研究,很难使用传统的基于预测准确率的模型解决,如客户流失、信用评估等,这些问题中不同类别样本的错分代价相差很大。解决错分代价差异问题,可以通过样本数据的预处理,也可以通过引入错分代价差异:阚宝奎、刘志新等考虑到人们对于两种判别错误的“厌恶程度差异”,在双隶属SVM建立时,对训练样本进行“非对称”处理(将虚假财务报告视为绝对属于虚假财务报告,而所谓的真实报告“谨慎”对待,进行双隶属分析)。这种新方法在公司财务报告真伪判别时,表现出了高于C-SVM和BP神经网络的判别准确率、泛化能力,并且显著降低了将虚假财务报告识别为真实财务报告的错误。钱苏丽、何建敏等[5]将错分代价纳入分类算法,同时考虑数据不平衡问题,建立了代价敏感支持向量机,使算法基于代价而非基于准确率。利用中国电信某分公司预付费小灵通用户数据实证,显示改进SVM能显著提高模型效能,且模型能够在两类错误(将流失客户错误预测为不流失客户、将不流失客户预测为流失客户)中找到一个平衡点使代价最小,弥补了传统模型默认代价相同、一味追求准确率的不足。
3结论与展望
当前,对客户流失预测、财务困境预警、信用风险评估的研究方兴未艾,继传统统计模型、神经网络等,学者引入支持向量机。总体看来,二分类支持向量机预测精度、泛化能力都高于其他模型,同时为了进一步提高其效果,学者不断研究:针对数据特征(存在外点或噪声点、非平衡性、重叠性、错分代价差异性等)相应引入模糊支持向量机、加权支持向量机、双隶属支持向量机以及代价敏感性学习机制等。虽然有关二分类支持向量机的研究趋于成熟,但仍存在一定的局限性:目前仍没有很好的方法指导针对具体问题的核函数选择,缺乏有效方式将二分类问题扩展为多分类问题研究,将是未来研究方向。
参考文献:
[1]阚宝奎,刘志新,宋晓东,杨众.改进支持向量机在虚假财务报告识别中的应用[J].管理评论,vol.24,2012(5).
[2]张目,周宗放.基于多目标规划和支持向量机的企业信用评估模型[J].中国软科学,vol.4,2009(5).
[3]GangWu,EdwardY.Chang.Class-BoundaryAlignmentforImbalancedDatasetLearning[C].ICMLWorkshoponLearningfromImbalancedDataSetsII,WashingtonDC.2003.
[4]应维云,覃正,赵宇,李兵,李秀.SVM方法及其在客户流失预测中的应用研究[J].系统工程理论与实践,Vol.7,2007(7).
[5]钱苏丽,何建敏,王纯麟.基于改进支持向量机的电信客户流失预测模型[J].管理科学,vol.20,2007(2).
作者简介:牛轩(1989-),女,河北新乐人,硕士研究生,研究方向:市场调查。
联系方式
随机阅读
热门排行