期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

动态交通数据异常值的实时筛选与恢复方法(2)

时间:2016-01-16 10:27 文章来源:http://www.lunwenbuluo.com 作者:徐程,曲昭伟,陶鹏飞, 点击次数:

  交通流数据在时间上具有一定的连贯性,即一定时间段内的交通流参数不会出现突变。如果某一采样间隔的交通流数据出现突变,则可以认为该组交通流参数出现异常情况。这与产品生产中所采用的多元统计质量控制方法类似。多元质量控制是指对多个质量特征共同进行统计控制的一种统计方法[11]。结合交通流三参数之间的相关性,采样多元质量控制方法进行异常值筛选。构造多元质量控制的指标公式为:Imqqmvvmoosqsvso=.+.+.(7)式中:I为多元数据质量控制的指标;mqn,mvn,mon分别为上n个采样间隔流量、速度和时间占有率的均值;sqn,svn,son分别为流量、速度和时间占有率的标准差。

  指标I即是根据3σ原则建立的一个多元质量控制的椭球体。若一组交通流参数qi,vi,oi使得I大于1,表明该交通流三参数向量在三维空间中的点落在了质量控制椭球体之外,则该组数据是异常的,应予以剔除,否则数据则是正常的。

  3、数据恢复方法

  通过四步骤的数据筛选过程,就可以把交通流时间序列数据异常值筛选出来。为了能够对动态交通数据进行实时应用,就必须快速准备的对筛选出来的异常数据进行恢复,以适应实时动态的交通管控需求。针对不同的数据异常类型与数量,就需要建立不同的数据恢复方法。

  3.1基于时间序列的数据恢复方法

  时间序列的数据预测方法从本质上来说都应该适合交通流数据的恢复。但是考虑到交通流数据的实时性、随机性和海量性,需要很强的在线处理能力。因此,本文采用较为简洁的平滑预测方法:βββ......=+++.(8)式中:.ix为异常数据的恢复值;x为前几个采样间隔的检测值;β为权重系数,且Σβ=1;k为平滑恢复采用的采样间隔宽度。这种方法主要适合于孤立异常数据的恢复,对于连续多个异常数据,方法的误差会大大增加。因此,当连续异常数据超过5个时,该方法就不适应了,需要考虑采用其他方法。

  3.2基于历史数据的数据恢复方法

  交通流数据的时间相关性既指时间序列中前后的关联性,也指由于出行规律导致的同一时间段内交通流参数存在相近的特性。因此,可以通过建立交通流数据库的历史数据来进行异常值的恢复。

  交通流历史数据计算公式为:()()(1)(7)iiiHxk=ηxk+.ηHxk.(9)式中:Hxi(k)为第k天第i采样间隔的历史数据值;xi(k)为实际检测值;Hxi(k-7)为上周同一天同一采样间隔的历史数据;η为平滑系数。因此,数据恢复方法可以为:.iix=Hx(10)公式(10)即采用历史数据对异常数据进行恢复,对于连续异常数据具有很好的恢复能力。这种方法简单易行能反映数据的趋势,但不能表征数据的微观波动特性。

  3.3基于空间位置的数据恢复方法

  交通流数据既在时间上具有相关性,同时也在空间上具有相关性,特别是城市道路交叉口不同进口道、上下游断面、快速路不同车道等区域,都存在着强相关性。利用这种空间相关性建立数据恢复方法如下:xkHxjxjjkn=Hxk=≠..(11)式中:.()ixk为第i采样间隔第k条车道交通流数据恢复值;Hxi(j)为第j条车道交通流历史数据;xi(j)为第j条车道交通流数据的检测值;n为车道数。

  该方法是基于不同车道历史数据的比例关系,从而推算恢复异常数据。这种方法能够改进基于历史数据的恢复方法,提高交通数据恢复的实时性。

  3.4基于时空相关性的数据恢复方法

  基于时空相关性的数据恢复方法是通过建立任意检测器数据与其他检测器数据在时空上的关联模型,进而通过其他检测器数据对存在异常的数据进行恢复。本文在前人相关研究基础上,改进了数据回归模型,考虑二元回归及中值鲁棒特性,建立数据恢复方法如下:012.(,,)()()iiixjmn=γ+γxm+γxn(12).()[.(,,)]iixj=medianxjmn(13)式中:.(,,)ixjmn为与j位置相关的检测器m和n对j位置数据恢复值;γ0,γ1和γ2为回归方程系数;xi(m)和xi(n)为m和n位置的实际检测数据;.()ixj为缺失检测器j的预测值。通过建立多个检测器数据之间的相关模型,得到多个回归方程,并利用这多个回归方程数据恢复值的中值作为最终的恢复数据。采用中值鲁棒特性的模型,可以避免部分检测器数据异常与丢失对最终恢复结果的影响,提高方法抗干扰能力。

  4、实例验证

  本部分将采用杭州市快速路检测器数据对上述数据筛选与恢复方法进行验证,以分析和比较方法的有效性与精确度。

  4.1方法流程

  动态交通数据的筛选与恢复流程主要包括数据筛选、数据恢复、历史数据的更新等过程。

  检测器得到的每一采样间隔的原始数据首先需要经过四步骤的数据筛选过程,如果没有异常,则直接进行历史数据更新与数据应用。如果存在异常数据,则需要根据错误数据的类型选择一种数据恢复方法进行恢复,再进行后续的历史数据更新与数据应用。下面采用杭州市快速路的实测数据对该流程与方法进行验证。

  4.2数据验证

  采用上述数据筛选方法对检测器得到的实际数据进行筛选,数据恢复方法采用时间序列的恢复方法。通过4步骤的数据筛选,总共剔除出9组错误的数据点。流量、速度和时间占有率的异常数据筛选与恢复结果如图5所示,上图为交通流参数的异常值筛选结果,下图为数据恢复结果。

  为了验证连续数据缺失情况下的数据恢复方法,以流量数据为例分别采用历史数据、空间位置以及时空相关恢复方法,对杭州市快速路四个位置的24h流量数据进行恢复。

  上述3种方法的数据恢复方法都能够较好的拟合实际数据,能够满足交通管理系统的需求,4个地点数据的误差分析。从中可以看出,3种方法的平均绝对误差在70veh/h左右,平均相对误差都小于10%。不同方法在不同地点的恢复效果也不一样,这是与数据采集的位置、历史数据容量、周边检测器完好程度等因素密切相关的。基于历史数据的恢复方法能够反映数据的变化趋势,但是对于数据波动与突变不能很好的展现。基于空间位置的恢复方法需要周边相邻车道数据完好,且需要有历史数据作为支撑。从总体上看,基于时空相关性的数据恢复方法效果最好,但需要提前建立相关地点数据的回归方程。

  5、结论

  完整精确的实时动态交通数据能够为交通管理者实现交通管理与控制目标奠定前提与基础。针对原始检测数据中存在的大量数据异常情况,本文提出了数据筛选与恢复的基本方法与流程,通过实际数据验证了方法的有效性与稳定性,结果表明本文方法具有较高的精度以及较强的工程实用价值。

  在后续研究中,需重点考虑特殊事件情况下,交通数据随机动态变化所导致的错误数据误筛选问题,以及在连续大量数据缺失下,研究利用其它类型检测器进行多源数据融合的恢复方法。

  参考文献:

  [1]裴玉龙,马骥.实时交通数据的筛选与恢复研究[J].土木工程学报,

  [2]姜桂艳,冮龙晖,张晓东,等.动态交通数据故障识别与修复方法[J].交通运输工程学报,

  [3]冮龙晖,姜桂艳,张晓东,等.智能运输系统交通检测器数据筛选与检验[J].吉林大学学报(工学版),

  [4]陈德旺,郑长青,章长彪.快速路交通流异常数据判断算法研究及实证[J].中国安全科学学报,


  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli