期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

自然语言实时交通信息与位置信息的融合方法(2)

时间:2014-03-06 10:44 文章来源:http://www.lunwenbuluo.com 作者:张水舰等 点击次数:

  2自然语言交通信息与交通网络的融合

  自然语言理解可分为两个方面,一是口语的理解(如语音识别等);二是文本语言的理解(如信息检索等)。本文主要研究文本自然语言交通信息的理解。自然语言交通信息与普通自然语言相比,主要有以下几个特点:①使用的词汇量比较少,主要是有关于交通方面的词汇;②词义较明确,歧义较少;③句型变化较少,多为陈述句。因此对自然语言交通信息进行解析相对较容易。

  2.1自然语言交通信息的分词算法

  汉语是一种词根语,主要特点有:①汉语缺乏形态变化,没有英语的性、数、格的变化标志,因此词本身不能显示与其他词的语法关系;②汉语结构松散;③虚词是主要的语法手段;④汉语词与词之间没有明显的形态间隔[9]。这些特点决定了汉语的自动分词是汉语自然语言理解的首要任务,分词是进行语义分析的基础。

  2.1.1词库的建立

  词库是自然语言理解的核心部分,词库的建立直接影响着自然语言交通信息的正确理解。不同的语言理解系统对信息处理的目的和应用不同,词库的组成类型也不同。自然语言交通信息理解所涉及的词库包括地址词库,如道路名、机构名、POI等;空间关系词库,如拓扑关系、方向、偏移等;交通事件词库,如车流量、相撞等;基础词库,指在语言理解过程前预先加载的领域相关词汇,包括动词、量词、介词等。

  2.1.2自动分词处理分词算法

  汉语自动分词是自然语言理解的关键因素。目前的自动分词算法主要有:一是机械匹配法,如正向最大匹配法(MM)、逆向最大匹配法等[10]。机械匹配法不需要任何的词法、句法、语义知识,不需要复杂的数据结构,执行起来简单,但要求有一个很大的匹配字典,不能很好地解决歧义问题。二是基于统计的分词方法,如N元文法模型、隐Markov模型、最大熵模型等[11]。此类分词法不需要一个机器可读词典,但需要大量的训练文本。三是人工智能法,如神经网络模型分词法、专家系统分词法等[12]。

  正向最大匹配法是一种常用的分词方法,是基于一定词库的机械分词方法,其核心思想是长词优先原则,即在语句切分过程中字数较多的词优先被匹配切分,以得到的词汇数量最少时为最佳切分结果。其切分步骤为:假定最大词长为M,首先从待切分句子的句首取长度为M的子字串进行匹配,如果匹配成功则切分此字串为一个词,如果匹配不成功则减去字串的最后一个字继续进行匹配,按此方法直至匹配成功或字串减至为空;按此过程对下一个子字串进行匹配切分直至句尾。此方法设计思想简单,在计算机上容易实现,且时间复杂度较低,但是最大词长M的大小难以确定,定得过大,则切分时匹配效率太低,算法的时间复杂度明显增加;M定得太小,则会对切分的正确率产生影响。

  2.2自然语言交通信息与交通网络的融合方法

  自然语言交通信息中的空间位置信息是模糊的,并没有坐标信息,为此对于得到的自然语言交通信息要能对交通流进行诱导,必须让自然语言交通信息与路网进行融合,只有使自然语言交通信息具有了地理位置信息才能分析此位置发生的交通事件对交通流的影响。

  如上述分析,交通网络是由边和节点组成,交通事件是发生在路网上。自然语言交通信息的定位方式有以道路交叉口(路口)或道路名来定位,有以离网络边或网络节点很近的地物来描述交通事件发生的地点。道路交叉口(路口)对应着交通网络上的节点,对于以道路交叉口(路口)来定位的交通信息可以直接与交通网络匹配融合;对于偏移交叉口(路口)一定距离的,可以沿着网络边按偏移方向加上偏移量然后取得定位点的坐标。交通事件都是发生在网络中,并不是发生在地物这个位置上,人们只是习惯于用最近的地物表示发生交通事件的位置,由于地物并不对应着网络上的节点或边,所以对于以地物定位的自然语言交通信息首先要找到与地物最近的网络边或节点,如果没有偏移量就直接获取与交通网络最近点的坐标,如果有偏移量就从最近点按偏移方向加上偏移量然后取得定位点的坐标。具体的匹配融合方法如图1所示。

  3实验

  以南京市交通网络为例,南京市交通网络由2668条路段和1677个节点组成(如图2所示)。选择2012年9月8日早上8点半到下午17点半这一时间段内南京交通广播电台播送的实时交通信息,共计327条。

  4结束语


  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

相关内容

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli