基于本体的信息检索系统的研究
时间:2013-09-22 14:28 文章来源:http://www.lunwenbuluo.com 作者:马新军 点击次数:
1引言
随着信息技术发展与应用的不断深入,网络已经成为世界范围的信息源。与之相伴的是信息检索问题,怎样实现在海量网络信息中获取符合用户需求的信息,是信息检索界亟待解决的课题。本文以图书信息的查询为例,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的服务打下基础,本文的成果具有比较好的理论价值与实践意义。
2本体技术概述
本体是以系统化的方法来描述客观世界的事物,从而能够实现事物中所包含元素的集成和重用,从而将信息抽象为知识。在对事物的描述中,本体将所有的事物分解为不同的概念,并准确地定义概念之间的逻辑联系。当前,作为一种信息技术的实现方法,本体论在计算机领域中具有比较重要的价值与意义,正在一些领域有着比较广泛应用,包括语义网络的实现、智能搜索的设计、异构数据的整合、以及GIS系统和图书馆的数字化等。在这其中,语义网络的研究和应用是一个热点。
3基于本体的信息检索设计与实现
3.1系统框架设计
结合目前应用比较广泛的B/S的结构体系,本研究所涉及的信息检索结构分为三个层次,下面分别进行阐述:(1)应用层的设计。在基于本体的检索系统中,应用层的功能是处理用户需求,实现用户和系统的交互。在应用层中,通过用户界面的表单来处理用户所输入或者选择的查询请求,对请求的格式进行初步处理之后传输至逻辑层进行进一步的处理,并将由逻辑层传输到本层的检索处理结果向用户显示。(2)逻辑层的设计。逻辑层是检索系统对查询和检索结果进行处理的核心部分,主要功能有:用户查询的生成、用户查询条件的表达、用户查询的执行。逻辑层的设计成股份考虑到了检索内容的本体模型与查询处理之间的匹配。(3)数据层的设计。数据层的功能是对系统的数据进行存储,针对本文所研究的图书信息而言,将会为所有的图书数据构建一个基于本体的数据库,本研究选择的是sqlserver数据库。在数据库中,结合本体库知识对所存储的信息以及信息之间的联系进行标注,从而使图书信息能够以本体的规范进行存储,以便查询。
3.2检索方法的设计
当前,无论是基于哪一种搜索引擎,具体的检索结果往往难以保证足够的查全率和查准率。其核心原因在于:首先对没能准确地表达用户的查询需求,导致信息系统难以精确地把握查询需求;其次是系统是以机械匹配的方式来处理用户所输入的检索关键词,因此没能对所查询的语句进行必要的扩展。所以本研究所涉及的基于本体的检索方式的设计基本思路为:(1)基于本体对于事物的描述,首先对用户所输入的查询条件进行整理和优化,把其查询条件进行转换,使之能够体现为本体的概念以及本体元素之间的联系。(2)结合本体的信息处理模式,对转换之后的查询条件进行概念上的扩展,最终形成符合本体属性和特点的查询式,开始查找,并得到结果。
3.2.1基于本体的检索优化方案设计
此处将用户查询条件所属的原始概念空间定义为{C,R},在该空间中,C的涵义是查询条件所包含的全部概念项,R的涵义是全部概念项之间所拥有的逻辑关系。在本体的设计理念下,本研究把检索优化的步骤定义为(1)把概念项空间C里用户的查询概念进行转化,使之成为本体类型的概念,从而构建基于本体的概念;(2)结合查询概念之间的逻辑关系R,对查询条件进行逻辑转换,从而构建符合本体模式的优化概念空间。
在(1)中,首先设概念项空间C里所包含的概念项是(C1,C2,C3,C4,C5……),针对里面的所有概念项,在已经构建的本体知识库里搜索与这些概念项匹配的概念,所有的同义词以及词性变换均能够生成新的记录,以(Ci,Oi)表示。记录中,Ci的涵义是概念项(C1,C2,C3,C4,C5……)中的一个元素,Oi则表示图书信息本体里和Ci匹配的概念,可知在这样的模式之下,每一个概念项均可能有多个与之匹配的概念,而所有的匹配概念最终形成新的概念集O。当前概念相的匹配完成之后,则进行针对查询条件的逻辑转换,最终通过一套逻辑转换规则形成新的逻辑关系。
3.2.2检索的语义扩展
- 论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
- 论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
-
- 论文投稿客服QQ:
2863358778、
2316118108
-
- 论文投稿电话:15380085870
-
- 论文投稿邮箱:lunwenbuluo@126.com