期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于元数据整合的一框式检索系统分析

时间:2015-03-17 14:35 文章来源:http://www.lunwenbuluo.com 作者:海涛等 点击次数:

  摘要:通过分析图书馆数据整合的现状和背景,以吉林动画学院图书馆网站数字资源一框式检索系统为例,对基于元数据整合的一框式检索系统进行阐述和分析。
  关键词:元数据;数据整合;一框式检索
  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)01-0007-03
  1 图书馆数据整合的现状
  1.1 图书馆数字资源类型日趋多元化
  随着网络的迅速发展,大量的信息以多样化的表现形式和实时互动的交流方式构成了一个虚拟世界。数字资源类型日益呈现多元化趋势,信息量丰富,高校图书馆可通过自建、购买、共享和文献传递等方式满足读者需要。数字资源包括自建数据库,如馆藏书目数据库、学位论文和会议论文数据库、中外文现刊目次库、馆藏特色数据库以及教学参考书数据库等;外购数据库,如CNKI中国知网、万方数据知识服务平台、Elsevier ScienceDirect、Springer Link等;光盘数据库;网络数字资源以及参与共享项目建设的数据库。随着数字资源数量和数据库类型的不断增多,增长速度加快,可供读者选择的数据库多达上百种,面对如此多的资源,读者很难在特定的数据库中找到所需信息,需要在不同的数据库间切换、筛选,降低了检索效率。
  同时网络资源也是图书馆数字资源的一个重要组成部分,但是网络的不可控性造成了网上信息质量参差不齐, 缺乏系统的组织管理, 在选择和利用网上资源时给读者造成了很大的困难,同时也给图书馆为读者服务带来了不便,所以读者和图书馆都需要一个可以简捷、快速和有效地,能够实现跨库检索获取所需信息的理想平台。
  1.2图书馆数据整合的必要性
  高校数字图书馆作为学校数字化信息中心,为教学、科研及广大师生提供了信息服务保障,对提高教师教学水平及科研能力,起到积极的促进作用。高校数字图书馆的运行环境主要为校园网,提供局域网范围内的数字资源服务。作为一个知识服务机构,承担了对文献和资源进行筛选、整理, 使文献有序化的工作。[1]在数字图书馆成为发展方向的背景下,各个图书馆越来越重视数字馆藏的丰富性和多样性。与此同时,大量的复杂数据面向读者,使读者在选择和使用数字资源时造成困惑。图书馆作为“资源”和“读者”之间的桥梁,需要建立一个统一检索平台,使读者能够更加方便地从大量相关信息中准确挑选出所需信息,浏览和获取来自图书馆及网络的各类数字资源,开辟了一个全方位了解和掌握所关注学科和领域动态的较为方便快捷的途径。因此,构建统一的检索平台是解决这一问题的有效方式。[2]
  2 基于元数据整合的一框式检索
  2.1 元数据管理及特点
  在图书信息领域,元数据是指提供关于数字资源或数据的一种结构化数据,是对数字资源的结构化描述。跨库检索在图书馆网站中,与资源导航、开放链接、权限管理和个性化服务等功能一起构成的数字资源整合系统,是图书馆网站检索系统中的一种关键技术。但对所有资源的跨库检索只是一种理想状态,实际中只能做到兼容尽可能多的资源。读者需要针对某个学科领域、文献以及其他个性化需求的检索。元数据挖掘存储管理系统吸收了跨库检索的优点,并进行了改进,改变了读者的认识,通过对元数据进行存储和预处理去重排序,提供了搜索引擎方式的检索,保留了跨库检索的功能,解决了采用单一跨库检索整合资源的弊端。元数据仓储的建立,对于数据仓库的成功运行具有非常重要的作用。
  元数据管理主要有两个方面的任务:一是存储和维护元数据库中的元数据;二是数据仓库建模工具、数据获取工具、前端工具等之间的消息传递,协调各模块和工具之间的工作。通过元数据索引技术将图书馆的各种数字资源元数据预先收录,实现搜索引擎的检索效果,具有搜索速度快,检索结果统一无重复的特点。
  2.2 一框式检索及特点
  一框式检索系统通过资源调度系统,对各种异构数字资源进行应用检索整合。一框式检索引擎实现了文章题名、主题、作者、刊种进行分析型检索,使读者能够快速地获取所需要的结果,并且通过先进的知识组织体系和语义检索获取资源。一框式检索为读者提供了统一的检索语言和检索界面,能够实现对本地和异地各种数字资源系统的检索,对多种异构系统的联邦检索,对多种资源元数据仓库的跨库检索,为读者提供了个性化的检索服务。一框式检索系统是图书馆网站的核心组件之一,是一套完整的文献检索、获取系统。
  2.3基于元数据整合的一框式检索系统
  目前高校图书馆都同时拥有多种数字资源类型,每种数字资源都属于独立的系统,读者需要进入不同的数据库才能获取资源,海量的数字资源给读者带来诸多不便。为解决该问题,本馆利用发现系统对馆藏纸质资源和数字资源进行了大规模整合,并在网站上启用了“基于元数据整合的一框式检索系统”。
  系统建设的整体架构通过两层——业务层和数据层实现,采用分布式大数据处理系统,将数据库中的非结构化与结构化数据通过收割(METS 、OAI)、复制、导入等技术聚合起来,建立联合资源仓储(Union Catalog/Database),通过搜索元数据仓储中已经收割预处理好的元数据,列出检索结果,从实际应用角度入手整合了馆藏OPAC系统和各类数字资源系统。系统支持的元数据包括DC、Marc、EAD等,检索协议包括HTTP、Z39.50、Zing、CALIS-ODL等。
  2.3.1 系统框架
  基于吉林动画学院图书馆馆藏资源的现状,根据元数据仓储整合原理,构建的一框式检索系统数据整体架构如图1所示。
  一框式检索系统可以直接对馆藏资源进行统一检索,通过与资源调度系统集成,对来自各个数据库的数字资源进行统一检索整合。
  2.3.2 元数据仓储建设
  元数据挖掘存储管理系统先对元数据收割、抓取,再进行存储和预处理去重排序,通过元数据索引技术将图书馆的各种数字资源元数据预先收录,最终实现互联网搜索引擎的检索效果。 
  2.3.3 一框式检索引擎
  一框式检索系统通过资源调度系统,对各种异构数字资源进行应用检索整合。系统利用知识组织体系和语义检索获取信息,为读者提供统一的检索语言和检索界面,对各种资源元数据联合仓库的跨库检索,实现了元数据搜索、跨库检索、全文搜索、篇目搜索等功能,能同时检索多个不同类型的资源。
  2.4 实践效果
  2014年初图书馆正式使用一框式检索系统,实施统一检索功能,方便读者在统一检索框下实现全部馆藏资源包括CNKI、读秀学术搜索、馆藏纸质、电子书等资源的检索。
  2.4.1 一框式检索系统主要功能
  一框式检索系统可以对图书书目和期刊篇目进行统一检索,检索速度快,结果统一,而且篇目、书目检索结果还可以进行二次聚类,让读者看到每一次检索对应的年代、学科分类导航。一框式检索系统通过与资源调度系统及文献传递系统的集成,对来自各个数据库的图书和期刊的数字资源进行统一检索整合,实现了对文章题名、作者、主题等内容的检索,使读者能够快速地获得合适的检索结果,并且通过知识组织体系和语义检索获取信息,使读者能对本地和异地资源同时检索。主要功能介绍如下:
  1) 全文检索:对图书内容的全文检索。
  2) 快速检索 :帮助读者像利用搜索引擎一样检索学术资源,可自定义多个快速检索集并且自由排序,供读者选择检索。
  3) 整合检索 :提供对异构资源的检索能力,可同时检索多个不同类型的数字资源,并且允许自定义单次可检索资源的个数。
  4) 多面搜索: 搜索任意一种资源时,同时显示除其他相关的资源信息;检索一个内容的同时,并获得其他方面对资源的揭示内容。
  5) 统一的检索结果:对检索结果统一格式显示,支持排序、搜索数据预先的合并和去重。可分别查看合并检索结果或者各库检索结果。
  6) 资源导航 :通过主题分类、字顺列表及其它查找方式,对各种数字资源进行导航,还可自定义数字资源的描述字段。
  7) 语义分析:通过对读者检索词的自然语义分析,调整分词体系,以达到智能检索和精确检索。
  2.4.2 具体实例
  例如:利用统一检索框搜索与“动画设计”相关的文献资源,并精炼检索出馆藏纸本和电子资源。
  1) 在统一检索框中输入“动画设计”并点击检索按钮。
  2) 全部检索结果如图4所示。
  3) 在左侧“精炼检索”中,勾选“只检索馆藏纸本资源”和“只检索馆藏电子资源”,并点击“确定”,得到相应的结果页面。
  2.4.3 优势对比
  “基于元数据整合的一框式检索系统”与图书馆门户主页上的原有“快速检索框”相比,具有以下优点:
  1) 建立了统一的数字图书馆资源目录体系,包括本馆纸质书目、本地各类镜像资源、远程可访问资源及其他网络学术资源。
  2) 提供了知识挖掘和数据分析功能,帮助读者快速找到所需要的资源,提高了馆藏资源利用率。
  3) 结合网络技术,对门户网站进行改造,加强了资源展示度,提升图书馆信息服务力度,使读者更加了解图书馆的资源和服务内容。
  3 结束语
  数据整合是信息社会发展的必然,是实现信息共享的前提,也是提供优质化服务的基础。使用元数据整合后,可以实现快速、便捷的“一站式服务”,在整合平台上为读者提供个性化服务,促进信息共享,减少不必要的重复建设。[3]
  一框式检索系统解决了信息过载给读者带来的困难,提高了读者全面、综合、准确地利用信息的能力,实现了图书馆数据整合的跨越式发展。
  参考文献:
  [1] 李鹏云.基于元数据仓储的图书馆数据整合实践——以国家图书馆“文津搜索”项目为例[J].图书馆学刊,2013(8):46-49.
  [2] 王旭.国内数字图书馆集成检索系统发展对策研究[D]. 湘潭:湘潭大学,2013.
  [3] 刘子辉,陈强,杨平.以元数据为核心实现区域数字图书馆数据资源整合[J].重庆科技学院学报(社会科学版),2012(3):153-154.
  [4] 严武军,马小燕.高校数字图书馆元数据检索系统的设计与实现[J].计算机工程与设计,2006(1):162-164.
  [5] 张宇良.MyLibrary个性化服务与资源整合检索系统研究[D].广州:华南理工大学,2011(1).
  [6] 徐荣华.基于元数据仓储的资源整合应用[J].图书馆杂志,2012.
  [7] 胡东,詹利华. 浙江网络图书馆的实践与思考[J].图书馆学研究,2010. 

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

    联系方式

    • 论文投稿客服QQ: 论文投稿2863358778
    • 论文投稿客服QQ: 论文投稿2316118108
    • 论文投稿电话:15380085870
    • 论文投稿邮箱:lunwenbuluo@126.com

    热门排行

     
    QQ在线咨询
    咨询热线:
    15380085870
    微信号咨询:
    lunwenbuluoli