期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于档案元数据内容的电子文件自动鉴定

时间:2014-10-31 09:31 文章来源:http://www.lunwenbuluo.com 作者:尚珊等 点击次数:

  摘要:本文通过对现有的电子文件鉴定成果进行梳理,指出电子文件自动鉴定的必要性。为了使电子文件自动鉴定结果更准确,笔者以元数据内容为切入点设计了电子文件保管期限自动鉴定的元数据库,数据库中收录了不同保管期限的元数据项目,在此基础上,提出一些鉴定规则对自动鉴定进行规约,期望能最大限度实现鉴定的准确性和自动化。

  关键词:元数据电子文件自动鉴定

  一、电子文件鉴定研究综述

  随着电子文件的出现及其对传统纸质档案鉴定理论的冲击,国内外许多学者对电子文件的鉴定理论进行了研究。冯惠玲教授提出对电子文件的鉴定应该从内容和技术两方面来进行,在电子环境中,这项工作需要及早进行,文件管理系统设计阶段是鉴定文件最合适的阶段。[1]何嘉荪等人指出电子文件需要进行四次鉴定。[2]刘越南认为电子文件自动鉴定的方法是在系统中纳入并维护电子文件保管期限表,在鉴定的时候将文件与保管期限表对照进行判断。[3]于慧敏提出在设计文档管理系统软件时,可以根据机关或部门的职能重要程度编写程序由系统自动鉴定,自动给文件保管期限。[4]麻新纯对电子文件价值综合鉴定进行了阐述,即在电子文件生命周期的不同阶段采用不同的价值鉴定方法。[5]李雯以电子公文为例,介绍了一种基于业务知识库,借助信息雷达、文本挖掘等信息技术实现电子文件智能分析的鉴定模式。[6]谭琤培和章丹对与电子文件鉴定密切相关的档案元数据进行了一系列的研究,指出要建立元数据系统与制定元数据标准,通过系统自动记录与手工记录获取档案元数据。[7]叶晓林指出由于传统文件的管理理念和手段不能适应电子文件的管理,需要引入元数据技术对电子文件进行全程管理。[8]DAVID·A·WALLACE在《元数据和电子记录档案管理:回顾与展望》一文中提到几个最有影响力的电子档案工作者都主张用元数据系统的方法来管理电子记录,并指出元数据系统的方法会影响档案的鉴定和保存。[9] JAMES·WHITMAN提出记录保存的出处属性、真实性、完整性和元数据系统的发展是记录鉴定工作的关键。[10]由于电子文件的迅速增长,关于电子文件鉴定的迫切性在业内已经达成了共识,而大家期盼的最理想的目标是对电子文件实行自动鉴定。从综述看现有的理论研究并未达成共识,没有形成电子文件自动鉴定相对成熟的理论体系,需要相关研究不断地总结与完善。目前的研究成果大都集中在电子文件鉴定内容、程序、方法、原则等宏观方面的研究,缺乏微观方面的研究。

  对电子文件的鉴定主要包括价值鉴定和保管期限的鉴定。价值鉴定十分复杂,需要考虑的内容很多,而且容易受鉴定者的主观影响,因此本文对价值鉴定不做过多的阐述。档案的鉴定同样可以通过保管期限来完成,在实际鉴定保管期限时,目前还是参照国家档案局出台的文书档案保管期限表进行判断,由于保管期限表条款划分过粗、加之人为的因素或者判断标准不统一的情况,使得电子文件的保管期限判断不够准确。笔者试图从电子文件的部分元数据内容入手来判断电子文件的保管期限。

  本文以元数据为切入点,主要采用在文献调查的基础上,通过统计方法构建元数据库,将元数据内容信息作为电子文件保管期限自动鉴定的依据,期望能使电子文件自动鉴定更加完善,且具有实际操作性,从而提升电子文件归档管理的效率。笔者通过选取文件标题、主题词这两个能反映文件全貌的元数据内容项目进行了实证分析,对自动鉴定结果进行了验证。

  二、电子文件元数据库的内容创建

  元数据是指描述文件背景、内容、结构及其整个管理过程的数据。档案元数据对电子文件自动鉴定有着不可忽视的作用。档案元数据描述的内容有以下三方面:(1)内容信息:如标题、档号、分类号、主题词等;(2)结构信息:如段落层次、文体、发(收)文者、发(收)文者地址、称谓等;(3)背景信息:如形成文件的机构及其职能、形成文件的业务活动、文件使用情况、应用软件、文件使用权限、文件的保存与处置决定等。[11]档案元数据描述的内容中除了文件标题和主题词能反映文件全貌,其他元数据项目难以用来判断一份文件的保管期限。因此本文只选用了文件标题和主题词这两个项目来判断一份电子文件的保管期限。适当的情况下,在判断保管期限时,还可以加入责任者项目。

  为了使电子文件自动鉴定具有可操作性,笔者根据国家档案局发布的第十号令《企业文件材料归档范围和档案保管期限规定》,将其中涉及的元数据内容抽取出来,将元数据分别归到短期、长期和永久元数据库中,该元数据库要嵌入档案管理系统自动鉴定模块中。

  三、电子文件自动鉴定规则和流程

  (一)电子文件自动鉴定规则

  要使电子文件实现自动鉴定,除了元数据库是不够的,还需要一些规则对其进行规约,笔者归纳出以下鉴定规则:

  1.元数据库中的元数据项目彼此之间存在从属或并列的关系,使用等级分类的方法对它们进行表示,因此在设计数据库的时候,要把元数据项目之间的这种关系表达清楚,能提高自动鉴定的准确度。

  2.当判断一份归档文件的保管期限时,系统自动从档案著录系统中提取专业人员拟定的主题词、文件标题等元数据,然后与元数据库中事先保存的元数据项目进行匹配,可以设置精确匹配、模糊匹配、前向匹配等多种匹配方法。

  3.当抽取的电子文件元数据与元数据库进行匹配的时候,匹配的内容之间可能存在以下关系:(1)同一关系,指内容完全一样。(2)同涵关系,指描述形式不同,但内容一致,如计算机和电脑。(3)包含关系,指两个元数据描述的内容在语义上存在层级关系。(4)参照关系,指元数据的描述形式和内容均不一致,但内容之间互有参考的作用。因此从电子文件中抽取元数据的时候要依据概念关联规则,寻求蕴含关系,发掘隐含信息,力求匹配准确和全面。

  4.如果匹配记录为0的话,一时无法判断该份电子文件的保管期限,就需要相关档案专业人员结合国家档案局对电子文件保管期限的相关规定确定该元数据项目的保管期限,并及时将新增加的元数据添加到元数据库中,以不断扩充和完善元数据项目,确保鉴定结果的准确、统一,方便下次鉴定使用。


  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli