手机版
欢迎光临汇博在线http://www.paper188.com
您的位置:汇博论文在线 > 管理论文 > 工商管理 > 基于档案元数据内容的电子文件自动鉴定

基于档案元数据内容的电子文件自动鉴定

2014-12-08 09:44 来源: 互联网 作者:尚珊 苗媛 浏览次数 2677


  (2)由于政策的变化,长期、短期、永久划分没有绝对的标准,各单位依据自身具体情况,参照国家档案局出台的保管期限划分等相关规定进行区分,短期可能是3年、5年、10年或15年不等,长期可能是15年或30年不等。 
  3 电子文件自动鉴定规则、流程与实例 
  3.1 电子文件自动鉴定规则。要使电子文件实现自动鉴定,只有元数据库是不够的,还需要一些规则对其进行规约,笔者归纳出以下鉴定规则: 
  3.1.1 元数据库中的元数据项目彼此之间存在从属或并列的关系,因此在设计数据库的时候,要把元数据项目之间的这种关系表达清楚,能提高自动鉴定的准确度。如下所示: 
  1 党政企事业单位设立、变更、解散 
  1.1 筹办申请、设立申请、批准设立 永久 
  表中内容是永久元数据库中的项目,一级标识是代表党政企事业单位在设立、变更或解散过程中形成的文件材料;二级标识是代表在满足一级标题的情况下,如果涉及筹办申请、设立申请和批准设立的文件要永久保存。每一级标识里的元数据之间是并列的关系,而上一级标识和下一级标识之间是从属的关系。 
  3.1.2 当判断一份归档文件的保管期限时,系统自动从档案著录系统中提取专业人员拟定的主题词、文件标题等元数据,然后与元数据库进行匹配,可以设置精确匹配、模糊匹配、前向匹配等多种匹配方法。 
  3.1.3 当抽取的电子文件元数据与元数据库进行匹配时,匹配的内容之间可能存在同一关系、同涵关系、包含关系、参照关系。因此从电子文件中抽取元数据的时候要依据概念关联规则,寻求蕴含关系,力求匹配准确和全面。 
  3.1.4 如果匹配记录为0的话,就需要相关档案专业人员结合国家档案局对电子文件保管期限的相关规定确定该元数据项目的保管期限,并参照表1及时将新增加的元数据添加到元数据库中。 
  3.1.5 在档案管理系统中设定归档电子文件到期自动检测功能,根据电子文件归档时间和保管期限,将到期的电子文件筛选出来以方便档案人员对其鉴定。 
  3.1.6 标题相同的两份文件,在添加和删除的时候,可以根据责任者、主题词、文件形成时间等其他元数据项目进行判断,以防重复添加或误删重要文件。 
  3.1.7 通过对抽取出来的元数据进行分析,发现大部分元数据的词性均为动词或名词,因此在抽取词汇的时候,首先应当过滤掉名词与动词以外的词汇,以减少计算的复杂度。此外,考虑到抽取出来的元数据还有一少部分是副词词性,主要有重大、重要和一般三种。鉴于此,笔者认为需要编一个例外词库,将这三个副词分别标明代码为1,2,3。对于某些三级、四级标识中的一般、重要以及二级标识中重复的词可以放到例外词库中,减少重复判断的次数。将一、二、三级标识中不重复的名词和动词放入元数据词库中。当判断一份电子文件的保管期限时,将抽取出来的关键词与元数据词库和例外词库中的词进行匹配即可。
[上一页1  2  3  4 [下一页]

服务说明

汇博在线(paper188.com)网拥有实力强大的团队,能帮助你实现论文写作方法,论文发表,代写代发论文等服务领域.

我们承诺

在您接受本站服务的过程中,我们为您提供优质的服务,包括后期免费修改、免费指导答辩等。衷心感谢您对本站的信任和支持!

论文指导范围

毕业论文,硕士毕业论文,研究生论文,博士论文,职称论文代写,领导讲话,报告总结,演讲致辞,心得体会,党团辅导等代写服务。

发表论文领域

发表省级杂志,国家级杂志,核心杂志等服务。