我国电子文件长期保存的技术策略研究
作者:王小玲 字数:4404 点击:
摘 要:电子文件是我国信息资源的重要组成部分,其长期保存对于发挥信息资源综合贡献力具有重要作用。针对电子文件长期保存过程中出现的问题,笔者提出迁移、仿真、开放描述与标准化等电子文件长期保存技术策略。
关键词:电子文件;长期保存;技术策略
1 前言
电子文件长期保存是电子文件进入档案管理阶段后的主要管理目的,保存期限由法定需要和业务需要而决定,对于档案馆这样保存公共文件的机构,保存电子文件的期限通常为几百年。所谓长期的概念,是指时间足够长以致于需要关注技术变化的影响,包括新介质及数据格式的支持,或者用户群的改变。
钱毅认为电子文件的长期保存,可视为降低数字对象对软硬件环境的依赖性的过程。电子文件的长期保存包含比特保存和信息保存。比特保存主要指存储载体老化或逐步过时的过程中,或在经历不可控自然灾害后,恢复存储载体上所存信息的能力,重在解决硬件存储问题。信息保存指在技术革新和用户群变化情况下,电子文件数据可读性与可用性的保存,重在解决软件、应用程序问题。
2 我国电子文件长期保存的意义
电子文件是社会的“记忆”、人类的核心战略资源必须长久保存,做好我国电子文件的长期保存工作具有重要意义。
(1)增强国家对信息资源的控制力,发挥信息资源综合贡献力。冯慧玲教授指出“信息资源对国家经济社会发展具有不可替代的、全方位的、综合性的价值与作用”。现如今,电子文件已经成为文件的主要形式,是现代社会信息资源的重要组成部分。做好我国电子文件长期保存工作有利于改善我国电子文件失控管理现状,提升国家对信息资源的控制力,发挥信息资源的综合贡献力,促进我国新一轮信息化战略的开展。
(2)有利于促进国家历史和民族记忆的延续。十八大指出“文化越来越成为民族凝聚力和创造力的重要源泉,要提高国家文化软实力”。电子文件的长期保存,系关国家文化遗产的留存、文化软实力的提升和民族记忆的延续。提高我国电子文件长期保存能力,保证电子文件的完整性、真实性、准确性,能有力促进我国历史和民族记忆的延续,充分发挥电子文件作为当代文化传承的主要载体作用。
(3)有利于保证电子文件可信性,发挥电子文件凭证作用。电子文件是机构在开展电子商务、电子政务或其他电子化业务中产生的凭证性记录,是证明一个机构业务活动合法性的重要凭证。保障电子文件的可信性,有利于充分发挥电子文件在实际工作中的凭证性作用,提高社会活动的效率。
(4)有利于带动电子文件软硬件市场和服务市场的发展。电子文件从形成、处理归档、移交和长期保存的整个过程,需要电子文件的业务系统、电子文件管理系统和数字档案馆系统三个系统的协同完成。电子文件管理的软硬件和服务市场是所有信息化市场中最大的一个。加强电子文件的长期保存能协同带动电子文件软硬件市场和服务市场的快速发展。
3 我国电子文件长期保存面临的挑战
电子文件载体的改变、计算机软硬件技术的升级换代以及主客观因素的变化都会影响电子文件的真实性、完整性、可靠性和长期可存取性。
3.1 存储介质寿命
电子文件存储介质的寿命包含形体寿命和技术寿命。形体寿命是指介质物理老化的时间。一般的CD-ROM、磁光盘以及磁盘的形体寿命是5-100年,WORM是10-100年,IBM3480、IBM3490E等磁带的寿命是30年。技术寿命与不同类介质所依赖的技术发展速度相关,技术发展越快,介质的技术寿命越短,信息更新频率越高,在更新过程中丢失数据的风险也更大。一般的磁带的技术寿命高于光盘、磁盘的技术寿命为25年左右,而光盘、磁盘的技术寿命一般为10年。可见,存储介质的寿命要远低于电子文件长期保存期限,这种“时间上”的差异决定了存储在某一介质上的电子文件必须经过多次迁移、复制等手段才能长期保存下去,,这对电子文件的可信性带来挑战。
3.2 软硬件的更迭
随着计算机技术的飞速发展,软硬件的更新迭代频率变高、周期变短。大多数软件在电子文件长期保存期限内就被升级淘汰。如微软公司在2007年、2014年先后停止支持Windows 97 和Windows XP个人操作系统。软件开发商和制造商快速推动着软件的升级开发,软件升级更快,软件的兼容和支持的持久性受到挑战。软件的更迭变化引起电子文件存储格式的变化和电子文件可读性的差异,这容易致使电子文件数据的丢失。
3.3 不可控人为行为
电子文件形成者在电子文件形成过程中疏忽操作或为工作便利而无意损坏电子文件的原始性。电子文件保管者因失误操作或保管不力而造成电子文件数据损坏或被盗都会危害电子文件安全。电子文件利用者无意删除(修改)事后任需要的数据。
3.4 不可预测的自然灾害
据统计,青海玉树地震中,灾区档案馆保管的13万卷档案中,有近万卷档案因办公大楼倒塌被废墟掩埋,其余12万卷档案均在地震危房中。电子文件存储介质易受外界因素影响,不可预知的自然灾害对于电子文件的保存带来潜在威胁。
4 我国电子文件长期保存的技术策略
电子文件的长期保存是一个起始于文件形成并贯穿于整个文件生命周期的持续性过程,涉及文件形成者、保管者、利用者等多个主体,以及采集、描述、归档、存储、保管、利用等各个环节,要充分运用技术手段,以确保电子文件的真实性、完整性、可靠性和长期可存取性。
4.1 迁移
电子文件的迁移是指将电子文件数据从某一环境转向另一环境的过程。相比于其他技术,电子文件迁移技术具有独特优势:(1)适用范围广。迁移即可实现技术平台的转变,又支持电子文件格式的转换以及硬件环境的变更。仿真技术是对原数据的再保存,本质上只是延缓技术淘汰。更新技术也只实现同类载体间的转换,对于系统操作兼容性要求高。(2)迁移技术是一种可持续性方法,较能彻底的解决长期保存问题。仿真和更新技术都是针对同一技术时代的数据进行保存处理,随着技术更迭和系统操作的不兼容,要实现后续保存的难度很大。
虽然迁移法能保证数字资源能够被普遍接受的格式为人所用,并能被复制,但是迁移技术任具有一定局限性。迁移资源量庞大,转化过程耗费大量时间,工作量大。电子文件的格式转换中会不可避免的丢失一些数据。采用已经淘汰的电子文件格式或转换工具进行格式转化或数据迁移是失效的。
4.2 仿真
仿真是指在新的系统环境中建立原始数据、设备和管理系统的运行环境。即在新的系统环境下重建一个兼容原始数据、设备及其管理系统的运行环境,使得原来的数据、设备和系统能运行在现行的软硬件系统上。仿真实际上是通过保护数字信息的利用环境来保障数字信息内容的可利用性。仿真技术一般包括仿真硬件平台、仿真操作系统、仿真应用程序三个级别。比如W indows操作系统中几乎都集成了DOS平台,2位操作系统平台集成16位平台,使得原来平台的应用程序可以在新环境中继续使用。仿真技术可以同时重现内容和外观形式,在某些情况下,数字文件的外观形式是构成其完整性的重要内容,而迁移技术偏重内容的保护,经常丢失一些外观信息。
仿真技术在理论上虽然比较先进,但其发展仍受到知识产权等因素的制约。要规避知识产权限制,仿真技术要求能及时获取开源代码,而当前的操作系统、应用软件、硬件产品核心代码处于封闭,这严重制约仿真技术的发展。笔者认为解决这个问题需要由具有较高信任度的专门机构来维护仿真器的开发,并出台相关的法律意见。
4.3 开放描述与标准化
所谓开放描述,是指利用计算机可以识别的开放语言和规范方式来描述数据格式、管理机制、组织方式各层次的内容。一般而言,数字档案文件的保存需要许多“元数据”的解译资料来从旁协助注解,注解得越多、越详细,其受技术过时的影响就越小。一个数字文件生成系统可以将自己的开放描述文件提交文件登记中心(或类似机构)进行注册,第三方系统可以根据开放语言的规则读取、识别、检索、验证其所产生的数字文件,只要开放描述文件有效,这类文件都能够得到有效读取,而与时间无关,从而达到长期存取的目的。
4.4 其他方法
此外还有不少其他的数据保存技术。(1)硬件博物馆。1此法通过大量保存文件、软件、硬件的方法来重现环境,但这种方法对于大数据量而言是很难实现的,难以维护系统的持续运转。(2)延长载体寿命。通过改进物理载体的稳定性、存储能力,提高载体质量,延长使用寿命,缓解媒体脆弱性的问题。(3)缩微胶片。缩微胶片的寿命可达300年,通过数字存档机等转换设备可以将数字档案文件直接“拍摄”在缩微胶片上,实现数模转换。此法广泛应用于CAD文件、医用X片等档案文件的长久保存。
5 结语
电子文件的长期保存是一项起始于电子文件形成之时并贯穿于电子文件整个生命周期的活动。电子文件存储介质的寿命、软硬件的更新换代、不可控人为因素的破坏以及自然灾害的威胁都给电子文件的长期保存带来巨大挑战。迁移、仿真、开放描述与标准化存储等技术策略都只能对电子文件长期保存起到一定促进作用而无法完全解决电子文件的长期保存问题。因而电子文件的长期保存是一个复杂工作,需要在实践中不断创新,创新电子文件长期保存方法,以更好实现电子文件的信息资源综合贡献力,推动我国电子文件的新一轮发展。
参考文献
[1]Technical Committee ISO/TC 171. ISO/TR 18492-2005,Long-term preservation of electronic docunment-based information[S].2005-10-01.https://www.iso.org/obp/ui/#iso:std:38716:en
[2]钱毅.我国可信电子文件长期保存规范研究[J].档案学通讯,2014(3):75-79.
[3]Sanett S. The cost of preserving electronic records[J]. Computers in Genealogy, 2004,8(6):226-236.
[4]冯慧玲.档案信息资源在国家经济社会发展中的综合贡献力[R].2005年中国信息资源管理论坛,2005-05-30.
[5]冯慧玲,刘越男.电子文件管理国家战略[M].北京:中国人民大学出版社,2011.
[6]马林青.InterPARES电子文件长期保存政策框架及其启示[J].档案学研究,2012(5):59-62.
[7]张德成.浅谈电子文件的迁移[J].兰台世界,2012(Z3):56-57.
[8]Hoke G E J, C R M. Future watch: Strategies for long-term preservation of electronic records[J]. Information Management, 2012,46(3):26-28,30-35.