资讯动态
行业资讯 您现在所在的位置:首页 > 资讯动态 > 行业资讯
数字档案信息的相关存储知识
发表时间:2021-03-08     阅读次数:     字体:【

  数字档案信息能否保留下来取决于其介质的物理寿命,但当前的数字介质都无法维持很长的时间。像磁带一类的介质,最长的寿命是20年至30年;光盘一类的介质相对稳定一些,有人说其寿命可达30至50年,许多光盘厂家都说其寿命可达几十年甚至100年,但由于光盘出现的时间过短,迄今为止无法证实它们的寿命。在这种情况下, “除非有人特别留意,否则所有的数字信息将在几十年内丢失。” 档案工作者可以算是对数字信息的存储特别留意的人,但档案工作者无法参与到数字介质的生产当中去以提高其寿命。人们对数字信息存储载体关注的重点普遍在于设备是否廉价、访问速度是不是很高,而不是存储的长久性。

  数字档案信息的另一个比较重要的问题就是存储空间的问题。数字档案信息的存储一般需要较大的存储空间。“一页ASCLL文本只包含几千个字符,但是1英寸见方的彩色图像扫描进来后需要超过1兆的空间。一个小时的数字化声音需要存一张光盘,其容量超过600兆字节,1分钟的视频数据在压缩之前有1千兆字节。”为了降低对存储空间的要求,几乎所有的图像、音频、视频等大容量数据对象都要进行压缩。压缩包括无损压缩和有损压缩。无损压缩是将冗余的信息去掉,当回放压缩文件时能够准确无误地恢复原始数据。有损压缩算法靠丢掉大量冗余信息来降低所占的空间,回放时不能完整地恢复原始数据,损失了多少信息由需要多高的压缩率决定。在绝大多数应用中丢失一些信息是可以接受的。用于图像的JPEG压缩和用于视频的MPEG压缩都是有损的方法,但它们提供的图像能完全满足人眼的要求。但在一些应用中压缩必须是无损的,在许多数字档案信息存储过程中,应尽量采用无损压缩。虽然压缩可以大幅度降低数据量,但所需存储空间依然很大。“压缩以后,一页单色扫描的文本的数据量超过50000字节。MPEG压缩方法将每秒20至30兆的数字视频降为每分钟10兆字节。” 数字档案信息的存储包括数百万计类似的压缩后的对象,所以对存储空间的需求比较大。

  存储介质的评价取决于三个指标:存储成本、存取速度和安全可靠性。数字档案信息理想的存储介质是能够以较低的代价存储大量数据,同时支持快速存储和读取信息,并且经久耐用。国外数字图书馆选用存储介质的方法可以给数字档案信息的存储一些启示。目前,国外大规模数字图书馆对数字信息进行存储,都采用多级存储设备。其中典型的存储有三层:磁盘、光盘和磁带。

  磁盘是现代计算机系统中标准的存储介质。磁盘自问世以来,容量不断提高,价格逐步下降,一般在存储成本方面能够满足档案机构的要求;磁盘追求存取的高速度,其存取速度对数字档案信息存储而言是足够的,其性能适合于一次读取大量数据的要求;磁盘的弱点是在安全可靠性方面达不到档案信息保管要求,其磁层易衰退,由于硬件故障或程序覆盖,磁盘上的数据易丢失。磁盘阵列在一定程度上提高了磁盘的可靠性。它是将若干个硬磁盘机按一定的要求组成一个快速、超大容量的存储系统,数据分布存储在各个磁盘上,用并行存取来提高存取速度,再加上采用冗余纠错技术来提高可靠性。这样,磁盘阵列基于磁盘而速度和可靠性高于磁盘。在多级存储设备中磁盘主要用于在线存储,保证数字档案信息可以在几分之一秒内读取。

  光盘的特点是可以降低存储成本,它为存储大规模数据提供了廉价的方案。光盘安全可靠性相对稳定,其寿命也比较长。存取速度是光盘的弱点,使用光盘时必须先将其从光盘舱中移到读取头处,这个读取过程比较缓慢。在多级存储设备中光盘用于离线存储大规模数据。将多台光盘机组合在一起还可以构成光盘库、光盘塔和光盘阵列。这些容量巨大的设备对于数字档案信息的存储非常有用,它们能在一定程度上克服读取速度的问题,大量不常用的数据一旦需要就能尽快找到。

  磁带最大的特点是经济、可靠,它是存储备份的首选介质。磁带的弱点是读取数据速度较慢、效率较低,另外磁带对保存环境要求较高,在保存中占用空间较大。在多级存储设备中磁带也用于离线存储,使用自动设备装载。有些人认为,随着磁盘阵列的应用越来越广泛,磁带的应用会逐渐减少乃至消失。但是,在多级存储设备中,考虑到存储应用的多样性、存储成本、信息的安全性和保密性等因素,磁带在数据备份中的作用越来越重要,它可以在无人操作下自动进行备份,甚至可以在工作状态下自动为数据库建立备份。磁带会继续为数字档案信息的存储提供必不可少的安全保护功能。

  总之,现有的数字介质在数字档案信息存储方面各有优势和不足,在建设存储系统的时候,不应只考虑某个单一的技术,而应从整体需求出发,既要满足成本和存取速度的要求,又要确保数据的安全性。目前,在有些应用中还在架构集中式的多级存储网络,它由存储设备和网络设备组成,多台服务器通过局域网与磁盘阵列、磁带库等存储设备相连,基于客户/服务器方式为数字信息的网络存储提供解决方案。多级存储设备使得数字档案信息存储的层次结构变得清晰,从而建立了一个经济有效的存储构架,各种存储设备和技术可以互补,以便最有效地实现数字档案信息存储的高可靠性和高可用性。


 
上一篇:事业单位档案归档文件整理的三个主要原则
下一篇:切勿让你的档案成为进入事业单位的绊脚石!