在进行档案数字化扫描工作时,我们应当注意扫描设备软件的选择,扫描参数的设置、分辨率、亮度,这些因素都会对档案的扫描质量造成影响。档案数字化扫描有以下几个要点:
扫描范围的确定
开展档案数字化工作前,首先要确定要进行档案数字化的范围。
扫描设备及软件的选择
纸质档案因幅面大小、纸张的厚薄等各不相同,故在扫描时应根据纸质的特点选择合适的扫描设备及软件。同时需要注意的问题有:一是大幅面分块扫描时要保证每一块都有一定距离的重合部分;二是将这些数据块单独存放在文件夹中做统一命名;三是分块扫描的图像属性要一致。
扫描参数的选择
(一)分辨率
原则上以字迹和纸张质量来确定分辨率的参数,而不能因为讲求速度而完全执行统一的技术条件和标准。一般文件分辨率为300dpi,而对于较为特殊、字迹模糊不清的档案文件要采用较大的分辨率。档案文件的文字材料和字体各不相同,对扫描参数的选择就有很大的差异性,但原则上只要把握住图像清晰可读,能满足浏览查阅需要和用户提出图像输出的需求即可。
(二)亮度
在设置亮度值是,比率一般在5—95之间。如果纸张的颜色深,高光点应适当提高,最高不超过95点;如果纸张颜色浅,字迹颜色浅、模糊、高光点应适当降低,但最低不低于60点。
(三)对比度和饱和度
在扫描图像文件时,利用扫描软件的层次、偏色、专色、色调、饱和度曲线、色调曲线等工具调整图像的对比度和饱和度,校正图像的色调效果,增大以上曲线值可以使模糊、边缘不清、字迹颜色浅的电子图像字迹清晰,对比强烈。
(四)色彩模式
一般对文字文件选用黑白色彩,对图片选用rgb色彩或256色。
(五)图像模式
根据扫描文件的特点和清晰度要求,可采用编辑文字的模式,也可采用彩图模式,像黑白图画、彩色图画等类型。
扫描文件的存储
存储格式
文本文件存储主要有DOC、RIF、HTML、DOT(MS文档模板)和TXT等5种格式。其中,前两者是最常见的存储格式,后三者不适用于文本文件的调阅和规范化处理,因而一般情况下不采用。图像存储常用的格式有TIFF与JPEG。前者图像不损失,占用磁盘空间小,但在数据转移中会出现不同程度的损失。因此,在扫描中坚持正确的工作方法和标准,及时对数据进行质检,确保扫描文件的质量。