(已結束)"> 寧波市紙質檔案數字化規則(征求意見)<font color="#3366ff">(已結束)
 
您的當前位置: 首頁>>公眾參與>>意見征集
寧波市紙質檔案數字化規則(征求意見)(已結束)

發布時間: 2017-09-08      訪問次數:    
 

 

1. 范圍

本規則規定了紙質檔案數字化的主要技術要求。

本規則適用於指導寧波市各級檔案部門紙質檔案的數字化加工及數字化成果的管理。

2. 規范性引用文件

下列件中的條款通過本標准的引用而成為本標准的條款。

GB/T 17235.1-1998信息技術 連續色調靜態圖像的數字壓縮編碼第一部分:要求和指南

GB/T l7235.2-1998信息技術 還續色調靜態圖像的數字壓縮編碼第二部分:一致性測試

GB/T l8894-2004 電子文件歸檔與管理規范

DA/T 18-1999   檔案著錄規則

DA/T 31─2005 紙質檔案數字化技術規范

3. 術語和定義

下列術語和定義適用於本規則。

3.1  數字化digitization

用計算機技術將模擬信號轉換為數字信號的處理過程。

3.2  紙質檔案數字化digitization of paper-based records

採用掃描儀或數碼相機等數碼設備對紙質檔案進行數字化加工,將其轉化為存儲在磁帶、磁盤、光盤等載體上並能被計算機識別的數字圖像或數字文本的處理過程。

3.3  數字圖像digital image

表示實物圖像的整數陣列。一個二維或更高維的採樣並量化的函數,由相同維數的連續圖像產生。在矩陣(或其他)網絡上採樣──連續函數,並在採樣點上將值最小化後的陣列。

3.4  黑白二值圖像 Binary image

隻有黑白兩級灰度的數字圖像。它對應於黑和白的兩種狀態文字稿、線條圖等。

 3.5 連續色調靜態圖像continuous-tone still image

以多於兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態數字圖像。在紙質檔案數字化過程中,通常表現為灰度掃描和彩色掃描兩種模式。

3.6  分辨率resolution

單位長度內圖像包含的點數或像素數,一般用每英寸點數(dpi)表示。

3.7  失真度distortion measure

對檔案進行數字化轉換後,數字圖像與檔案原件在色彩、幾何等方面的偏離程度。

3.8  可懂度intelligibility

數字圖像向人或機器提供信息的能力。

3.9  圖像壓縮image compression

消除圖像冗余或對圖像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。紙質檔案數字化過程中,較常見的有TIFF(G4)、JPEG等壓縮格式。

3.10  標記圖像文件格式 Tagged Image File Format(TIFF)

一種基於標記的無損(不丟失信息)壓縮格式,用於在應用程序之間和計算機平台之間交換文件。主要適用於黑白二值、灰度及彩色模式下的圖像存儲。

3.11 聯合攝影專家組 Joint photographic Experts Group(JPEG)

一種丟失少量信息的壓縮格式,尤其適用於屏幕和打印顯示,支持所有主要的計算機平台和Web瀏覽器。主要適用於灰度以及彩色模式下的圖像存儲。

4.  紙質檔案數字化基本要求

4.1  基本原則

紙質檔案數字化的基本原則是使檔案信息資源准確、方便、快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。

4.2  數字化對象的確定原則

應當對所要進行數字化的對象按照一定的原則和利用方法進行確認,隻有符合一定要求的紙質檔案文獻才能進行數字化。

4.2.1符合國家法律法規的原則

紙質檔案的數字化,必須符合國家檔案開放規定以及有關規定。

4.2.2價值性原則

屬於歸檔范圍且應永久或長期保存的、社會利用價值高的檔案可列入數字化加工的范圍。

4.3  基本環節

紙質檔案數字化的基本環節主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數據挂接、數據驗收、數據備份、成果管理等。

4.4  過程管理

加強紙質檔案數字化各環節的安全保密管理機制,同時建立起完整、規范的紙質檔案數字化各環節登記記錄,確保檔案原件和數字化檔案信息的安全。

   檔案整理

在掃描之前,根據檔案管理情況,按下述步驟對檔案進行適當整理,並視需要作出標識,確保檔案數字化質量。

5.1  目錄數據准備

按照《檔案著錄規則》和寧波市檔案局電子目錄數據庫結構與交換格式有關規定的要求,規范檔案目錄內容。包括確定檔案目錄的著錄項、字段類型、長度和內容要求,並對錯誤或不規范的目錄數據進行修改。

5.2  拆除裝訂

在有裝訂物情況下,影響掃描工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。

5.3  區分掃描件和非掃描件

按要求把同一案卷中的掃描件和非掃描件區分開。普發性文件區分的原則是:無關和重復的文件,以及文件形成過程中產生的各種稿本、參考資料等可以剔除,有正式件的文件可以不掃描定稿。

5.4  頁面修整

破損嚴重、無法直接進行掃描的檔案,應先進行技術修復,折皺不平影響掃描質量的原件應先進行相應處理(壓平或熨平)後再進行掃描。

5.5  檔案整理登記

制作並填寫紙質檔案數字化加工過程交接登記表單,詳細記錄檔案整理後每份文件的起始頁號和頁數。

5.6  裝訂

掃描工作完成後,拆除過裝訂物的檔案應按檔案保管的要求重新裝訂。恢復裝訂時,應注意保持檔案的排列順序不變,案卷不漏頁、不掉頁,裝訂左邊和底邊整齊,不壓字,做到安全、准確、無遺漏。案卷變化情況應在備考表中注明。

   檔案掃描

6.1  掃描方式

6.1.1  根據檔案幅面的大小選擇相應規格的掃描儀或專業掃描儀進行掃描。大幅面檔案可採用專用數碼平台進行掃描或者採用圖像拼接方式處理,或先進行縮微拍攝後再進行數字化轉換。

6.1.2  紙張狀況較差,以及過薄、過軟或超厚的檔案,應採用平板掃描方式﹔紙質照片檔案,應採用平板掃描方式﹔紙張狀況好的檔案可採用高速掃描方式以提高工作效率。

6.2  掃描色彩模式

6.2.1  普通文件、檔案可採用彩色、灰度或黑白二值圖像模式掃描。需永久或長期保存、向檔案館移交的檔案,應採用彩色模式進行掃描。

6.2.2  黑白照片應採用灰度模式掃描,彩色照片應採用RGB全彩模式掃描。

6.2.3  頁面為黑白兩色,並且字跡清晰、不帶插圖的檔案,可採用黑白二值模式進行掃描。

6.2.4  當採用黑白二值圖像模式不能充分反映檔案內容信息時應採用彩色模式進行掃描,包括但不限於以下情況:

──頁面為黑白兩色,但字跡不清晰或插有黑白照片、彩色照片、彩色插圖,以及頁面中有紅頭、印章。

──頁面由於紙質、色澤、印刷或書寫方式等原因致使採用黑白二值圖像掃描後內容無法辨認。

6.3  掃描分辨率

6.3.1  掃描分辨率應大於或等於200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。

6.3.2  需要向檔案館移交的檔案,掃描分辨率應大於或等於300dpi。

6.3.3  紙質照片檔案,照片小於或者等於10英寸,掃描分辨率應不小於600dpi﹔照片大於10英寸,掃描分辨率應不小於300dpi。

6.3.4  圖紙類文件掃描分辨率建議選擇大於或等於300dpi。

6.4  掃描登記

認真填寫紙質檔案數字化轉換過程交接登記表單,登記掃描的頁數,核對每份文件的實際掃描頁數與檔案整理時填寫的文件頁數是否一致,不一致時應注明具體原因和處理方法。

   圖像處理

7.1  圖像數據質量檢驗

7.1.1  對圖像偏斜度、清晰度、失真度等進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理。

7.1.2  由於操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描。

7.1.3  發現文件漏掃時,應及時補掃並正確插入圖像。

7.1.4  發現掃描圖像的排列順序與檔案原件不一致時,應及時進行調整。

7.1.5  認真填寫相關表單,記錄質檢結果和處理意見。

7.2  糾偏

對出現偏斜的圖像應進行糾偏處理,圖像偏度不得大於3度。對方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。

7.3  去污

對圖像頁畫中出現的影響圖像質量的雜質,如黑點、黑線、黑框、黑邊等應進行去污處理。檔案數字化圖像的去污,應遵循在不影響可懂度的前提下展現檔案原貌的原則。

7.4  圖像拼接

對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合並為一個完整的圖像,以保證檔案數字化圖像的整體性。

7.5  裁邊處理

採用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。

8   圖像存儲

8.1  存儲格式

8.1.1  用於代替原件保存和需要移交至檔案館的檔案,採用JPEG格式或多頁TIFF格式存儲。存儲時的壓縮模式的選擇,應以保證畫面質量無損的前提下,盡量減小存儲容量為准則,建議選擇LZW壓縮模式。

8.1.2  用於提供網絡查詢的掃描圖像,也可存儲為PDF 、CEB或其他格式。

8.2  圖像文件的命名

8.2.1  命名原則

每份檔案文件與其圖像文件通過檔號的一致性和唯一性建立起一一對應的關聯關系,為實現檔案目錄數據庫與圖像文件的批量挂接提供條件。  

8.2.2  命名格式

8.2.2.1  命名格式(一)

對立卷改革之前的紙質文書檔案進行掃描,TIFF圖像文件命名由全宗號、目錄號、案卷號、頁號4部分組成,各字段間用“-”連接,即以xxxx-xxx-xxx-xxx.tif表示﹔JPEG圖像文件命名由全宗號、目錄號、案卷號、頁號、序號等5部分組成,各字段間用“-”連接,即以xxxx-xxx-xxx-xxx-xxx.jpg表示。數據結構見下表:

字段名稱

字段類型

字段長度

字段值

全宗號

字符

4

 

目錄號

字符

3

 

案卷號

字符

3

 

頁號

字符

3

 

序號

字符

3

 

全宗號用4位代碼標識,其中第1位用漢語拼音字母標識全宗屬性,後3位用阿拉伯數字標識某一屬類全宗的順序號。如“Q001”表示清代1號全宗。

目錄號以3位阿拉伯數字標注,如“001”表示。

案卷號以3位阿拉伯數字標注,如“001”表示。

頁號用3位阿拉伯數字標識,如“002”表示第2頁。

序號是JPEG格式存檔的頁號,用3位阿拉伯數字標識,如“002”表示此份文件的第2頁。

8.2.2.2  命名格式(二)

立卷改革後形成的紙質檔案的掃描,TIFF圖像文件命名由全宗號、年度、保管期限、組織機構或問題、檔案室(館)編件號等5部分組成,各字段間用“-”連接,即以xxxx -xxxx-xxxx-xx-xxxx.tif表示﹔JPEG圖像文件命名由全宗號、年度、保管期限、組織機構或問題、檔案室(館)編件號、序號等6部分組成,各字段間用“-”連接,即以xxxx-xxxx-xxxx-xx-xxxx-xxx.jpg表示,數據結構見下表:

字段名稱

字段類型

字段長度

字段值

全宗號

字符

4

 

年度

字符

4

 

保管期限

字符

4

10年、30年、永久

組織機構或問題

字符

2

 

檔案室編件號

字符

4

 

序號

字符

3

 

全宗號用4位代碼標識,其中第1位用漢語拼音字母標識全宗屬性,後3位用阿拉伯數字標識某一屬類全宗的順序號。如“J002”表示建國後2號全宗。

年度以4位阿拉伯數字標注公元紀年,如“2012”表示2012年。

保管期限用“10年”、“30年”、“永久”標識。

組織機構或問題是指作為分類方案的組織機構或問題名稱的規范化簡稱。用兩位字母標識,可以用簡稱中的漢語拼音第一個字母表示,其中“ZZ”表示無該項內容。

檔案室編件號是歸檔文件的流水號,用4位阿拉伯數字標識,如“0002”表示第2個文件。

序號是單份歸檔文件的頁號,用3位阿拉伯數字標識,如“002”表示單份文件的第2頁。

8.2.2.3  各單位列入進館范圍的檔案,因特殊情況不能採用上述命名格式的,應與同級國家檔案館協商處理。

8.3  存儲結構

移交載體內數字化成果的存儲結構參照《電子檔案移交和接收辦法》有關電子檔案的存儲結構執行。

   目錄建庫

9.1  數據格式選擇

目錄建庫應選擇通用的數據格式,所選定的數據格式應能直接或間接通過XML文檔進行數據交換。向檔案館移交時應轉換為DBF或XML格式,也可採用檔案館認可的其他格式。

9.2  檔案著錄

按照《檔案著錄規則》和寧波市檔案局電子目錄數據庫結構與交換格式有關規定的要求進行著錄,建立檔案目錄數據庫。

9.3  目錄數據質量檢查

核對著錄項目是否完整、著錄內容是否規范、准確,發現不合格的數據應要求進行修改或重錄。

10   數據挂接

10.1  匯總挂接

檔案數字化轉換過程中形成的目錄數據庫與圖像數據庫,經質量檢驗合格後,通過在線或離線方式加載到數據服務器。通過編制程序或借助相應軟件等方式實現目錄數據對相關聯的數字圖像的批量、快速挂接。

10.2  交接登記

認真填寫紙質檔案數字化轉換過程交接登記表單,記錄數據關聯後的頁數,核對每一份文件關聯後的頁數與檔案整理、掃描時填寫的頁數是否一致,不一致時應注明具體原因和處理辦法。

11   數據驗收

11.1  驗收方式  

數據驗收主要採取抽檢的方式,有條件的應通過編制程序或借用相應軟件等方式擴大檢測的覆蓋面,提高數據檢測的效率和質量。

11.2  目錄數據驗收

以全宗的一個或多個目錄為單元,隨機抽查5%的數據,對條目數量及其著錄項目內容的准確性進行逐條檢查。其中,檔號的合格率要求達到100%,其他項目抽檢合格率要求達到95%以上(含95%)。合格率=抽檢合格文件數/抽檢文件總數×100%。

11.3  圖像數據驗收

以全宗的一個或多個目錄為單位,隨機抽查5%的條目數據相對應的圖像數據,對圖像數量及其圖像內容的准確性進行檢查。圖像應符合本規則中所規定的分辨率、文件格式及色彩模式。圖像文件的命名必須與條目檔號相一致,一致率要求達到100%﹔掃描圖像完整性要求100%正確,完整性包括不准缺頁、漏頁。圖像的傾斜度、清晰度、整潔度等技術指標,抽檢合格率要求達到95%以上(含95%)。合格率=抽檢合格文件數/抽檢文件總數×100%。

11.4  驗收登記

驗收後認真填寫紙質檔案數字化驗收登記表單,詳細記錄數據驗收情況及驗收結論。

12    數據備份

12.1  備份范圍

經驗收合格的完整數據應及時進行備份。

12.2  備份方式

為保證數據安全,備份載體的選擇應多樣化,可採用在線、離線相結合的方式實現多套備份,並注意異地保存。

12.2.1  在線備份

目錄和掃描檔案一般都應採用磁盤、磁帶庫等載體實行在線存儲備份,保證檔案的利用與安全。

12.2.2  離線備份

長久保存的檔案,應採用離線方式進行刻盤備份或者磁帶備份。備份載體可選用CD\DVD\BD-R光盤或者數據磁帶。目錄及說明應與其相應的掃描檔案保存在同一光盤上。

12.3  數據檢驗

備份數據也應進行檢驗。備份數據的檢驗內容主要包括備份數據能否打開、數據信息是否完整、文件數量是否准確等。

12.4  備份標簽

數據備份後應在相應的備份介質上做好標簽,以便查找和管理。

12.5  備份登記

填寫紙質檔案數字化備份管理登記表單。

12.6  移交進館

列入進館范圍的紙質檔案,其數字化成果按照《電子檔案移交與接收辦法》,向同級國家檔案館移交。未到進館年限的,應按照《浙江省檔案登記備份管理辦法》有關規定,向同級國家檔案館登記備份。

13    數字化成果管理

13.1  應加強對紙質檔案數字化成果的管理,確保其准確、完整、可用和安全。

13.2  紙質檔案數字化成果提供網上檢索利用時,應有制作單位的電子標識,並根據具體情況分別採用可下載或不可下載的數據格式。

13.3  涉密紙質檔案數字化加工及成果管理,應符合國家、省、市保密工作的相關規定。

Copyright © 2000-2017 nbdaj.gov.cn All Rights Reserved
建議使用IE6及以上版本瀏覽器,1024*768分辨率
寧波檔案局主辦 寧波檔案局技術處承辦
浙ICP備05066881號