公務(wù)員期刊網(wǎng) 論文中心 正文

電子文件長期保存中格式管理探究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了電子文件長期保存中格式管理探究范文,希望能給你帶來靈感和參考,敬請閱讀。

電子文件長期保存中格式管理探究

引言

在現(xiàn)代信息技術(shù)迅猛發(fā)展的背景下,傳統(tǒng)紙質(zhì)檔案逐漸被電子檔案所取代,隨著電子檔案的日益增多,其長期保存問題也就被提上了研究日程。但在實際的檔案管理工作中,電子檔案的存儲格式經(jīng)常出現(xiàn)混亂的現(xiàn)象,導(dǎo)致使用者無法有效讀取這些檔案。毫無疑問,電子檔案的存儲格式將直接決定其是否能夠得到長期的保存,是否能夠?qū)ζ溥M(jìn)行長期有效的管理。

一、電子文件長期保存過程中的格式管理概述

1.電子文件長期保存及格式管理概念辨析

電子文件是國家機(jī)構(gòu)、社會組織或個人在履行其法定職責(zé)或處理事務(wù)過程中,通過計算機(jī)等電子設(shè)備形成、辦理、傳輸和存儲的數(shù)字格式的各種信息記錄。文件格式是指電子文件在計算機(jī)等電子設(shè)備中組織和存儲的編碼方式。電子文件讀取和編輯操作需要依靠計算機(jī)軟硬件環(huán)境來完成,其存儲結(jié)果表現(xiàn)為特定類型的格式文件,一般是以“.后綴名”的形式來體現(xiàn)的。目前針對不同類型的電子文件,按其格式劃分,有文本文件、圖像文件、音頻文件、視頻文件、電子郵件文件等。常見格式有XML、TXT、PDF、OFD、JPEG、MPEG等。電子文件長期保存是指檔案館或其他文件保管單位、組織機(jī)構(gòu)通過采取可靠的、科學(xué)合理的方式長期維護(hù)電子文件真實、完整、有效的行為。其中關(guān)于“長期”的具體時限性,根據(jù)ISO14721:2003的規(guī)定,慮及技術(shù)變化(包括支持新載體、新數(shù)據(jù)格式)和用戶群體變化對典藏信息影響的足夠長的時間段,這個時間段延伸到無限未來。格式管理是指以電子文件的各種存儲格式為對象,對其進(jìn)行類別登記、監(jiān)測、識別、轉(zhuǎn)換和日常穩(wěn)健性監(jiān)測。[1]以保障相應(yīng)格式電子文件的長期可讀、可解析、可理解。

2.格式管理對于電子文件長期保存的重要性

隨著計算機(jī)的普及和辦公信息化的推廣,日常生活與工作中產(chǎn)生的電子文件體量越來越龐大,而且其中許多是原生性的電子文件,并無紙質(zhì)版本作為備份保存。因此不管是作為業(yè)務(wù)留痕的需要還是信息保存的必要,都使得電子文件的長期保存成為數(shù)字時代檔案工作面臨的一項重要挑戰(zhàn),而電子文件的存儲格式是影響電子文件長期保存的重要因素之一。在上文中已經(jīng)了解到,電子文件大多是以某種編碼形式存在的,其讀取要依靠計算機(jī)軟硬件環(huán)境。而在目前已知的技術(shù)更新頻率下,技術(shù)淘汰給電子文件帶來的威脅遠(yuǎn)遠(yuǎn)大于存儲載體的腐壞給其帶來的挑戰(zhàn)。也就是說,一般情況下電子文件存儲載體的壽命是大于讀取它的軟硬件生命周期的,與延長存儲載體的壽命相比,延長讀取電子文件的軟硬件技術(shù)壽命顯得更為重要。這就使得格式管理在電子文件長期保存過程中尤為重要,只有首先保障文件格式的穩(wěn)健,才能考慮電子文件的長久利用和內(nèi)容管理等進(jìn)一步提升的問題。

3.基于文件生命周期思想的電子文件長期保存格式管理

將傳統(tǒng)的文件生命周期理論思想應(yīng)用到電子文件的長期保存格式管理工作中,就表現(xiàn)為針對電子文件隨著在不同階段中所屬系統(tǒng)形態(tài)、功能定位、使用情景等方面的差異,檔案館應(yīng)當(dāng)相應(yīng)地將文件格式轉(zhuǎn)換為最適合的格式類型。在文件的生成和業(yè)務(wù)流通階段,電子文件的主要功能是支持單位或組織機(jī)構(gòu)的業(yè)務(wù)活動,格式方面的需求是易于傳遞和讀取,因此應(yīng)當(dāng)選擇適用性強(qiáng)、普及度高的文件格式進(jìn)行存儲,以文本文件為例,最適合選擇DOC或PDF格式。在文件的歸檔、存儲階段,電子文件的主要功能是保存信息、業(yè)務(wù)留痕,其管理目的是為了保障文件的長期保存和長久可用,因此應(yīng)當(dāng)選擇高質(zhì)量的存儲格式以盡可能多地保全文件內(nèi)容和背景數(shù)據(jù)。而到了文件的提供利用階段,則需要輸出相對低質(zhì)量的文件格式,僅需要滿足文件可讀可用即可。如音頻文件在存儲時使用WAV等格式存儲,目的是在輸出時避免用戶下載使用RM等流媒體格式進(jìn)行網(wǎng)絡(luò)播放。這些都是不同階段電子檔案功能要求導(dǎo)致的變化。反之,為適應(yīng)不同階段對格式的質(zhì)量或管理要求,在某些可控的情形下,就可以在電子檔案的生成環(huán)節(jié)提前進(jìn)行格式準(zhǔn)備。比較典型的包括在數(shù)字化電子檔案生成階段進(jìn)行多版本、多格式輸出。

二、電子文件長期保存過程中格式管理流程分析

就我國目前的工作實際來看,檔案館對于電子文件的管理實際上更多的是后端控制。雖然我們提倡在電子文件的管理中注重前端控制,以提高歸檔電子文件的質(zhì)量,方便后續(xù)管理工作的開展,但在實際工作中,由于形成單位數(shù)量眾多,且業(yè)務(wù)規(guī)范也未達(dá)到完全標(biāo)準(zhǔn)化,工作人員業(yè)務(wù)水平參差不齊、檔案意識薄弱,因此很難保證生成電子文件的質(zhì)量和規(guī)范。具體到電子文件的格式管理上,雖然已有相關(guān)國際、國家標(biāo)準(zhǔn)對歸檔文件格式進(jìn)行了規(guī)定,但就目前的狀況來看,我國檔案館對于入館文件的格式把控還是比較寬松的。格式管理工作一般都是在電子文件提交進(jìn)館后開展。結(jié)合文件生命周期思想,從電子文件的使用情景和所處階段出發(fā),相應(yīng)的格式管理工作具體包括以下流程。

1.接收進(jìn)館階段的格式規(guī)范與驗證

電子文件“收”的階段,檔案館主要的格式管理工作是對各單位提交到檔案館的文件進(jìn)行格式識別、驗證與登記。目前各國檔案館都已頒布了歸檔電子文件格式的要求及標(biāo)準(zhǔn),我國也頒布了相應(yīng)推薦標(biāo)準(zhǔn),以規(guī)范文件格式,保障進(jìn)館電子文件的質(zhì)量,為電子文件的可長期保存打下堅實基礎(chǔ)。從標(biāo)準(zhǔn)內(nèi)容分析來看,在電子文件長期保存工作中,各國都一致地傾向于選擇格式開放、軟件依賴程度低、結(jié)構(gòu)化程度高的文件格式。但由于電子文件類型繁多,因此格式也復(fù)雜多變,在提交進(jìn)館后,檔案館還需借助于數(shù)字格式登記系統(tǒng)對電子文件的格式進(jìn)行一一把控和管理。格式登記系統(tǒng)可以分別從應(yīng)用環(huán)境和生命周期兩個視角對電子文件的具體參數(shù)和各階段變化關(guān)系進(jìn)行分析與提取,方便其長久理解與持久維護(hù)。在檔案館的歸檔電子文件長期保存過程中,建立格式登記系統(tǒng)為檔案館監(jiān)測文件格式、選擇適用于長期保存的文件格式,以及電子文件日常維護(hù)和監(jiān)測,輸出合適的格式進(jìn)行提供利用都提供了極大的便利和安全保障。

2.存儲與管理階段的格式轉(zhuǎn)化

在電子文件“管”和“存”的階段,其格式管理工作主要是選擇合適的格式,以保障長期甚至永久保存過程中,電子文件的可讀、可用。但當(dāng)確定滿足長期保存需求的格式后,檔案館還需要使用格式轉(zhuǎn)換技術(shù)來將電子文件轉(zhuǎn)換為適合長期保存的文件格式。由于歸檔電子文件格式不符合標(biāo)準(zhǔn)、不適宜長期保存等情況較為普遍,因此格式轉(zhuǎn)換在實際檔案館電子文件長期保存的格式管理工作中較為常用。目前電子文件的轉(zhuǎn)換方式主要有以下兩種:一種是直接轉(zhuǎn)換方式,即由源文件格式直接轉(zhuǎn)換到目標(biāo)文件格式。另一種是間接轉(zhuǎn)換方式,即先由源文件格式轉(zhuǎn)換到某種中間文件格式,再由中間文件格式轉(zhuǎn)換到目標(biāo)文件格式。[2]

3.提供利用階段的輸出格式選擇

在電子文件“用”的階段,其格式管理工作主要是選擇合適的格式以最小的體積和最優(yōu)的內(nèi)容表達(dá)提供給用戶進(jìn)行閱覽和利用。以文本文件的輸出格式選擇為例:XML格式是理想的用于長期保存文本文件格式,其結(jié)構(gòu)化程度非常高,且可擴(kuò)展,讀取不依賴特定軟件,但對于一般用戶來說,其高度結(jié)構(gòu)化的標(biāo)記語言識讀起來存在一定困難,更適合用于機(jī)讀或文件間的互操作。而DOC雖然是微軟辦公軟件的特有格式,屬于私有格式,但用戶友好度高,識讀較為簡單,基本屬于“所見即所得”的狀態(tài),且支持編輯操作,相比XML更適合提供給用戶進(jìn)行閱覽和利用。因此,在格式管理時,需要從電子文件的使用情景和所處階段出發(fā),選取相應(yīng)的最適宜格式進(jìn)行選擇輸出。

三、電子文件長期保存過程中格式管理的策略選擇

1.建立配套標(biāo)準(zhǔn)體系做好前端控制

前端控制是確保各機(jī)關(guān)電子文件真實可靠、完整歸檔、安全利用和長期可讀的有效策略。由于電子文件具有易流失、易更改等特點,在實際管理過程中較紙質(zhì)檔案難度更大。因此更應(yīng)注重文件形成過程中的管理和干預(yù),來保障電子文件的真實性、可靠性、完整性和可讀性。最有效的方式就是建立與現(xiàn)有電子文件管理標(biāo)準(zhǔn)配套的電子文件歸檔格式標(biāo)準(zhǔn),組成科學(xué)、有效的標(biāo)準(zhǔn)體系,來做好電子文件長期保存的前端控制工作。電子文件長期保存的格式直接關(guān)系著電子文件的長期可讀性和可用性,我國可借鑒歐美電子文件的格式標(biāo)準(zhǔn),進(jìn)一步在標(biāo)準(zhǔn)的系統(tǒng)性、完整性和適用性等方面加以完善,促進(jìn)標(biāo)準(zhǔn)制定主體的多元化,并適當(dāng)引進(jìn)和采用相關(guān)的國際標(biāo)準(zhǔn),參考和借鑒發(fā)達(dá)國家的國家標(biāo)準(zhǔn)。逐步建立起電子文件長期保存標(biāo)準(zhǔn)體系,保障電子文件長期保存這一工作的科學(xué)開展和順利實施。

2.建設(shè)格式登記系統(tǒng)做好格式管理工作

一個好的格式登記系統(tǒng)可以幫助我們理解電子文件的數(shù)字對象結(jié)構(gòu)和內(nèi)容,可以指導(dǎo)確定特定電子文件的遷移路徑。對于電子文件的長期保存格式管理具有重要的意義。因此要想科學(xué)、高效地開展電子文件長期保存的格式管理工作必須先做好建設(shè)格式登記系統(tǒng)。將文件的格式信息、數(shù)據(jù)信息納入日常監(jiān)測和維護(hù)中,以保障電子文件的安全性、可靠性,是電子文件長期保存的有效和必要手段。

參考文獻(xiàn):

[1]梁娜,張曉林.數(shù)字文件格式登記系統(tǒng)[J].圖書情報工作,2005(11):82-86.

[2]劉越男,祁天嬌.我國省級、副省級檔案館電子文件接收及管理情況的追蹤調(diào)查[J].檔案學(xué)訊,2014(06):10-15.

作者:王玉敏 單位:社會科學(xué)文獻(xiàn)出版社