解讀《錄音錄像類電子檔案元數(shù)據(jù)方案》DA/T 63—2017
根據(jù)檔案館(室)錄音錄像類電子檔案管理要求,經(jīng)國家檔案局批準,江西省檔案局于2011年著手開展錄音錄像類電子檔案元數(shù)據(jù)標準化研究工作,2014年開始文本編制工作,2017年8月最終成果《錄音錄像類電子檔案元數(shù)據(jù)方案》(DA/T 63—2017)正式發(fā)布,并于2018年1月1日起實施。
編制背景
在電子檔案生命周期全程,依托應(yīng)用系統(tǒng)持續(xù)捕獲、著錄元數(shù)據(jù)是保證電子檔案真實性、可靠性、完整性和可用性(以下簡稱“四性”)的重要措施之一。為此,國家檔案局先后組織編制并發(fā)布了《文書類電子文件元數(shù)據(jù)方案》(DA/T 46—2009)、《照片類電子檔案元數(shù)據(jù)方案》(DA/T 54—2014)等多項元數(shù)據(jù)標準。由于錄音錄像類電子檔案物理結(jié)構(gòu)復(fù)雜、著錄與管理要求不同等自身特性,上述檔案行業(yè)元數(shù)據(jù)標準均不能完全適應(yīng)其管理要求。比如,數(shù)字音視頻編碼標準有MPEG-X、H.2XX等10余種,一種編碼標準下具體技術(shù)參數(shù)亦可能不同,如色彩空間、視頻比特率、色度采樣率等。任何格式的計算機文件的寫入、存儲、讀取和呈現(xiàn)都是依據(jù)編碼標準進行編碼和解碼的過程。在電子檔案體外采用結(jié)構(gòu)元數(shù)據(jù)記錄編碼標準及關(guān)鍵技術(shù)參數(shù),就是保持錄音錄像類電子檔案解碼播放、格式轉(zhuǎn)換等功能,以此為電子檔案的長期可讀和可用提供保障。錄音錄像類電子檔案獲取方式還包括網(wǎng)上下載、購買、收錄等多種途徑,如果涉及攝錄者個人,還需要進行知識產(chǎn)權(quán)管理。此外,錄音錄像類電子檔案的可讀性要依靠對主題內(nèi)容、責(zé)任者、業(yè)務(wù)背景等進行較為全面的著錄方可實現(xiàn),這些都需要通過元數(shù)據(jù)給予記錄。
根據(jù)上述情況,有必要編制專門的元數(shù)據(jù)標準用于規(guī)范、指導(dǎo)錄音錄像類電子檔案元數(shù)據(jù)的捕獲、著錄等管理活動。
編制依據(jù)與適用范圍
1
編制依據(jù)
編制過程中,該標準主要依據(jù)《標準化工作導(dǎo)則 第1部分:標準的結(jié)構(gòu)和編寫原則》(GB/T 1.1—2009)設(shè)置框架及文本內(nèi)容,依據(jù)《電子檔案管理基本術(shù)語》(DA/T 58—2014)等相關(guān)標準定義術(shù)語。同時,依據(jù)或參照《信息與文獻 文件元數(shù)據(jù)管理 第2部分 概念與實施》(ISO23081—2009)、《檔號編制規(guī)則》(DA/T 13—1994)、《檔案著錄規(guī)則》(DA/T 18—1999)等標準,并結(jié)合我國檔案管理實際設(shè)置錄音錄像類電子檔案元數(shù)據(jù)集框架及其具體元數(shù)據(jù)。
2
適用范圍
該標準主要適用于各級各類檔案館及其立檔單位,可用來描述、管理以卷、件為單元的錄音錄像類電子檔案。基于該標準對各個元數(shù)據(jù)應(yīng)用層次屬性的描述可組合形成附錄B所列的案卷級、文件級元數(shù)據(jù)集,將其實現(xiàn)于相關(guān)應(yīng)用系統(tǒng)后即可支持檔案館(室)開展案卷級、文件級錄音錄像類電子檔案著錄工作,實現(xiàn)元數(shù)據(jù)全自動和半自動化捕獲、著錄,并為錄音錄像類電子文件歸檔與電子檔案管理提供支撐。
為實現(xiàn)錄音錄像檔案數(shù)字副本的集成管理和長期保存,該標準所設(shè)元數(shù)據(jù)均適用于錄音錄像檔案數(shù)字副本,其中,數(shù)字化責(zé)任信息、數(shù)字化時間、原始載體、生成方式等元數(shù)據(jù)具有明確的指向性,視頻參數(shù)、音頻參數(shù)與《錄音錄像檔案數(shù)字化規(guī)范》(DA/T 62—2017)第9章所列技術(shù)參數(shù)完全兼容。因此,錄音錄像檔案數(shù)字副本及其元數(shù)據(jù)管理可參照該標準執(zhí)行。
主要內(nèi)容
1
標準結(jié)構(gòu)
該標準共9部分,第1~4章分別為范圍、規(guī)范性引用文件、術(shù)語和定義、元數(shù)據(jù)實體及元數(shù)據(jù)描述方法,第5~8章則分別對元數(shù)據(jù)集的4大類元數(shù)據(jù)作出逐一描述,附錄部分給出了5個實用性工具,均為資料性附錄。元數(shù)據(jù)集共計96個元數(shù)據(jù),其中,必選元數(shù)據(jù)18個,可選元數(shù)據(jù)45個,條件選元數(shù)據(jù)33個,覆蓋了錄音錄像類電子檔案全生命周期。元數(shù)據(jù)捕獲方式主要有全自動、半自動和手工著錄3種,有12個容器型元數(shù)據(jù)無需著錄,47個元數(shù)據(jù)應(yīng)由相關(guān)應(yīng)用系統(tǒng)在不同業(yè)務(wù)節(jié)點和時間點全自動捕獲,33個元數(shù)據(jù)可以半自動方式捕獲,只有題名、責(zé)任者、攝錄者、附注4個元數(shù)據(jù)需手工著錄,最大限度地實現(xiàn)了元數(shù)據(jù)標準化與著錄自動化。
2
元數(shù)據(jù)集的一體化設(shè)置
數(shù)字音視頻文件結(jié)構(gòu)示意圖
錄音錄像類電子檔案是指錄音類電子檔案和錄像類電子檔案。經(jīng)對比研究,二者的元數(shù)據(jù)存在較大范圍的重合,不同之處在于責(zé)任者的稱呼,錄像類電子檔案技術(shù)參數(shù)涉及視頻編碼部分。在最簡單的數(shù)字音視頻文件結(jié)構(gòu)中,沿著時間軸的伸展,至少由一個音頻編碼數(shù)據(jù)流和與其并行的一個視頻編碼數(shù)據(jù)流組成,比數(shù)字音頻文件多了視頻編碼數(shù)據(jù)(如圖所示)。為此,該標準提供了錄音錄像類電子檔案一體化元數(shù)據(jù)集,通過適用門類屬性和攝錄者元數(shù)據(jù)的設(shè)置予以區(qū)分。
3
元數(shù)據(jù)集構(gòu)成及其作用
錄音錄像類電子檔案元數(shù)據(jù)集由檔案實體、業(yè)務(wù)實體、機構(gòu)人員實體和授權(quán)實體元數(shù)據(jù)4個部分組成。檔案實體元數(shù)據(jù)用于描述錄音錄像類電子檔案本身,為必選元數(shù)據(jù)實體,共75個元數(shù)據(jù),涵蓋了電子檔案標識、內(nèi)容、結(jié)構(gòu)、背景和管理權(quán)限等多個方面。檔號、題名、責(zé)任者、攝錄者、時間、保管期限等18個必選元數(shù)據(jù)都位列其中;業(yè)務(wù)實體、機構(gòu)人員實體和授權(quán)實體元數(shù)據(jù)為管理過程元數(shù)據(jù),均為可選元數(shù)據(jù)實體,該標準推薦采用多元數(shù)據(jù)實體模式,此時,業(yè)務(wù)實體、機構(gòu)人員實體為必選元數(shù)據(jù)實體。將業(yè)務(wù)實體的管理活動元數(shù)據(jù)與另一個或兩個元數(shù)據(jù)實體組配后即可描述一系列管理活動,使后人能夠追溯任一電子檔案管理過程,并與檔號、原始載體、捕獲設(shè)備等元數(shù)據(jù)共同解答“它從哪里來”等重要問題,為錄音錄像類電子檔案的真實性和可靠性提供證據(jù)鏈。
4
元數(shù)據(jù)描述
該標準第4章第4節(jié)規(guī)定了元數(shù)據(jù)描述方法,描述內(nèi)容包括23個屬性。除對注冊版本、注冊機構(gòu)、字符集、語言4個共同屬性進行集中描述外,還需從編號、中文名稱、英文名稱、定義等19個屬性對每個元數(shù)據(jù)進行逐一描述。
下面只對約束性等4個元數(shù)據(jù)屬性作出進一步說明:
約束性屬性有3個值域,包括必選、條件選和可選。該標準明確的18個必選元數(shù)據(jù)是最小元數(shù)據(jù)集,同時適用于檔案室和檔案館。條件選有2種情況:其一,當(dāng)該元數(shù)據(jù)所屬實體或其上位元數(shù)據(jù)被選用時,該元數(shù)據(jù)必選,如業(yè)務(wù)實體的管理活動元數(shù)據(jù)和檔案實體的主題、來源、存儲、原始載體元數(shù)據(jù)的子元數(shù)據(jù);其二,格式名稱、格式版本元數(shù)據(jù)的約束性為條件選,當(dāng)其上位復(fù)合型元數(shù)據(jù)格式信息僅作為容器型元數(shù)據(jù)時,這兩個元數(shù)據(jù)必選。
可重復(fù)性屬性用于說明該元數(shù)據(jù)或元數(shù)據(jù)組是否可以循環(huán)著錄新的元數(shù)據(jù)值。不可重復(fù)元數(shù)據(jù)僅記錄最后一次著錄信息。可重復(fù)元數(shù)據(jù)有主題、捕獲設(shè)備、計算機文件大小等11個(組)元數(shù)據(jù)。主題元數(shù)據(jù)用于一件錄音錄像電子檔案的多個片斷內(nèi)容的深度著錄,比如,描述某次重大活動的各項議程信息。其他可重復(fù)元數(shù)據(jù)則可以反映錄音錄像類電子檔案形成、變化或管理過程,如再次執(zhí)行格式轉(zhuǎn)換操作,則電子檔案編碼標準、計算機文件格式等必然變化,應(yīng)通過相互關(guān)聯(lián)的元數(shù)據(jù)捕獲、著錄新的元數(shù)據(jù)值。
信息來源屬性從捕獲節(jié)點和捕獲方式2個緊密關(guān)聯(lián)的方面對元數(shù)據(jù)進行描述。捕獲節(jié)點主要有登記、掛接、手工著錄、觸發(fā)或完成管理行為等業(yè)務(wù)節(jié)點。捕獲方式主要有5種:從操作系統(tǒng)和應(yīng)用系統(tǒng)參數(shù)自動捕獲、從電子檔案內(nèi)部編碼數(shù)據(jù)中自動提取、基于應(yīng)用系統(tǒng)數(shù)據(jù)字典半自動捕獲、由外部數(shù)據(jù)導(dǎo)入以及手工著錄。
著錄說明屬性則明確了復(fù)合型和簡單型元數(shù)據(jù)值著錄的規(guī)范性要求,并提供了具體的著錄示例,附錄D、附錄E分別提供了整體著錄實例,為標準實施提供具體參考。
元數(shù)據(jù)集的實施應(yīng)用
該標準推薦全面采用所設(shè)元數(shù)據(jù)集,或由省級檔案行政管理部門統(tǒng)一編制錄音錄像類電子檔案元數(shù)據(jù)集及其XMLSchema,統(tǒng)一實施于相關(guān)應(yīng)用系統(tǒng)。編制本地區(qū)元數(shù)據(jù)集時,需考慮區(qū)域性電子檔案全程管理、集成管理和異構(gòu)應(yīng)用系統(tǒng)間的數(shù)據(jù)共享、交換等因素,有助于優(yōu)化應(yīng)用系統(tǒng)功能設(shè)計、開發(fā)和運維升級;本地區(qū)檔案館(室)需要管理錄音錄像檔案數(shù)字副本時,應(yīng)將數(shù)字化責(zé)任信息等元數(shù)據(jù)一并納入元數(shù)據(jù)集,以便實現(xiàn)二者的集成管理;使用商業(yè)化媒資管理系統(tǒng)的檔案館(室),應(yīng)要求中標供應(yīng)商完成系統(tǒng)功能對標工作。
在技術(shù)層面,任何門類電子檔案元數(shù)據(jù)集的實施應(yīng)用都是通過嵌入相關(guān)應(yīng)用系統(tǒng)而實現(xiàn)的,錄音錄像類電子檔案元數(shù)據(jù)集也無例外。這個“嵌入”包含數(shù)據(jù)庫與一系列管理功能的設(shè)計與開發(fā)。因此,在實施元數(shù)據(jù)集之前,檔案局(館)和應(yīng)用軟件開發(fā)商等相關(guān)責(zé)任人要全面讀懂每個元數(shù)據(jù)的23個屬性,在此基礎(chǔ)上方能編制本地區(qū)錄音錄像類電子檔案元數(shù)據(jù)集,開展相關(guān)應(yīng)用系統(tǒng)功能需求分析、采購需求撰寫、軟件設(shè)計開發(fā)等工作。
轉(zhuǎn)自:蘭臺之家