?

面向數字人文的清東陵文獻典籍數字化建設策略

2023-04-02 15:36孫會清李赫張霞王琛
關鍵詞:典籍古籍數字化

孫會清,李赫,張霞,王琛

(1.華北理工大學 社會科學研究院,河北 唐山 063210;2.華北理工大學 圖書館,河北 唐山 063210;3.華北理工大學冀唐學院,河北 唐山 063210)

文化遺產是傳統文化的重要組成部分之一,具有稀缺性、脆弱性和不可再生性等特點。文獻典籍作為文化遺產的重要組成部分,不僅為專家學者從事文化遺產研究提供第一手珍貴和原始的參考資料,也為文化遺產的建筑物和文物的保護、復原和重建研究提供相對可靠的依據和重要的實踐基礎[1]。因此,文獻典籍的收集和整理是對文化遺產進行保護、開發和利用研究的基礎和起點。文獻典籍與其他文物類型一樣,其數字化建設能夠有效解決保護與利用之間的矛盾。在廣義上和本質上文獻典籍數字化也屬于文獻整理的一種方式,并且是未來文獻整理的發展方向。

清東陵于2000年被列入世界文化遺產名錄,是我國現存規模最宏大、體系最完整的封建帝王陵寢建筑群,蘊含了極高的歷史價值、藝術價值和科學價值。深入挖掘世界文化遺產清東陵的文化價值,促進文化遺產的高質量供給,對弘揚和發展中華優秀傳統文化具有重要的意義。清東陵文獻典籍的收集、整理和組織等文獻體系建設是清東陵文化研究的基礎保障性因素。作為世界級文化遺產,與清東陵文化研究有關的文獻典籍不僅遺存數量和類型眾多,而且被不同機構收藏,或者以文本片段、圖像等形式散存于諸多類型的文獻典籍當中,目前還未形成系統性的專題研究成果和體系,清東陵文獻典籍的數字化建設也存在著空白,亟待進行專題性研究。針對以上現實問題,依據保護和利用并重的原則,按照我國文獻數字化建設的相關國家政策、規范和標準,需要對清東陵文化現存各種類型和形態的文獻典籍進行全面、系統、完整和科學地收集、整理、分類、標引和組織,在此基礎上應用現代數字人文(Digital Humanities)技術進行清東陵文獻典籍的數字化建設研究。

一、清東陵文獻典籍的收集策略

如何將分散于各處、數量龐雜、卷帙浩繁的清東陵文獻典籍收集、整理齊全,形成全面、系統、完整和科學的文獻典籍體系,前提是需要制定出科學、系統和有效的清東陵文獻典籍收集方案。首先,需要明確界定清東陵文獻典籍的內涵和外延,在此基礎上根據清東陵文獻典籍的不同類型分別制定和形成具體的、有針對性的、具有可操作性的收集策略。

(一)清東陵文獻典籍的內涵和外延

從廣義上講,凡是用文字、圖形、符號、聲頻、視頻等手段記錄知識的一切載體都統稱為文獻。在古代,圖書被稱作 “典籍” ;反過來說, “典籍” 泛指古代圖書,也稱之為 “古籍” 。因此,一般意義上的古籍是指除了簡帛古籍、敦煌遺書、佛教古籍、碑帖拓本及古地圖等特殊類型藏品以外的,未采用現代印刷技術印制的、習見的、普通形制的古代漢文書籍[2]??梢?從概念的內涵來看, “文獻” 包含了 “典籍” , “典籍” 是 “文獻” 的一種; “文獻典籍” 則是一個復合概念,特指以古籍為主體但不限于古籍的多種類型形式的文獻。

在中國歷史上,清朝統治時期是從順治元年清朝入關到宣統三年清帝遜位(即公元1644年—1911年),橫跨時間268年。清世祖順治皇帝的孝陵是清東陵的第一座陵寢,始建于順治十八年(即1661年)。自1663年葬入第一帝順治至1935年葬入同治皇帝的最后一位皇貴妃,歷時272年。清王朝覆滅之后,清東陵仍歷經軍閥混戰、日軍侵略、抗日戰爭等戰爭洗禮和磨難,期間還遭受多次盜劫和搶掠,直至新中國成立后清東陵文物保管所成立,清東陵才得到我國政府的專項管理和保護[3]。因此,為了對清東陵文化研究提供全面、完整、系統的文獻保障,將清東陵文獻典籍的收集時間范圍界定為從順治皇帝即位(1644年)開始至新中國成立(1949年)為止。新中國成立以后至今,現代、當代清東陵文化歷史學家和研究學者創作出版的圖書和撰寫發表的報刊論文,是基于清東陵歷史文化研究產生的創作作品、取得的研究成果,不納入清東陵文獻典籍的收集范圍。

綜上,基于 “文獻” 和 “典籍” 的一般性定義,結合清東陵文化研究的實際需求,將清東陵文獻典籍的內涵界定為:在歷史上形成的與清東陵的陵寢規制、皇家葬俗、工程建設等有關的并且具有重要歷史、思想和文化價值的文獻資料。將清東陵文獻典籍的外延界定為:自清朝入關到新中國成立(即1644 年-1949年)期間留存的,一切記錄清東陵的陵寢規制、皇家葬俗以及與清東陵陵寢選址、規劃設計、施工驗收、維護修整等清東陵工程建設過程的各個階段相關的事件和人物的古籍以及書冊、諭旨、檔案、圖紙、碑刻銘文和照片等形式的文獻[4]。

(二)清東陵文獻典籍的收集

1.清東陵古籍文獻的收集

首先,通過《中國古籍總目》、《中華古籍書目數據庫》以及《鼎秀古籍全文檢索平臺》等公開發布的權威性古籍書目類工具書、古籍文獻專題數據庫,檢索和查找清東陵古籍文獻的存藏情況。其次,各級各類圖書館和檔案館歷來是各種文獻重要的和主要的收藏來源,也是全國開展古籍普查登記的重要組成單位,成為清東陵古籍文獻收藏的重點調研對象。通過這些古籍收藏單位網站設置的 “珍貴古籍名錄” 專欄,可以瀏覽和了解其收藏清東陵古籍文獻的情況。在故宮博物院收藏清代宮中的古籍文獻中也包括大量清東陵陵寢的工程做法、圖紙、賬本等文獻典籍[5],可從中篩選出一批清東陵古籍文獻。再次,通過咨詢清東陵文史研究專家,或者查閱現代及當代的清東陵文化研究專著和論文等研究成果,以及調研和走訪相關古籍收藏單位和個人,可以有效查找、鑒別和確定部分清東陵古籍文獻的存藏線索。還可以采用購買、捐贈和復制等多種方式進行長期性的清東陵古籍文獻的征集,從而不斷完善清東陵古籍文獻體系。

2.清東陵檔案文獻的收集

檔案是 “過去和現在的國家機構、社會組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄”[6]。檔案文獻具有原始第一手資料、更加貼近真實史實等特點,而且內容記載豐富、能夠提供細節性的資料。在國家、省、市、縣各級各類檔案館中收藏有大量清代宮廷檔案資料,其中有大量未被刊布的檔案內容還未被挖掘、整理和公開出版,可填補某些研究領域的文獻空白,或者成為一些史實的新的憑證?;跈n案文獻具有的重要研究價值,應將清東陵檔案作為清東陵文化研究文獻典籍的重點收集對象。

中國第一歷史檔案館作為國家級檔案館,目前保存清代檔案數量約一千余萬件,包括清入關前天命九年(1607年)至宣統三年(1911年)300多年時間里形成的文書檔案,以及溥儀退位后于1921-1931年間形成的檔案[7],不僅是研究和纂修清代歷史的第一手寶貴資料,也是收集清東陵文獻典籍檔案類資料的最重要的來源和渠道。其中,在《清實錄》《內務府來文·陵寢事務》《內務府來文·禮儀》《內務府來文·修建工程》《內務府奏銷檔》《內務府奏案》《內務府輿圖》《上諭檔》《軍機處議覆檔》《朱批奏折》《溥儀檔》《新整溥儀檔》《宮中雜件》《欽定工部則例》《工部案卷》《錄副奏折》《諸陵規制尺寸略節》等檔案中都記載了大量與清東陵有關的人物和事件,尤其是大量內務府檔案,對清東陵文化研究具有極高的、可供挖掘的文獻價值?!抖旯こ厅S冊》《定陵工料奏銷黃冊》《順水峪定陵妃園寢銷算黃冊》《菩陀峪金井安放帳》《菩陀峪萬年吉地銷算黃冊》《普祥峪萬年吉地銷算黃冊》是部分陵寢工程完成后核銷所有耗費工料、錢糧明細的決算冊;《工程備要》等定東陵工程籍本詳細輯錄了上諭、奏疏、施工監理、施工預算、施工決算以及工程作法等與陵寢工程各個環節相關的內容,能夠翔實反映普祥峪定東陵、菩陀峪定東陵的具體建設過程和細節[8],這些檔案文獻對清代陵寢建筑研究具有非常重要的參考價值。

另外,中國第二歷史檔案館的北洋內務部檔案中收錄了與清東陵被盜案相關的部分史料,可作為清東陵檔案類文獻資料的重要補充來源[9]。

3.清東陵樣式雷圖檔的收集

自乾隆朝雷家璽規劃設計陵寢開始,清朝各陵寢的設計、修葺或重建,均由樣式雷世家承擔。由清代雷氏家族設計、繪制和寫作的建筑圖樣與文字檔冊,統稱樣式雷圖檔[10]。樣式雷圖檔不僅包括畫樣和燙樣,還包括記錄皇帝皇后的旨意、管理機構堂官的堂諭從而形成的《旨意檔》、《堂諭檔》,以及在施工過程中形成的預算資料、工程日記、工程做法等多種資料,蘊涵了關于清東陵陵寢建筑選址勘測、規劃設計以及施工的理念、過程、方法、人物、事件等詳情細節資料,具有獨特的建筑、藝術、美學研究價值和珍貴的文獻價值,2007 年被入選《世界文化遺產名錄》。當前主要保存清代樣式雷圖檔的收藏單位有中國國家圖書館、北京故宮博物院、中國第一歷史檔案館、清華大學建筑學院和臺北故宮博物院,還有其他零散保存樣式雷圖檔的機構包括中國國家博物館、日本東京大學、法國巴黎吉美博物館等[11]。樣式雷圖檔除了收集其紙質原件之外,還可以對其拍照或者經過3D 處理采集信息后轉換成數字化信息進行收集。

4.其它類型清東陵文獻的收集

清東陵文獻典籍除了清東陵古籍文獻、檔案文獻和樣式雷圖檔等常見的主體文獻類型之外,還包括一些具有重要研究價值的其他特殊類型的文獻,同樣需要重點進行收集、整理和利用。例如,耗時達3年多完成、居清陵之冠、甚至 “為目前所知歷代帝王陵寢最華美者” 著稱的裕陵地宮,在地宮內部的明堂券、穿堂券、金券以及各個洞券內刻有大量佛教題材的石雕圖像和佛教經文。據檔案記載,平水墻下的圍墻上均勻地雕刻著數以萬計的佛經咒語中有藏文29464個字、梵文647個字。這些經文和圖像雕刻,圖案復雜,內容繁多,工藝絕倫,體現了中國古代傳統墓葬文化與祈福文化的思想內涵,反映了在清代滿漢民族融合背景下經濟、政治、宗教、藝術和哲學發展現狀,具有獨特的歷史、文化、藝術、美學等學術研究價值與商業應用開發價值[12]。

另外,據不完全統計,清東陵當中有順治帝的孝陵神功圣德碑碑文(1千余字漢文)、康熙帝的景陵圣德神功碑碑文(4千余字漢文)、乾隆帝的裕陵圣德神功碑碑文(2千余字漢文)及其他碑文共計近2萬字漢文[13]。其中,自雍正皇帝胤禛以弘揚康熙 “在位六十余年,功德隆盛,文章字數甚多,一碑不能盡載” 為由將鐫刻康熙大帝一生文治武功的圣德神功碑亭詔建兩碑,一刻清文,一刻漢字,每個碑文長達4300多字,并自此成為定制[14]。由此可見,清東陵碑文也是不容忽視的重要文獻收集和整理對象。

除了清東陵陵寢建筑中雕刻形成的經文、佛像和碑文之外,還有與清東陵有關的輿圖(如《清東陵風水形勢全圖》)、照片(包括清東陵實景和清東陵文物)等,具有很大的歷史和文化研究價值,也應作為特殊文獻、采用相應的特殊手段進行收集、整理和利用。此外,還應深入民間進行清東陵口述史資料的搶救、挖掘、收集與整理研究。

二、清東陵文獻典籍數字化建設策略

數字人文是進一步提升文化遺產數字化建設和利用水平的重要途徑。數字人文通過將現代信息技術應用于人文研究領域,為人文研究學者提供基于數據的、面向內容的、智能化的和精準的知識服務,幫助人文研究學者從數據中發現現象或事物的本質和彼此間的邏輯關聯, “為人文社科研究插上了數字羽翼”[15]。

從清東陵文化研究的具體需求出發,按照數字化、結構化、知識化和平臺化四個依次遞進的環節和流程,提出對清東陵文獻典籍進行內容描述、組織和揭示,并且應用嵌入個人知識環境的各類分析和處理工具以及提供平臺化服務的清東陵文獻典籍數字化建設策略。具體環節和流程如圖1所示。

圖1 清東陵文獻典籍數字化建設環節和流程

(一)數字化:整理和組織形成清東陵文獻典籍數字化素材庫

根據清東陵文獻典籍實際存藏現狀,對清東陵文獻典籍進行整理和組織,形成基本數字化素材庫,是清東陵數字化建設的第一個基礎性環節。

首先,根據清東陵文獻典籍的不同類型和特點,分類施策進行整理和組織。其中,對于那些專門記載清東陵相關情況并且尚未被全文數字化的清東陵文獻典籍,根據文獻研究價值的大小和版本存世稀缺程度的高低,分步驟對其進行全文數字化加工和整理;對于零散記載清東陵相關情況或零散存在于已建成的古籍全文數據庫中的清東陵文獻典籍,通過匯集散佚在文獻典籍中的相關內容和知識點,形成文獻匯編專題數據庫;對于那些已經被收錄進入權威性的古籍全文數據庫的數字化清東陵文獻典籍,收集數字地址鏈接并形成導航。對以上各種類型的清東陵文獻典籍數字資源進行有效整合,編制形成清東陵文獻典籍數字化書目目錄和各類型數字化清東陵文獻典籍索引,成為清東陵文獻典籍基本數字化素材庫的原始素材。選取人工錄入和機器掃描相結合進行編碼設計的策略作為加工形成清東陵文獻典籍基本數字化素材庫的數字化方法。

在以上過程中,分別采用數據對象和元數據對應的存儲方式進行資源整合。其中,對于古籍、書冊、諭旨、檔案等形式的文獻資料進行著錄標引形成元數據,建立索引實現主題檢索功能;對于圖紙、碑刻銘文和照片等形式的文獻資料,通過光學掃描技術(OCR)形成高質量的圖像信息文件。同時,針對清東陵文獻典籍的文獻資源內、外部特征設計描述元數據,從而通過題名、責任者、主題詞、學科、中圖法分類號、所屬地域、版本信息、成書時代、文字說明等分別建立索引,支持用戶的高級檢索、族性檢索和個性化檢索。在這一環節中,還應遵循我國古籍文獻數據加工流程、古籍版本選擇、古籍文獻文字處理等方面已有的數字化建設標準,如《古籍著錄規則》(2008年)、《學術出版規范 古籍整理》(2015 年)、《古籍元數據規范》(2014年)、《古籍數字化工作手冊》((試用本),2015年)[16]等,加強對清東陵文獻典籍標引和分類工作的標準化和規范化,從而具備標準性、兼容性和可擴展性。

(二)結構化:進行數據轉換形成清東陵文獻典籍語料庫

使清東陵文獻典籍實現從數字化文本到結構化語料庫的轉換,是構建有序化的清東陵文獻典籍知識庫的重要基礎。首先,由領域專家對清東陵文獻典籍數字化素材進行主題分析,研究并歸納不同文獻典籍多特征詞匯底表。然后,構建基于清東陵文獻典籍的自動分詞、自動詞性標注、自動命名實體識別和自動斷句模型,完成數字化文本的分詞、詞性、命名實體和斷句的自動標注。其中,以古漢語自動分析技術為基礎進行詞語切分,結合人工標注和校對,以實體標注方法,對清東陵文獻典籍中所記載的詞語、時間、地點、人物、事件等要素的命名實體以及詞性、地點GIS等信息進行標注。最后,創建實體同現表、人名表、人物表、時間人物表、地名表等數據表[17],最終得到一個多層級標注的、結構化的清東陵文獻典籍語料庫,成為后續構建有序化的清東陵文獻典籍知識庫的基礎。在對元數據進行數據清洗、對語料進行整理、入庫與標注的過程中應注意保持語料的統一性和規范性,如,參照《我國數字圖書館標準與規范建設》標準中有關元數據與知識組織標準,并遵循《GB/T 20530-2006文獻檔案資料數字化工作導則》、《GB/T 26816-2011信息資源核心元數據》[18][19]等相關文獻數字化建設標準,對清東陵文獻典籍數字化建設流程進行標準化和規范化管理,使其具備開放、合作、共享和可持續發展等功能特性。

(三)知識化:形成有序化的清東陵文獻典籍知識庫

知識庫是一種通過對知識客體分類、整理、加工、揭示、控制等知識組織方法進行存儲和管理形成的數據集合體,是事實、規則和概念的集合[20]。利用計算機與網絡技術將清東陵文獻典籍變為可瀏覽、可檢索、語義關聯與知識重組的知識化的數字信息集合,形成有序化的清東陵文獻典籍知識庫,是這一環節需要實現的目標。

首先,由清東陵文史研究專家指導專業人員利用語義標注工具對清東陵文獻典籍進行知識抽取與語義化處理,考慮同義詞、概念的歧義、概念的上下位關系,借助人工參與及現有的分詞工具,設計清東陵文獻典籍研究文檔分析器嵌入知識庫系統當中,進行語義提取、組織和處理,構建形成結構化的數據集合。然后,通過構建領域本體的知識庫組織方式實現語義檢索,利用本體對相關資源進行語義標注,建立詞匯間的語義關系,并存儲對象類、屬性以及對象之間的語義關系,提供深度的語義層面知識,展開語義知識組織,滿足書目控制和規范控制等需求[21]。最后,在對清東陵文獻典籍的內容進行描述、組織和揭示的基礎上建立更多的語義關聯,采用知識本體、關聯數據等方式組織、開放資源并提供平臺化服務,提供能夠嵌入個人知識環境的各類分析處理和可視化工具[22]。最終使清東陵文獻典籍知識庫具備基于知識的語義檢索功能以及文本挖掘、語義分析和知識發現等數字人文功能。

(四)平臺化:構建清東陵數字人文知識服務平臺

構建數字人文知識服務平臺是實現為人文研究學者提供人文研究支持和知識服務的核心目標。該平臺將基于清東陵文獻典籍知識庫為領域學者與公眾用戶提供面向數字學術的各項知識服務的軟件應用模塊,實現各項數字人文技術功能[23]。除了具有全文檢索功能外,具有研究支持功能、具有知識共享和人—機交互功能、具有基于超鏈接的瀏覽閱讀環境,以滿足不斷發展的學術研究和大眾閱讀的要求,并通過提供API接口,使得網絡上的資料、工具與平臺相互連接,促進資源的整合和互聯[24]。

由于清東陵文獻典籍包括清東陵古籍文獻、清東陵檔案文獻、清東陵樣式雷圖檔以及陵寢中的經文、佛像、碑文、輿圖、照片、口述史資料等多種類型的文獻,需要在分類的基礎上對以上各種類型的文獻典籍進行整合,以庫、類、目的樹形結構進行存儲和展示。經數字化整理之后形成的知識庫數據集合,應具備基于分類導航和分類檢索的數據統一檢索與獲取功能,為用戶提供科學、高效和便捷的知識服務。參照和結合傳統的文獻典籍分類方法和現代國際通行的圖書資料分類法,構建符合現代用戶檢索思維和習慣的知識體系和文獻檢索系統,從而便于用戶快速全面地了解清東陵文獻典籍收錄情況,充分挖掘和利用清東陵文獻中的知識信息。

三、結論

文化遺產數字化是利用現代信息技術對文化遺產進行深度保護、傳承、開發、利用與傳播的重要手段。將數字技術與人文學術研究深度融合,使文化遺產數字化平臺具有內容分析、社會網絡分析、計量分析等功能,實現文化遺產資源提供、文化遺產知識關聯和文化遺產知識服務三方面功能的互鑒和可持續擴展,是進一步提升文化遺產數字化建設和利用水平的重要途徑[25]。通過借鑒數字人文學術的研究范式、研究方法和研究成果,提出建設清東陵文獻典籍數字化建設的策略,使清東陵數字人文知識服務平臺為清東陵文化研究提供新的研究視角、研究方法和研究工具,以增加清東陵文化研究的內涵、潛力、廣度和深度,以期為后續進一步開展清東陵數字人文知識服務平臺的具體技術實施方案進行探索、打下基礎。

猜你喜歡
典籍古籍數字化
中醫古籍“疒”部俗字考辨舉隅
家紡業亟待數字化賦能
《典籍里的中國》為什么火?
關于版本學的問答——《古籍善本》修訂重版說明
高中數學“一對一”數字化學習實踐探索
高中數學“一對一”數字化學習實踐探索
關于古籍保護人才培養的若干思考
我是古籍修復師
在詩詞典籍中賞春日盛景
數字化制勝
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合