?

基于異構網絡的西部少數民族文獻聯合數據庫建設*

2014-11-14 14:22王小林
圖書與情報 2014年2期
關鍵詞:文獻少數民族數據庫

王小林 陳 軍

(甘肅省圖書館 甘肅蘭州 730000)

少數民族文獻資源是中華燦爛文化寶庫的重要組成部分,但是由于多方因素,少數民族文獻資源利用率并不是很高,而基于信息技術的聯合數據庫建設無疑是提高文獻利用率的重要手段之一,它不僅可以為學術研究提供更為便捷的文獻信息檢索平臺,而且對于繼承和弘揚各民族的優秀文化傳統,促進各民族的繁榮發展,都具有十分重要的意義。

1 少數民族文獻聯合數據庫建設條件分析

1.1 少數民族文獻的整理出版為數據庫建設打下了良好的資源基礎

當前,少數民族文獻的整理出版日益受到重視并已初具規模。在聯合目錄方面,有《中國蒙古文古籍總目》、《全國滿文圖書資料聯合目錄》、《北京滿文石刻拓片目錄》、《世界滿文文獻目錄》、《維吾爾·烏孜別克·塔塔爾古籍目錄》、《彝文古籍目錄》、《傣文古籍知見錄》、《中國少數民族古籍總目提要·納西族卷》和《中國少數民族古籍總目提要·白族卷》等編纂出版。國外也有關于中國少數民族古籍的目錄整理出版,包括蒙文、藏文、維吾爾文、滿文等文獻。這些聯合目錄的編纂,調研了現存少數民族古籍的數量和分布情況,為民族文獻的研究和利用提供了信息。在整理出版方面,全國已出版了5000多種少數民族古籍,如《甘珠爾》、《丹珠爾》等,還有西夏文的《中國藏西夏文獻》、納西族的《東巴文全集》、貴州的《水書全集》等。

民族圖書館編輯的館藏民族文獻目錄以及用漢文編輯的民族文獻目錄,數量更多。西南民族學院圖書館編輯了《西南民院館藏地方目錄》、《民族資料目錄》、《藏傳佛教資料目錄》、《西南民院館藏期刊民族資料目錄》、《民族文獻提要1949-1989》、《羌族民間文學資料集》。湖北民族學院圖書館編輯了《1980-1998年土家族文獻資料索引》、《土家族情報資料通訊》、《中國少數民族史料·儺文化研究索引》、《古儺史料匯編·湖北方志卷》等資料,為土家族研究提供了較為便利的文獻資源。中央民族大學圖書館編輯了《館藏民族學科圖書內容提要》、《中國民族研究文獻目錄》、《中國少數民族作家文學作品目錄索引》、《中國少數民族民間文學作品目錄索引》等。民族地區文獻收藏

*本文系國家社科基金項目“西部少數民族文獻資源建設研究”(項目編號:10XTQ014)研究成果之一。

1.2 少數民族文字處理技術的開發應用為數據庫建設提供了平臺

中國55個少數民族中,除回族、滿族已不使用自己民族的文字而直接使用漢字外,有29個民族有與自己的語言相一致的文字,由于有的民族使用一種以上的文字,如傣語使用4種文字,景頗族使用2種文字,所以29個民族共使用54種文字。上世紀90年代初,有關研發機構陸續推出了蒙古、藏、維吾爾、哈薩克、朝鮮、彝、壯以及柯爾克孜、錫伯等少數民族文字的字處理系統,新疆、青海、甘肅、西藏、四川、吉林延邊等地的專家學者也在國家資助下,開發了多種民族文字處理技術和應用系統,主要包括國家標準和國際標準的研制與開發、操作系統和電子出版系統的研制和應用、民族文字數據庫的研制和應用、少數民族文字其他信息處理系統的開發和研制等5個層面的項目。

我國從上世紀80年代就開始著手民族文字文獻管理系統的研制,目前藏文字處理軟件、藏漢雙語信息處理系統、蒙文信息管理系統等都具有很高的水平。也廣泛地應用于文獻編目、期刊管理、流通管理、情報檢索、文獻索引編制文獻的管理與服務等方面。比較常用的少數民族編目子系統有三種:一是漢文編目子系統,可以對漢文、日文、朝鮮文、藏文、彝文、壯文、傣文、越南文等進行編目。它與西文系統完全兼容,只要多文種字符集和相應的操作系統支持,數據的輸入、顯示、打印均可以由左向右橫行處理。二是蒙文編目子系統,可以對蒙古文、滿文等文獻進行編目,支持直行顯示(從上向下)和打印。三是維文編目子系統,可以對維吾爾文、哈薩克文、柯爾克孜文文獻進行編目,支持從右向左橫行顯示與打印。

1.3 異構網絡技術的發展為數據庫建設提供了技術支撐

隨著我國經濟社會發展,信息化水平也有了長足的發展,四大骨干網絡全面建成并完善。中國計算機公用互聯網(ChinaNet)已覆蓋全國200多個城市的多層網絡結構;中國教育和科研計算機網(CERNET)通達各省、市、自治區的160個城市,聯網的大學、中小學等教育和科研單位已達895個;中國科技信息網(China STINET)可接入全國各地45個城市、共1000多家科研院所、科技部門和高新技術企業;國家公用經濟信息通信網絡(金橋網CHINAGBN)截至2013年已有600多家政府部門、企事業單位和 ISP 接入。

隨著移動通信和互聯網技術的高速發展,涌現出了不同類型的通信網絡,使用戶置身于一種復雜多樣的異構網絡環境中,信息獲取和傳輸的手段以及數據存儲和共享的方式發生了很大變化。異構網絡是由不同制造商生產的計算機、網絡設備和系統組成的,大部分情況下運行在不同的協議上支持不同的功能或應用。異構網絡融合是未來網絡發展的必然趨勢,通過異構網絡融合,可以充分利用不同類型的網絡技術優勢,極大地提升單個網絡的性能,在支持傳統業務的同時也為引入新的服務創造了條件,同時降低成本,向不同用戶提供個性化的服務,滿足用戶多樣性的需求。異構網絡融合技術的發展,為不同平臺民族文獻特色數據庫的融合奠定了基礎。

2 基于異構技術的少數民族文獻資源數據庫構建思路

2.1 聯合數據庫前期規劃

2.1.1 籌備西部地區少數民族文獻聯合數據庫管理中心

回顧性分析我院在以往2年之內所接診的腸息肉患者資料50例(2016.1-2018.1),所選患者全部獲得明確的診斷,臨床表現癥狀包括血便、腹部疼痛、腸梗阻以及便次增多等,50例患者中為橫結腸息肉患者10例,降結腸息肉患者10例,直腸和乙狀結腸息肉患者25例,升結腸息肉患者5例;50例患者中男性30例,女性20例,最小年齡30歲,最大年齡66歲,平均40.58±6.97歲。

參照CALIS、NSTL與全國文化信息資源共字工程的共享體系,建立西部少數民族文獻特色聯合數據庫管理中心,對西部地區范圍內的少數民族文獻資源的類型、范圍、重點、數量分布等進行統籌規劃、協調建設,使得這些分散無序的資源構成一個有機的整體。作為一個虛擬的機構,其成員由西部地區有實力的圖書館及相關單位參加,管理中心還可以組成課題研究小組,由專家委員會制定文獻數據庫建設相關的數據標準、資源選題方向、具體實施方案和資源共享細則,同時評估申報聯合數據庫研究課題。各成員館則組織人力分頭開展數據庫的加工制作。一個特定的選題,可由一館單獨完成,也可由一個中心館負責牽頭,多館聯合完成。這樣既能使數據庫在質量上得到保證,又避免了重復建庫,人力浪費,最終實現共建共享。

2.1.2 確定數據庫建設的范圍和內容

西部少數民族文獻資源種類繁多、內容豐富、收藏分散,在選題的確定與資源的選擇上,需要研究文獻資源所涉及的學科領域、載體類型以及覆蓋的語種與時間范圍等,在數據收集時要因地制宜,體現地域特色,反映本地區的政治、經濟、文化和社會生活,遵循重點性原則、點面結合原則、遠近平衡原則和系統性原則。在目前人力、財力有限、信息技術水平不高的情況下,選擇重點民族、重點地域、重點時期的重點文獻,采用搶救“遠期”、開發“近期”的原則,優先數字化具有較高歷史文化價值的瀕臨滅跡的文獻,同時開發對現實有指導和借鑒作用的當代文獻,盡量做到前后呼應,成為一個體系。對于各成員館前期建設中涉及的內容相近的特色數據庫,可以通過交流、協議、合作、一體化等方式開展互利互惠的合作。2.1.3確定科學管理的方法

西部地區的信息資源配置并不平衡,陜西、四川和重慶等省市大專院校、科研院所云集,信息資源擁有量相當豐富,而西藏、青海、寧夏等地區信息資源基礎相對薄弱。為避免各地區低質量、低水平重復建庫,聯合數據庫建庫管理中心一定要承擔起相應的責任,制定嚴格科學的管理方法。管理中心的職能主要有3個:制定統一的技術規范;制定與項目相關的規章制度;制定項目開展管理辦法。具體工作內容包括:資源共享協議、信息傳遞工作細則、聯機共享數據庫條例、數據庫建設規范、網絡信息服務結算辦法等。管理中心同時還承擔系統資源的分配與管理、用戶信息的管理、具體特色信息的網絡分布等,這樣各承建少數民族文字文獻的單位可以根據自身的文獻特色,依照標準,有目的、有方向地將民族文字文獻數字化。2.1.4確定開發利用和提供服務的方式

聯合建庫的各成員單位可以根據自身情況及讀者需求,對文獻資源進行多級權限控制,選擇對數據庫資源是完全開放還是部分開放。如:哪些資料可以免費在外網發布全文;哪些資料僅供館內閱覽,外網只是發布目錄;哪些資料可以通過用戶登錄,在外網看到全文。聯合數據庫建成之后,在管理中心網站上及各成員館的網站上開辟專欄,廣泛鏈接接,公開發布。由于管理中心不是一個實體機構,一般可不進行數據存儲,為避免版權糾紛和降低管理難度,由各單位分散存儲,通過異構技術,實現基于不同網絡和不同操作系統的數據庫之間信息的快速、安全、可靠的交換與傳輸,實現各類資源的跨庫檢索,以跨庫檢索及數據庫整合深層次揭示特色數據庫內容,在二次文獻數據庫和全文數據庫之間建立鏈接,方便讀者快速實現原文信息源定位查詢,實現多數據庫同時檢索,分數據庫展示檢索結果。

2.2 聯合數據庫建設方略

2.2.1 搭建適宜的數據庫建設平臺

我國的三大文獻資源共享體系資源建設方式各有不同:CALIS采取項目管理方式,整個保障體系由若干個子項目組成,各成員館根據自身特點和情況選擇加入。全國文化信息資共享工程的資源加工一般在國家中心和特定分中心進行,特定分中心創建的資源通過互聯網等方式將元數據和對象數據傳遞到中間節點,其他中心主要利用國家中心創建的資源數據。NSTL則實行“統一采購、分布加工、聯合上網、資源共享”的原則,由成員單位將所訂購收藏的原始文獻加工成二次文獻,提供給網絡服務系統。西部地區圖書館建議使用各單位現有的網絡環境和應用軟件,通過異構網絡技術,實現將視頻、語音、信息等各類數據整合在一個網絡中進行傳輸。

2.2.2 遵守統一標準和規范

從目前來看,少數民族文獻加工還處于大規模數字化階段,書目數據庫和索引類比較多,對內容的深加工研究比較薄弱,但是只有深層次加工的數據庫才能引起用戶對信息資源的依賴,提高數據庫的利用率,節省讀者時間,同時,對于圖書館來講,文獻數據庫的深加工可以提高圖書館的服務水平,促使圖書館員自身素質的完善,因此要分層次、分類別地推進特色數據庫的建設,設計不同類型的數據庫,例如:書目型數據庫、全文本數據庫、復合式專題數據庫等,進行從三次文獻、二次文獻到一次文獻,從文本格式到多媒體格式,從單一語種到多語種于一體的逐次深入和多元化的數字化建設與整合。要有重點地進行全文、數值、事實、多媒體數據庫的建設。同時,要以用戶需求為導向,優化少數民族特色數據庫的服務模式,將個性化服務功能嵌入數據庫服務系統,提高數據庫的檢索效率和利用率,形成有針對性、特色性、高增值的各種數據庫產品。

2.2.4 強調高質量標引

在少數民族特色資源庫的建設中,可以按照文獻內容的學科屬性、地域屬性、民族屬性等做各種專題數據庫,多角度、全方位揭示文獻。如云南省的西南民族研究文獻特色數據庫就按學科(民族宗教、民族理論、民族人類學、民族工作、民族政治等二十個分類)、民族(阿昌族、白族、布朗族、布依族、傣族、德昂族等36個民族)、地域(云南、四川、重慶、貴州、廣西、西藏六個省區市)以及五個專題(東巴文化研究、民國文獻研究、民族調查資料、跨境民族研究、云南獨有民族)這四個方面來反映西南少數民族的特色文化。標引的質量,對文獻的檢索效果有直接的決定性影響。由于計算機化檢索系統的建立和文獻數據庫的應用,高質量的標引工作可以提高文獻的查全率和查準率,為用戶帶來極大的方便。

2.3 聯合數據庫后期的可持續發展

2.3.1 加強專業人才隊伍建設

少數民族文獻數據庫建設是一項專業性很強、涉及多學科知識的復合型工作,對于從業人員的要求較高。從事數據庫建設的工作人員,除了要具備一般圖書情報知識外,還必須在科學技術知識、少數民族語言文字方面有一定素養,同時還要掌握現代信息技術方面的知識。人才是保證特色數據庫建設的關鍵因素,只有高素質的人才隊伍,才能適應現代化的民族文獻數字化工作,才能提供高水準、系統化的服務,多途徑、全方位地滿足讀者對少數民族文獻信息的需求。

2.3.2 強化數據質量控制體系

數據庫的質量控制包括數據庫運行平臺的選擇、服務平臺環境、元數據標準、數據錄入的準確性和數據處理的規范性等方面。在數據庫建設的初始階段,由于沒有源數據,完全采用原始編目方式會產生很多錯誤數據,編目速度也會出現參差不齊的現象。由于沒有可供參考的模式,各單位在制作數據是或多或少都存在著問題,著錄內容不準確,詳簡級次不一,著錄不規范,缺乏統一的標準等。隨著少數民族文獻事業不斷向信息化、網絡化發展,資源共享,尤其是通過異構網絡進行資源共享將是未來的發展趨勢。因此,少數民族文獻聯合數據庫建設應建立健全質量控制體系,盡量采用國家標準或國際標準,進行規范控制,保證數據質量。

2.3.3 構建數據更新長效機制

建庫后的數據維護工作是必不可少的,一個數據庫能否保持信息的正確性、及時性、很大程度上依賴于數據庫的更新。隨著文獻收集、整理、挖掘的深入,必須經常不斷地對數據進行必要的修改、增刪、合并、更新和整理,這是數據庫質量控制不可缺少的環節,也是數據庫具有旺盛生命力的保證。如《巴蜀文化特色數據庫》在“十五”期間完成了第一期,建成基礎數據量2萬多條,“十一五”期間進行數據庫第二期建設,數據量達到10萬條以上,“十二五”期間進行第三期建設,目標數據量是15萬條以上,其中數字對象比例超過30%以上,全文、圖像、音視頻等一次文獻達到20%以上。通過數據更新,不斷完善數據庫系統,充分體現資源的豐富性、廣泛性、完整性和時效性。

3 結語

在異構網絡環境下,通過少數民族特色數據庫的建設,形成一個少數民族文獻保障體系,通過統一的查詢界面實現對數據源的靈活訪問,將從多數據源取得的數據多途徑多角度呈現給用戶,有利于少數民族語言文字的搶救與保護,有利于全方位開發利用少數民族文獻,有利于增強西部地區整體信息實力,對促進地區和國際間的文化交流具有極為重要的意義。

[1]張次第.少數民族文獻資源建設研究[J].中國圖書館學報,2011,(9):115-119.

[2]龔劍.談我國民族文獻資源的共建共享[J].圖書與情報,2010,(6):118-121.

[3]我國目前有多少種少數民族語言文字?[N/OL].[2013-09-20].http://www.mzb.com.cn/zgmzb/html/2009-12/18/c ontent_65200.htm.

[4]戴劍威,徐海洋,吳宇瀟.民族文字,迎來數字化時代.人民網[EB/OL].[2013-09-26].http://chinese.people.com.cn/GB/10878390.html.

[5]包和平.我國民族文字文獻工作的現代化[J].圖書與情報,2000,(3):36-37.

[6]全國文化信息資源共享工程管理暫行辦法[EB/OL].[2013-09-24].http://baike.soso.com/v6520179.htm#11.

[7]王海濤,付鷹.異構網絡融合——研究發展現狀及存在的問題[J].數據通信,2012,(2):18-21.

[8]栗華軍,宋順林.異構數據庫集成系統的研究與實現[J].計算機工程與設計,2008,(8):4026-4028.

[9]劉泳潔,王月娥.關于西部民族地方文獻數字化的幾點思考[J].大學圖書館學報,2002,(4):47-48.

[10]谷遇春.論大湘西區域文獻信息資源共建共享[J].中國圖書館學報,2006,(1):73-76.

猜你喜歡
文獻少數民族數據庫
少數民族的傳統節日
少數民族的傳統節日
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
少數民族的服裝
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
數據庫
數據庫
數據庫
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合