?

TPI對“劉三姐專題文獻數據庫”進行CALIS標準改建研究

2011-12-22 10:47
河池學院學報 2011年5期
關鍵詞:劉三姐文獻數據庫檢索

周 波

(河池學院 圖書館,廣西 宜州 546300)

TPI對“劉三姐專題文獻數據庫”進行CALIS標準改建研究

周 波

(河池學院 圖書館,廣西 宜州 546300)

由于原有的“劉三姐專題文獻數據庫”存在著檢索功能方面專業化程度較低以及不符合CALIS統一標準等缺點,在此利用TPI系統對“劉三姐專題文獻數據庫”進行了CALIS標準化改建。改建后的“劉三姐專題文獻數據庫”將具有良好的管理及服務功能、軟硬件平臺以及統一的CALIS標準接口——可接入CALIS的特色資源服務體系中,以實現元數據檢索與文獻傳遞功能,達到效益的最大化。

特色數據庫;數字化文獻;TPI系統;CALIS標準

0 引言

在計算機網絡高速發展、數字化信息急速爆發的時代背景下,我們需要對傳統圖書館進行重新定位和調整,使它能同時具備傳統和數字圖書館雙重職能。除傳統方式的館藏之外,我們還需要對相關的文獻資源進行數字化收集、處理、存儲、利用等多方面系統管理,以此能更好地發展數字化館藏和虛擬化館藏圖書館[1]。專題特色數據庫建設的目標就是充分體現出文獻信息與數據資源的特色,根據不同的地方特色、館藏特色和專業特色將各類文獻資源進行集中數字化處理,建立數字化文獻資源庫;同時,以專題網站為發布平臺,通過Internet中的WEB服務方式,提供數字化文獻資源的全文檢索、瀏覽、下載、打印等服務。專題特色數據庫應全面的反映其特定領域中的文化科技等發展全過程,充分展現其特定領域中的國內外最新研究動態和水平。專題特色數據庫承擔著存續民族文化和地方文化遺產的責任,以及為地方特色文化的傳播、研究、開發利用提供數字化文獻資源信息的支持。

由于原有的“劉三姐專題文獻數據庫”[2]研究開發人員的專業知識和技術水平有限,加之當時數據庫開發過程中手中缺乏集成化、專業化、數字化的特色數據庫建設系統軟件,使得原有的“劉三姐專題文獻數據庫”所運用的技術與國內外先進技術相比尚處于初級水平;因此原有的“劉三姐專題文獻數據庫”無論是檢索功能、安全性、可管理性方面都還存在著很大的不足和缺陷。同時,原有的“劉三姐專題文獻數據庫”也難以滿足CALIS(中國高等教育文獻保障體系China Academic Library&Information System)專題特色數據庫子項目關于構建統一的公共檢索平臺、進一步統一數據庫的建庫標準和服務功能要求。集采集、制作、發布、管理功能于一體的TPI系統作為“劉三姐專題文獻數據庫”改建的技術平臺將可解決原有的“劉三姐專題文獻數據庫”建設中專業化程度不高、效率低下等問題。同時,TPI系統在2005年通過CALIS專題特色數據庫子項目認證,可為改建后“劉三姐專題文獻數據庫”與CALIS特色數據庫共享資源預留了系統接口。

1 “劉三姐專題文獻數據庫”

關于“劉三姐”專題的各類文獻資源不但是“劉三姐”山歌文化研究、保護、開發利用的基礎資源,也是“劉三姐”山歌文化及其研究成果的重要載體,是“劉三姐”山歌文化的有機組成部分?!皠⑷銓n}文獻數據庫”依托“劉三姐”故鄉宜州,具有各種“劉三姐”山歌文化相關文獻資源豐富的優勢,通過多種途徑匯集了各類“劉三姐”研究相關文獻資料,以現代數字化、網絡化技術進行整理和共享?!皠⑷銓n}文獻數據庫”為學術界關于“劉三姐”山歌文化研究,地方“劉三姐”旅游品牌建設的規劃、決策提供完備的、便捷的文獻資料支持。同時,“劉三姐專題文獻數據庫”的文獻資料保存功能,使其還具備有非物質文化遺產的保護、傳承的作用。

1.1 原有數據庫特點

“劉三姐專題文獻數據庫”在人機界面上運用了流行的“百度”搜索引擎風格——可使用戶在使用時產生親切感,操作方式也保持與百度相似——可使用戶即使是第一次使用也可以輕松掌握使用方法。同時,“劉三姐專題文獻數據庫”的資料類型和載體類型具有豐富的多樣性特點,并按照資源類型分別建立了新聞動態數據庫、研究資料數據庫、圖片數據庫、書目數據庫、影音資料數據庫等5個子數據庫。截止2007年,數據庫及各類電子資源共397 MB,全文內容約合200萬字,包括新聞238篇、研究資料367種、圖片582張、書目47 種、影音資料84 種[3]。

從整個內容體系以及資料的時代、地域、類型結構上分析,原有數據庫收集的資源已具有較強的系統性、完整性和客觀性,數量豐富,內容詳實,具有一定的研究參考價值。

圖1 原有“劉三姐專題文獻數據庫”

1.2 原有數據庫架構

原有數據庫系統采用了B/S(瀏覽器/服務器)架構,服務器端為ASP+ACCESS的WEB服務器,客戶端為WEB瀏覽器。原有數據庫系統可對各類資料的標題與摘要進行全文檢索并且支持多條件的智能檢索[4],其中多條件智能檢索主要包括index.html、web.asp、web_detail.asp等文件。index.html文件用于接受用戶輸入的檢索詞,多個檢索詞用空格間隔;web.asp文件接受檢索詞,構造SQL語句,執行查詢,在結果列表中加亮顯示每一檢索詞;detail.asp文件顯示每一記錄的詳細信息和全文信息。原有數據庫在充分契合時下用戶的檢索習慣下,通過客戶端瀏覽器向服務器發出數據訪問請求,服務器端在本地完成數據檢索等處理,并將結果以HTML形式回傳給客戶端瀏覽器(如圖2所示)。

圖2 數據庫檢索結果

1.3 原有數據庫的局限

首先,由于在原有數據庫建設過程中從文獻資源的數字化錄入、發布、管理分別使用不同的軟件來實現,因此在工作流程上被割裂為一個個獨立的工序,需要研發人員花費大量的時間進行工序協調,建庫的效率大受影響,在大量資料需及時處理時,往往無法達到預期的目標。其次,原有數據庫系統沒有使用SQL、ORECL等主流大型數據庫管理系統,系統的安全性、穩定性、可管理性不強,隨著數據庫建設的持續進行,數據庫容量將不斷擴大,作為桌面數據庫系統的ACCESS將最終無法勝任。最后,原有數據庫的檢索功能還比較弱,主要提供單一途徑的檢索,由于缺乏專業全文搜索引擎的支持,未能實現真正意義上的全文檢索,檢索算法效率低,沒有組合檢索、結果內檢索、關聯檢索等高級檢索功能。

2 TPI系統

TPI系統是清華同方研制的用于知識信息創建、生產、管理、維護和發布的工具軟件。它采用流行的B/S瀏覽器的檢索方式和先進的3層C/S架構[5],能夠同時管理文字、圖片、多媒體等多類型信息,并能夠提供全文檢索服務、支持網頁的動態發布[6]的專業數據庫制作管理系統。以Kbase全文檢索技術為核心的TPI系統可建設基于Internet的數據倉庫,實現單位知識信息資源整合,能夠同時管理多種類型的信息資源,集成各類電子資源采集、加工,內容發布與管理,在智能搜索引擎的支持下,實現內容管理與知識挖掘,并提供全文檢索服務。

TPI系統中的“OCR識別服務”、“電子書加工工具”、“元數據加工工具”、“內容加工發布工具”等工具,可將“劉三姐專題文獻數據庫”中的紙質文獻進行數字化加工處理,使之形成可利用計算機識別、傳遞的數字化資源,而后通過特定的數字技術進行采集、制作、存儲、傳輸和發布,以此實現對現有和潛在的文獻資料進行組織、利用和管理。

3 “劉三姐專題文獻數據庫”改建方案

“劉三姐專題文獻數據庫”改建方案立足于對現有數據庫的開發、利用及擴充(即:邊擴建邊改建邊維護),使其既能發揮現有文獻信息的潛能又能使文獻內容更加豐富?!皠⑷銓n}文獻數據庫”改建過程中涉及了數據庫改建項目的組織規劃、文獻資源的數字化采集及加工、元數據的規范和標準、數據的分類導航與發布等操作流程(如圖3所示)。

圖3 “劉三姐專題文獻數據庫”改建流程

3.1 數據庫改建項目的組織規劃

我們將按照“劉三姐專題文獻數據庫”改建的目標組建可管理和可控制的各個工作單元,并組織各職能部門以及調集專業人才,為實現目標各司其職又相互協調、統一步驟,完成改建項目?!皠⑷銓n}文獻數據庫”改建項目將分解成3個工作單元。

(1)文獻采集、加工單元:承擔數據庫原始文獻的采集、甄別、評估,并按數據庫資源組織分類標準對原始文獻進行分類集中,再根據不同的資源類型采取不同的轉換與加工方法;文獻采集由具備廣博知識面、熟悉地方文獻工作和館藏、能熟練運用各種檢索手段和工具的工作人員組成,文獻加工工作主要由熟悉計算機、數碼設備的技術人員組成。

(2)資源標引、錄入單元:承擔運用IPI系統將采集加工好的數字化文獻進行標引、錄入及校檢;工作由熟悉文獻標引、編目工作,有較豐富文獻標引、著錄工作經驗的人員組成。

(3)網絡系統服務單元:承擔數據庫的發布、維護、數據備份等技術工作;工作主要由技術部門的網絡工程師和系統維護員組成。

3.2 文獻資源的數字化采集及加工

搜集文獻資源進行數字化處理加工應嚴格按照CALIS標準的統一文本格式。圖書、報刊、文件、照片、手稿、拓片、縮微平片、膠卷等各類文獻資源經過圖像掃描、OCR識別、數字圖像壓縮、用數字建模等技術處理,將重現和展示文化遺存、原始風貌、人文景觀和地域特色文化。TPI系統的“Bookshop加工工具”和“Adobe Acrobat軟件”可便捷的將如WORD、HTML等各種類型以及不同文本進行編輯整理、快速轉化、加工處理成符合CALIS標準的數字資源,以此達到CALIS嚴格的統一數據格式要求。音頻資料如原始資料CD光盤轉換為可支持網絡在線播放的WMA和MP3流媒體音頻格式;影視資料如電影《劉三姐》、舞臺劇《劉三姐》VCD、《印象劉三姐》DVD轉換為可支持網絡在線播放的RM流媒體格式。

3.3 元數據的規范和標準

元數據為描述數據庫中數字化文獻的數據,選擇適合的元數據描述將關系到數據庫文獻資源著錄與CALIS數字化、網絡化資源規范的是否一致,以便能夠在更大范圍內實現與其它CALIS特色數據庫的數據共享。元數據規范標準可以依據CALIS專題特色數據庫項目管理組頒發有關網絡信息資源、圖像資源和全文信息等元數據規范要求[7]。采用“CALIS特色數據庫建設與共享項目指定的規范”這一標準可為今后與其它CALIS成員館開展資源共享奠定技術基礎。對于元數據采集我們可以通過TPI系統提供的“元數據轉換工具”,將原有的“劉三姐專題文獻數據庫”中ACCESS格式的描述性元數據和管理性元數據轉換成符合CALIS規范的元數據并導入到改建后的“劉三姐專題文獻數據庫”中。

3.4 數據的分類導航與發布

“劉三姐專題文獻數據庫”的建設目的是實現網上共享、信息發布、資源導航、文獻傳遞等。而TPI系統能夠不需要任何其它程序編寫或網頁制作,可快速地將加工好的數據發布到因特網上,使“劉三姐專題文獻數據庫”可以被用戶更加方便快捷地瀏覽、檢索和下載。利用TPI系統的“內容加工、發布工具”,我們可以根據數據庫內容的不同預制與之相對應的不同形式和不同特點的發布模板及檢索模式,如GOOGLE風格、CNKI風格、OCLC風格、EI風格等,以及配置個性化的高級檢索界面,使數據庫形成多元化的檢索途徑,實現各個專題數據庫間的無縫銜接和跨庫檢索功能。改建后的“劉三姐專題文獻數據庫”將提供全天候的服務,可定期對數據庫數據進行更新、追加以及對數據庫運行情況進行分析、維護。

4 小結

借助TPI系統,將簡化“劉三姐專題文獻數據庫”改造與建設的工作流程,改變數據庫(包括文獻資源)更新與維護的模式,以及保證數據庫安全通暢的運行。TPI系統的運用將有助于提高研究人員的工作效率,使其擺脫繁瑣的工作程序,將主要精力集中于原始文獻資源的收集、分析及處理之上,從而進一步提高“劉三姐專題文獻數據庫”的專業品質。今后新的“劉三姐專題文獻數據庫”將不斷地得到完善,特色文獻資源質量也將不斷地得到提高,以此實現“劉三姐專題文獻數據庫”更大的實用價值,使其獲得最大的社會效益和經濟效益。

[1]寧銳.淺議高校圖書館創建特色數據庫的思路與策略[J].科技情報開發與經濟,2007,17(17):60-62.

[2]河池學院圖書館.劉三姐專題文獻數據庫[EB/OL].[2008-04-08].http://www.hcclib.net/lsj/index.html.

[3]李波.西部地方高校圖書館特色數據庫建設的實踐與思考——以《“劉三姐專題文獻數據庫”》為例[J].農業圖書情報學刊,2009,21(7):23-26.

[4]羅崗生,李波.河池學院圖書館地方特色文獻網絡信息服務平臺研究報告[DB/OL].2011-05-07.http://www.hcclib.net/intro.htm.

[5]董敏紅.基于TPI平臺的專題數據庫建設探討[J].情報探索,2010,(1):93-95.

[6]楊小琴,袁潤.基于TPI的教學參考信息系統研究[J].現代情報,2007,(9):165-166.

[7]CALIS專題文獻數據庫中心網站.項目概況[DB/OL].[2009-08-06].http://tsk.cadlis.edu.cn/tskopac/projectInfo.do.

Research on CALIS Standardized Reconstruction of the Special Bibliographic Database of Liu Sanjie with TPI

ZHOU Bo
(Library of Hechi University,Yizhou,Guangxi 546300,China)

Because such shortcomings exist in the original Special Bibliographic Database of Liu Sanjie as low retrieval capabilities and failure to meet the CALIS standards,the paper reconstructs the Special Bibliographic Database of Liu Sanjie with CALIS standards using TPI System.The reconstructed Special Bibliographic Database of Liu Sanjie will be characteristic of better management function,service function and the platforms of software and hardware,the unified CALIS standardized interfaces,which can get access to the service system of characteristic resources so as to bring about the functions of data retrieval and literature delivery,thus maximizing the benefits.

characteristic database;digital document;TPI system;CALIS standards

G250.74

A

1672-9021(2011)05-0101-06

周波(1979-),男,湖南湘潭人,河池學院圖書館助理館員,主要研究方向:數據庫、企業信息管理、Web信息融合技術研究。

廣西教育廳科研基金資助項目(201106LX612),河池學院青年科研B類資助課題(2010BN005)。

2011-06-21

[責任編輯 劉景平]

猜你喜歡
劉三姐文獻數據庫檢索
《感染、炎癥、修復》雜志檢索數據庫
《感染、炎癥、修復》雜志檢索數據庫
向往劉三姐的故鄉
論我國學術文獻數據庫的質量調控
專利檢索中“語義”的表現
中文文獻數據庫中撤銷論文的分布規律研究
尋找劉三姐(外一首)
黃四姐牽手劉三姐 同心共筑旅游夢
淺談劉三姐文化檔案
國際標準檢索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合