?

海洋科技檔案管理中的數據庫設計

2011-11-06 03:00崔愛菊周玉斌蘇天赟
海洋開發與管理 2011年5期
關鍵詞:檔案資料對象海洋

崔愛菊,周玉斌,蘇天赟,2

(1.國家海洋局第一海洋研究所 青島 266061;2.海洋沉積與環境地質國家海洋局重點實驗室 青島 266061)

海洋科技檔案管理中的數據庫設計

崔愛菊1,周玉斌1,蘇天赟1,2

(1.國家海洋局第一海洋研究所 青島 266061;2.海洋沉積與環境地質國家海洋局重點實驗室 青島 266061)

文章對目前海洋科技檔案管理的現狀和存在的問題進行了綜合的論述和分析,針對海洋科技檔案管理的特點和具體的應用需求,從數據庫管理系統、數據分類、概念結構、邏輯結構和物理結構等方面對海洋科技檔案數據庫(marine science&technology archives management system,MSTADB)進行了設計和建設,旨在為用戶提供便捷、高效的海洋科技檔案管理、查詢和獲取服務。

海洋;檔案管理;ORACLE;數據庫

海洋是一個沿海國家社會經濟發展的重要空間與資源基地,合理開發、切實保護海洋已經成為關系沿海各國生存、發展和強盛的重大戰略問題。我國擁有廣闊的管轄海域,環境條件優越,海洋資源豐富,開發利用海洋來緩解我國經濟發展中能源、資源的短缺與發展空間的不足具備現實需求的必要性和可能性。

新中國成立以來,我國政府在海洋調查和海洋科學考察方面做了大量的工作。其調查范圍從近海逐步擴展到大洋,調查方式從海面觀測逐步發展到航空航天遙感、海面觀測和水下探查。如,1958年開始的全國海洋綜合普查;20世紀80—90年代的全國海岸帶和海涂資源綜合調查和全國海島資源綜合調查以及近年來的“908”全國綜合海洋調查等。在這些科研工作中歸檔了大量的海洋科技檔案(如,調查報告、采集數據和成果圖件等),僅國家海洋局第一海洋研究所目前館藏了從新中國成立以來的各類科技檔案4000余卷。但是,絕大部分檔案以紙介質存儲為主,檔案的收集、整理、鑒定、使用和編研等都以手工為主,管理不科學,工作效率低,難以充分利用已有的海洋科技檔案資源向科研人員、管理人員和公眾提供良好的服務[1]。因此,應用先進的網絡技術、計算機技術進行瀕危檔案的數字化拯救,提高海洋科技檔案的科學管理水平,實現海洋科技檔案資料系統、全面、高效的信息化服務是我們工作的著重點[2-3]。

筆者針對海洋科技檔案管理的特點和具體的應用需求,結合先進的數據庫技術,提出了基于ORACLE的海洋科技檔案數據庫設計方案,以期對海洋科技檔案資料進行標準化、統一化存儲和管理,提高檔案資料的查詢效率和質量,提供高效的數據支撐,進而促進海洋檔案資料的數字化、信息化進程,實現我國海洋檔案資源的共建、共知和共享的目的,為建設“富饒海洋、生態海洋、安全海洋、數字海洋、和諧海洋”提供基礎支撐。

1 需求分析

隨著科技的發展和檔案管理人員素質的提高,對檔案管理提出了新的要求,目前我國在海洋科技檔案管理遇到如下問題。

1.1 歷史檔案的拯救

在20世紀90年代中期以前積累下來的海洋科技檔案資料主要以紙介質存儲為主,保存不易。同時,紙介質檔案資料的準確快速查找也非常困難,尤其是歷史檔案,索引信息不完整,如果出現文件丟失、損壞,將會造成不可彌補的損失。因此,必須進行檔案的數字化拯救,這涉及大量的數據存儲,以及檔案元數據信息的采集。

1.2 新時期快速增長的數據量

近幾年來,我國海洋事業進入了歷史上最好的發展時期,高新技術和先進儀器設備不斷地被應用到海洋調查、研究和開發等各方面,海洋科技檔案的收集也改變為紙質資料與電子資料的雙歸檔,因此資料數據量也呈幾何級數增長。

1.3 檔案存儲分散

我國目前有幾百家涉海研究單位,大量的海洋科技檔案資料都分散在各個項目承擔單位內,存放地不統一、管理不規范,并且受各個單位的管理限制,難以實現海洋科技檔案系統、統一的管理與提供開放的服務。

1.4 歸檔標準繁多

海洋開發所涉及的專業種類繁多,目前各個專業之間并沒有一個統一的分類編碼標準和規范,同時檔案資料分散在各個不同的部門,在文檔的管理方法和規則上各不相同,因此資料在整理、分卷、編目和歸檔的標準不統一,造成了對海洋科技檔案的整合和查詢非常困難,利用率較低。

目前,我國數字海洋信息框架構建工作已全面展開,因此,應用先進的信息化技術、計算機技術實現海洋科技檔案的數字化管理,搶救瀕臨破損和丟失的海洋歷史檔案資料,提高檔案資料的管理水平和工作效率,為“數字海洋”的建設提供基礎支撐,是目前我國海洋科技檔案工作迫切的任務。

2 數據庫設計

2.1 數據庫管理系統

由于在海洋開發活動中形成的科技檔案種類多,涉及的專業廣,分類編碼方法和管理工作各不相同,而且隨著海洋開發力度加大和先進技術的應用,海洋科技檔案數量的增長速度非???檔案的信息化管理實現起來存在較多困難。因此,在數據庫管理系統的選擇上,需要滿足對結構復雜、海量的檔案信息進行快速高效的存儲、維護和檢索的需求,具備大容量、高性能、全方位資料保護和系統備份架構設計等優點,能符合網絡存儲快速增長的需求,使應用系統可以方便、及時、準確地從數據庫中獲得所需的信息。

ORACLE數據庫是一種對象關系型數據庫管理系統(ORDBMS),它提供了強大的數據管理功能、分布式功能和網絡功能,支持多個用戶并發訪問,具有良好的開放性和可移植性[4]。因此,筆者在海洋科技檔案數據庫的設計上采用ORACLE數據庫來組織和管理種類繁多、格式復雜的海量檔案資料。

2.2 數據分類

經過分析,筆者針對數據類型和特點將海洋科技檔案資料分為指令性項目、開發服務項目、儀器設備、聲像和實物等幾大類,各大類數據又細分為若干子類。例如,項目信息按照課題的專業類型細分為地球科學、海洋科學和生物科學等,海洋科學又細分為海洋物理、海洋化學和海洋地球物理等子學科。依據數據分類規則,創建數據字典,編制分類代碼,開發數據字典管理模塊,便于對數據類別名稱和代碼的管理和維護。

2.3 概念結構設計

概念結構設計主要對海洋科技檔案數據對象之間的相互關系和屬性結構進行設計和定義,它是獨立于數據庫管理系統和應用操作系統的。海洋科技檔案資料包括元數據、項目、人員、單位、調查船、儀器設備和檔案文件等對象,每一個對象除了自身具有屬性結構之外,相互之間還具有一對多或者多對多的關系。如,“元數據”對象除了具有檔案名稱、檔案類別、語言、摘要、數據量、格式等屬性信息之外,還與“項目”對象具有多對一(m∶1)的關系(即一個項目可能包含多個檔案資料的元數據),同時又與“檔案文件”對象具有一對多(1∶m)的關系(即一個元數據對應多個檔案文件)。另外,“項目”對象除了具有項目名稱、項目代碼、起始時間、終止時間、坐標系統和投影方式等屬性信息外,還與“儀器設備”對象、“調查船”對象、“單位”對象分別是多對多(m∶n)的關系。這樣,通過概念結構可以清楚地對海洋科技檔案涉及的數據對象進行劃分,定義其屬性結構的名稱和類型,進一步明確數據對象之間的關系,驗證數據結構的一致性,為下一步邏輯結構的設計提供依據。

2.4 邏輯結構設計

邏輯結構設計是依賴特定的數據庫管理系統或應用操作系統的。在海洋科技檔案數據庫概念結構設計的基礎上,基于ORACLE 10g2數據庫管理系統規定的標準和格式,對數據庫的邏輯結構進行設計。在邏輯結構設計中,對概念結構中的數據對象向ORACLE 10g2所支持的關系模式進行映射。如,表和視圖等。對具體屬性結構的名稱和類型進行定義,轉換成能夠被ORACLE 10g2直接識別的關系模式。如,對于時間類型的屬性在ORACLE中定義為DA TE,變長度類型的屬性在ORACLE中定義為VARCHAR2,長二進制類型的屬性在ORACLE中定義為BLOB。

另外,在邏輯結構設計中,需要根據數據對象之間的關系(如一對多,多對多等)轉換成不同的數據庫關系表。概念結構向數據庫關系表轉換主要遵循以下原則。

(1)每一個對象可以映射為一個或多個關系表,多個對象也可以對應同一個關系表,對象的屬性即為關系表的屬性字段,對象的唯一標志(ID)是關系表的關鍵字;

(2)關聯關系(一對一、一對多以及多對多)可以映射為一個包含被關聯對象主鍵的關系表,同時也可以不進行映射,而在相關聯的對象關系表之間定義相應的外鍵;

(3)對映射后的數據庫關系表進行冗余控制調整,使其達到合理的關系范式。

例如,“項目”對象與“儀器設備”對象在概念結構中是多對多的關系,轉換成邏輯結構之后,除了各自轉換成相應的關系表,還定義一個“項目-儀器設備”關聯表,分別通過外鍵關聯將兩個關系表連接起來。

2.5 物理結構設計

海洋科技檔案數據庫的物理結構設計主要針對數據庫物理存儲空間以及外設配置進行設計,使得海洋科技檔案資料數據庫響應時間少,存儲空間利用率高,事務吞吐量大,數據安全性高,維護代價低。前已述及,海洋科技檔案數據庫采用ORACLE數據庫管理系統對數據進行管理,ORACLE數據庫提供了表空間管理模式,從邏輯上將數據存放在不同的表空間中,從物理上將數據存放在與表空間相關聯的數據文件中(圖1)。

圖1 數據庫、表空間和數據文件的對應關系

筆者利用這種表空間管理模式,對海洋科技檔案資料進行分類,將各個類別的檔案資料放在不同的表空間進行管理。同時,根據各類數據的大小和讀寫頻率設計相應的數據段、回滾段和索引段,規定每個段中數據塊的參數值,優化海洋科技檔案數據庫的性能。其中,數據段存放數據表的數據;回滾段存放被每個事務修改的數據的原有值,用于回滾事務和恢復數據庫;索引段存放索引信息,用于快速檢索數據。

3 結論

本文基于海洋科技檔案資料管理的應用需求分析,從數據庫管理系統選擇、數據分類、概念結構、邏輯結構、物理結構和安全性能等幾個方面對海洋科技檔案數據庫進行了設計,建成了海洋科技檔案數據庫,對海洋科技檔案資料進行標準化和集成化存儲和管理。另外,在該數據庫的基礎上,基于C/S與B/S混合結構開發了海洋科技檔案管理信息系統[5],實現了檔案資料信息的自動化和便捷化的管理、檢索、瀏覽、統計、輸入、輸出及格式轉換等功能,滿足我國海洋科學研究和工程建設工作對檔案資料管理的應用需要。

[1] 侯秀生.試論我國海洋檔案的管理機制與模式[J].海洋通報,2003,22(4):60-65.

[2] STIELOW,FREDERICK J.Building digital archives,descriptions,and displays:a how-to-do-it manual for archivists and librarians[M].New York:Neal-Schuman Publishers,2003.

[3] CRESPO A,GARCIA-MOLINA H.Modeling Archival Repositories for Digital Archives[R].Stanford Computer System Laboratory Technical Report,2004.

[4] 丁鋮.ORACLE8/8i數據庫系統管理[M].北京:人民郵電出版社,2001:1-5.

[5] 崔愛菊,盧銘,梁運萍.基于 C/S與B/S混合結構的海洋科技檔案管理系統的分析和設計[J].海岸工程,2005,24(4):73-82.

猜你喜歡
檔案資料對象海洋
涉稅刑事訴訟中的舉證責任——以納稅人舉證責任為考察對象
公路工程檔案資料管理的信息化創新
地質檔案資料的保密工作探析
攻略對象的心思好難猜
愛的海洋
第一章 向海洋出發
簡述基建工程檔案資料的科學化管理策略
基于熵的快速掃描法的FNEA初始對象的生成方法
區間對象族的可鎮定性分析
建筑工程檔案資料有效管理措施的應用研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合