?

基于分布式架構的高校檔案數字化信息系統的設計與實現

2022-11-25 14:55黃寧
科技資訊 2022年21期
關鍵詞:分布式檔案館架構

黃寧

(湖北工業職業技術學院 湖北十堰 442000)

檔案是記錄人類各項活動的一種方式,也是十分重要的信息來源,可通過對既有計算機信息技術的運用,對檔案進行收集與高效管理和利用。尤其是在高等院校這一特殊范圍內,檔案工作涉及校內全體教職人員與學生的檔案信息,因而有必要實現對其信息的數字化建設與管理。由此可見,深入研究并分析基于分布式架構的高校檔案數字化信息系統的設計與實現具有一定現實意義。

1 高校檔案信息化建設的現實意義

在高校信息化全面建設以及數字校園運作階段,使院校教學、科研工作的開展獲得了必要技術手段與網絡環境[1]。特別是高校數字檔案信息資源的建設,可對檔案信息資源予以充分開發與利用。在數字檔案信息資源建設期間,能夠有效激活尚未被利用的檔案信息資源,并在計算機信息技術的作用下對其深層價值進行挖掘,將檔案信息優勢開發出來,為檔案使用者提供所需檔案信息服務。一方面,高校檔案信息的數字化發展突破了檔案利用的時空約束,可借助計算機網絡實現傳輸,為異地傳輸并利用檔案信息提供了便利,增強了檔案利用廣泛性,實現檔案信息資源共享水平的提升。另一方面,檔案信息數字化可在計算機的作用下實現快速檢索,為高新技術的應用提供幫助,同時也可進一步開發利用檔案信息資源[2]。

2 高校檔案數字化內容分析

檔案數字化屬于新型檔案信息形態,以計算機技術、多媒體技術、數據庫技術、存儲技術、數字攝影技術以及OCR 技術、掃描技術等為基礎發展而來,能夠對不同載體檔案資源進行轉化,并以數字化形式展現檔案信息,借助數字化形式進行存儲,通過網絡相互連接,在計算機系統的輔助作用下實施管理,構建結構合理的檔案信息庫,為檔案信息資源的共享與利用提供了必要保障。目前,高校檔案數字化的內容主要有兩方面。

2.1 紙質檔案的數字化

長期以來,高等院校檔案館內部檔案均通過紙質形式保存,在數字化管理傳統檔案的過程中,要求轉變紙質載體,以機讀檔案形式存在。這樣一來,不但減少紙質檔案保存的占地空間,而且查閱更加便利。所以說,高校紙質檔案的數字化發展成為檔案管理工作的主要方向[3]。

2.2 電子檔案歸檔

目前階段,高等院校運用電子教務系統與辦公自動化系統等對手工管理的形式予以替代,進而形成了海量電子文件。在眾多電子信息化系統運行期間所形成的電子文件,同樣屬于高等院校檔案的主要組成,因而檔案數字化也必然涵括電子檔案。

3 分布式檔案管理技術

3.1 高校檔案數字化建設分布式特點

較之于傳統集中式檔案管理模式,分布式檔案管理模式最大的不同在于:部分檔案的原件被保存于形成檔案機構,而無需向中心檔案館移交接受集中保存,中心檔案館僅能夠通過對檔案出處和利用方法的控制確保其存放和利用的安全性[4]。所以,綜合檔案室形成檔案原件會在本地保存,在編目處理后向中心檔案館傳遞檔案的目錄信息,并在中心檔案館的數據庫內保存。

對于高校檔案的數字化建設,數據庫引入分布式技術原理,在物理層面,數據會在計算機網絡中的各節點分布,而在邏輯層面則隸屬相同系統。所以,分布式數據庫最突出的特征為以下內容。

第一,數據庫內數據信息不會在相同計算機存儲設備中保存,因而在此系統中,綜合檔案室檔案的目錄數據會在其存儲設備中存儲,中心檔案館檔案目錄則在其專門存儲設備中存儲[5]。需要注意的是,綜合檔案室內檔案的目錄數據要在中心檔案館存儲設備中冗余存儲一份。

第二,從邏輯層面分析,數據庫內部數據之間互相聯系,所以在此系統中,綜合檔案室和中心檔案館內數據即便未在同一地方存儲,但數據間存在一定關聯。

在高校檔案數字化信息系統設計中選用分布式數據結構,選擇各綜合檔案室與中心檔案館,將其當作網絡內一節點于系統中依附。其中,中心檔案館的節點主要是配置網絡節點并加以維護。通常情況下,需將Web Service 部署于網絡各節點之上,以確保數據庫具備訪問的功能。而Web Service 在分布式數據服務提供方面發揮著基礎性作用,能夠通過網絡完成分布式計算任務。Web Service 屬于分布式技術,以組件為基礎,在跨平臺、網絡等創建過程中的應用優勢突出。整合網絡數據庫內分布的Web Service,即可使分布式數據庫訪問更加透明,為信息的交流與共享提供便利。

另外,在高校教育教學工作開展過程中會衍生不同類型自動化系統,在實際運行期間會形成電子文件,并且屬于高校檔案的重要組成,因而有必要針對其展開歸檔與存儲處理。以分布式架構為基礎的自動化系統,在信息交互協議的作用下,即可向檔案系統內導入電子文件。隨后,通過檔案系統以電子文件為對象,展開分類、編目與著錄等操作,以形成檔案,最終向數據庫內存入。

3.2 綜合檔案室和中心檔案館的信息交互

在綜合檔案室對檔案進行編目處理后即可向中心檔案館上傳,并保存檔案原件。但上傳與下載數據均需具備與規范要求相吻合的傳輸協議[6]。為此,可將各綜合檔案室當作客戶端,而中心檔案館則當作服務器端。需實現兩者的有效連接,便于客戶端、用戶的查詢,并以XML格式向服務器提交。服務器端則會將所接收的用戶查詢向本地數據庫查詢轉換,以支持一個或是多個服務器端的使用,并查詢數據庫。而最終查詢的結果會向XML格式再次轉換,以用戶要求為依據將結果集合傳回,這樣一來,客戶端可通過服務器端所接收的記錄,向終端用戶顯示前重新進行排版處理,并轉換成用戶端認可形式。

數據庫信息交互過程中,需要對源數據庫與目的數據庫數據模型種類做出準確判斷,以模型類別為基礎和XML 構建成映射的關系,向XML 文檔轉換。此后,通過XML 文檔的形式向目的數據庫內映射,最終實現信息交互目標[7]。

3.3 檔案信息化系統與其他自動化系統的集成

以辦公自動化系統和檔案系統的集成為例,對兩系統的集成展開分析。以上兩個系統并非同一系統,所以要想在檔案系統內保存辦公自動化系統內的各種文件流入、流出記錄的情況下,必須實現兩者的集成,確保檔案系統針對辦公自動化系統內的記錄展開數字化處理,完成檔案信息的處理目標。在集成方面,通常會選用面向服務的架構技術,也就是Web Service??蓪n案系統當作Web 服務的服務端,而辦公自動化系統則被當作Web服務的客戶端。

3.4 檔案資源訪問的權限和安全使用

第一,檔案系統的管理員應并根據角色的分配對權限機制進行創建。

第二,所有權限所訪問的檔案資源均需系統管理人員分配。而檔案資源保密的程度一般包括國內級別、內部級別、私密級別、機密級別與絕密級別,且各權限需對應檔案資源的級別也不同,不允許出現越級訪問的情況。所有用戶注冊保存的時候要將其真實信息輸入進去,一旦系統登錄輸入密碼的次數超過3次,則會自動對此用戶鎖定處理。用戶可對密碼進行找回操作,在將真實信息輸入后,即可重新設定密碼。

3.5 Web Service技術分析

Web Service 也被稱作XMLWeb Service,可通過因特網或是其他系統接收傳遞的請求,屬于獨立性通信技術,可在Web 上利用SOAP 所提供的軟件服務,在WSDL文件作用下進行說明,通過對UDDI的使用完成注冊。

4 基于分布式架構的高校檔案數字化信息系統的設計

4.1 系統架構分析

4.1.1 系統結構

在高校檔案數字化信息系統中,組成部分包括檔案的采集、管理、利用與系統管理這4個方面。

在檔案采集方面,需要向系統內導入不同渠道文件,以完成文件的自動編目。借助數據接口,以檔案采集流程為依據,在數據交換平臺的作用下,使信息系統與校內各個學院檔案室內的文件以統一格式向系統內采集。在獲取檔案的格式統一后即可自動完成編目,并在數據庫內存入。

在檔案管理方面,具體內容涵括檔案的統計、鑒定與銷毀三方面。統計即針對檔案內的數據進行分析與整理,鑒定即參考相關規范針對檔案實施歸檔、技術與內容鑒定,而銷毀即參考具體規定銷毀已經超過期限的檔案抑或無效檔案。

在檔案利用方面,具體指的就是檔案的檢索與借閱管理。在檢索檔案的過程中,可保證不同業務系統對檔案信息進行提取,進而以業務系統的要求展現出來。而借閱管理的內容主要有借閱、歸還、催還和預約檔案等。

在系統管理方面,具體指的就是針對有關系統的角色、權限以及用戶和日志等內容展開具體操作,即增加、修改、刪減與查看。

4.1.2 系統存儲架構分析

高等院校檔案數字化信息系統在存儲數據方面,常用存儲架構選擇“目錄-文件”,而檔案屬性信息則通過目錄數據在數據庫內進行存儲,而檔案原件則在專門的文件存儲服務器內存放,可確保數據庫內目錄信息和檔案原文相互對應[8]。借助此存儲架構,可保證多種類型檔案信息于不同存儲位置進行存放,這樣一來,即可與檔案信息對于存儲容量的需求相適應,實現容量擴充的目的。

4.1.3 系統技術路線分析

高等院校檔案數字化信息系統在融合C/S 與B/S形式的基礎上可將系統整體功能充分發揮出來。系統內檔案的采集與管理以及系統管理均借助C/S形式完成,一般通過C#語言完成開發。在檔案借閱與檢索方面則通過B/S形式完成,而技術架構為“Web/中間件/服務器”。而系統的數據接口選擇XML 作為標準,并將Web Service 標準當作數據接口與基礎服務描述的標準。

4.1.4 系統特點分析

系統能夠與其他系統集成并實現獨立運行,其內部各功能具有模塊化特征,便于對其進行二次開發。系統的操作界面具有可視化與圖形化特點,用戶在實際使用中可對各功能模塊加以利用。系統在處理業務期間可突出管理化與統一化優勢,且具有極強的擴展能力與集成能力,能夠在不同應用與硬件環境中運用,具有一定的跨平臺能力。

4.2 數據庫設計

4.2.1 概念設計

對系統進行開發的過程中,數據庫設計中會選用概念數據模型,根據用戶觀點針對數據與信息完成模型的構建,并在實體關系圖的作用下實現。概念數據模型能夠對系統內不同實體、實體間關系加以描述,是對其特性的一種靜態描述方法。概念數據模型也被稱作信息模型,基于實體聯系理論,通過對Power Designer工具的使用,對高校檔案數字化信息系統中的數據庫概念模型進行描述。

4.2.2 物理設計

系統內的數據庫實體表主要包括角色表、借閱信息表、借閱狀態表、用戶表、日志表、檔案信息表、檔案鑒定表、檔案銷毀表、館藏地表、檔案分類表、檔案狀態表、用戶查看檔案權限表、文件信息表與角色-用戶關系表。

4.3 信息交互協議設計分析

4.3.1 接口數據結構

在接口內容方面,要求檔案系統與其他自動化系統均通過JSON 格式進行傳輸,如果是多條數據,應通過數組方式進行傳遞,但要求長度≤15條,一旦數組長度超過15條,則要求通過多次服務進行調用。而在返回值方面,檔案系統和OA 系統即可借助Map 格式,向各條數據處理返回碼返回。

4.3.2 接口方式

檔案系統和OA 系統所能夠提供的服務均通過REST 形式對方調用,而提交數據則是選用POST 方式完成。

5 基于分布式架構的高校檔案數字化信息系統的測試

現階段,軟件規模明顯擴大,軟件設計復雜程度也明顯提高,很容易在開發軟件過程中出現錯誤或是缺陷。而市場對于軟件質量的重要性形成了更為系統的認知,因而為確保軟件項目的順利實施,有必要針對其展開測試。

在高校檔案數字化信息系統內部,各功能板塊緊密連接,同時還會涉及數據庫的操作與運算,通過測試不僅可確保適應功能需求,同樣亦可為系統性能提供必要保障。在系統測試中主要包括單元測試、集成測試兩部分。而集成測試則有壓力測試與功能測試兩部分。

5.1 測試環境

在壓力測試中,主要是要求多個用戶對系統進行同時操作,進而對系統處于此狀態下的CPU占用率、響應時間、內存使用狀況等相關性能指標進行測試,進而對系統處理能力以及穩定性進行驗證。

壓力測試一般借助通過工具對用戶操作進行捕捉,進而自動生成腳本,通過對單點控制的運用對并發多用戶自動執行腳本的行為進行控制,以完成性能測試。其中,通過工具由一個中心控制點,在一個或是多個主機中對大量實際用戶操作進行模擬,以形成能夠測量且重復的系統負載,對所有虛擬用戶反應時間進行記錄,對客戶端、服務器與網絡的性能數據予以自動收集,進而為分析測試結果提供必要參考。

5.2 測試結果的分析

在壓力測試后發現,此系統在功能方面與實際需求相適應,但如果是數據量較大的情況下,則很難與性能要求相滿足。為此,仍需在后續研究中將代碼質量提高,通過對商業數據庫特點的合理運用實現系統性能的提升。為此,可參考以下方案加以優化。

首先,優化索引十分重要,盡早開展可使人力成本縮減,且利于系統綜合性能的改進。其次,索引要形成文檔,同時開展變更管理工作。再次,索引構建的過程中,要對影響實時業務的程度做出考慮并科學驗證。最后,要優化程序邏輯,對相關算法進行改進。此外,要強化條件檢查力度,盡量減少循環層次,可對SQL進行批量提交,這樣也可提升系統性能。

6 結語

綜上所述,以上研究中針對高校檔案管理體系架構展開了初步研究,以分布式架構為基礎設計了檔案數字化信息系統。實現紙質檔案數字化主要是自動編目,并在數據庫內保存完成編目的檔案后再利用。而檔案歸檔可集成檔案系統和辦公自動化系統,以統一格式形式存儲于數據庫內。雖然系統設計取得了理想效果,但仍需在后續研究中采取優化措施,進而為高校檔案數字化建設提供必要幫助。

猜你喜歡
分布式檔案館架構
多四旋翼無人機系統分布式分層編隊合圍控制
居民分布式儲能系統對電網削峰填谷效果分析
功能架構在電子電氣架構開發中的應用和實踐
關于智慧檔案館與數字檔案館的關系探討
基于Paxos的分布式一致性算法的實現與優化
構建富有活力和效率的社會治理架構
VIE:從何而來,去向何方
when與while檔案館
企業架構的最佳實踐
北京市第三屆“檔案館日”活動預告
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合