?

瑞士聯邦檔案館特色功能研究及啟示

2021-07-01 20:56王志宇王曉宇
北京檔案 2021年5期
關鍵詞:知識共享引言

王志宇 王曉宇

摘要:隨著信息技術的發展和數字資源的不斷增多,公眾對檔案數據獲取的便利程度要求越來越高。瑞士聯邦檔案館記錄了瑞士兩百多年的歷史,擁有大量的檔案信息資源,在檔案的開發利用工作中,不斷探索實現檔案資源的關聯與共享模式。本文就瑞士聯邦檔案館網站的特色功能展開研究,總結瑞士檔案館檔案開發與利用的方式,并在此基礎上為國內檔案館網站建設提供可行性的參考。

關鍵詞:瑞士聯邦檔案館 語義關聯 知識共享

一、引言

瑞士聯邦檔案館創建于1798年,是瑞士的國家檔案館?!敖刂?020年,擁有超過68697MB的模擬檔案和22TB的數字檔案,以及1050MB傳輸常規文件和0.7TB的傳輸數字文檔,具有豐富的檔案館藏?!盵1]因此,在檔案的開發利用上,聯邦檔案館承擔著重要的責任。同時,數字檔案資源的日益增多,帶來了利用方式、存儲方式、發布方式等方面的變革。為了更好滿足用戶需求,瑞士聯邦檔案館運用前沿技術,把知識的關聯與共享放在重要位置,不斷創造新的服務模式?;诖?,本文從瑞士聯邦檔案館網站的特色功能出發,總結其開發與利用的方式,以期對我國檔案館的未來建設與發展起到參考作用。

二、瑞士聯邦檔案館的關聯與共享技術

瑞士聯邦檔案館提供的特色服務是以檔案數據的關聯和共享技術為核心開展的,把相關前沿技術應用于檔案管理事業的優勢和便利性在這里得到了充分體現。

(一)關聯數據技術

語義網的提出和實現,給信息世界帶來了巨大變革,數據不再是孤立存在的個體,而是知識網絡中的一份子,同時它也使數據蘊含的語義能夠被機器所理解,代替人類執行越來越復雜的任務。關聯數據技術是語義網實現的基礎,作為連接不同結構數據的一種規范,“由互聯網之父Tim Berners-Lee于2006年提出,它指代萬維網上表示和鏈接結構化數據的一系列技術,旨在建立一張計算機能夠理解的語義數據網絡,能為信息資源的廣泛關聯提供技術框架和實現途徑?!盵2]目前,關聯數據作為語義網的最佳實踐,已經形成了較為完整的體系,應用于多個領域。瑞士聯邦檔案館采用關聯數據技術,對不同機構的數據進行組織與連接,從而方便用戶的獲取。在檔案管理領域,對檔案資源及其相互關系進行語義化的描述,實現數據與數據之間的互聯互通,在節省管理成本的同時,可以使用戶更高效的獲取更大范圍的信息資源。

(二)數據共享技術

信息化時代,信息獲取能力是贏得競爭力的一個重要方面。用戶對信息流通速度的要求越來越高,數據共享的需求性也越來越大?!皵祿蚕硎侵冈诓煌攸c使用不同計算機、不同軟件的用戶能夠讀取他人數據并進行操作、運算和分析?!盵3]瑞士聯邦檔案館作為保存瑞士相關檔案資源的場所,擁有大量的數據信息。在資源的開發與利用上,聯邦檔案館將檔案資源通過內外部平臺發布出去,實現了檔案資源的深度聚合與共享。與此同時,檔案館數據庫之間的互通互訪,實現了多來源數據庫之間的資源共享,既減少了資源浪費,也提高了工作效率。在整個檔案學領域,檔案信息作為整個信息世界不可缺少的一部分,檔案機構應該在數據共享技術的基礎之上探索檔案管理模式,實現檔案資源與其他信息資源間的共享,使其融入整個信息資源體系中,促進資源的再生產和再利用。

三、瑞士聯邦檔案館網站特色功能

(一)在線訪問項目

瑞士聯邦檔案館的在線訪問項目旨在使用戶可以隨時隨地訪問聯邦檔案館的所有文件。該項目主要分為兩個部分:一個是在線門戶網站,用戶可以從www. recherche.bar.admin.ch入口進入,另一個是數字化基礎設施?!伴T戶網站已于2019年上線,并于11月25日實現了所有用戶的可在線訪問,同時項目計劃指出到2021年數字化基礎設施容量將會增加并得到完善?!盵4]在線門戶網站提供了多種搜索方式,其中,簡單搜索是指在搜索欄目中直接輸入搜索內容,搜索結果則會根據用戶權限的不同而不同。而高級檢索的搜索欄中包含有標題、元數據以及全文等在內的13個檢索項,用戶可以根據網站列出的搜索語法進行查找。此外,還擁有存檔計劃搜索和專題綜述兩個板塊。聯邦檔案館文件是按照檔案館計劃中的等級結構排列的,存檔計劃可以幫助用戶了解檔案的上下文背景,并搜尋到主題相關的檔案。專題概述是對1848年以來聯邦各州文件的匯總,一共包含9個主題,用戶可按主題進行查詢。更重要的是,四個搜索方式并非獨立存在,可支持交叉查詢。除了標題之外還會顯示參考代碼、時間段、級別等內容信息,用戶可運用篩選器過濾結果。與此同時,檔案館還提供了收藏、訂購、咨詢等服務,充分保障了用戶的查詢需求。

(二)關聯數據服務

瑞士聯邦檔案館的關聯數據服務(LINDAS)旨在使不同來源的聯邦政府、州和市政當局的結構化數據能夠跨組織的進行集成和關聯,以便在發生問題時能夠及時地獲取數據。LINDAS服務最初是由瑞士國家經濟事務秘書處(SECO)在2015年開發的,2017年聯邦檔案館開始負責運營,政府、私營部門以及個人等都可通過lindas-data.ch進行訪問。比如聯邦環境局將顯示環境領域狀況和發展的環境數據以開放數字數據集的形式提供給LINDAS,在LINDAS中,數據用戶可以制定各種查詢,并將查詢與其他數據連接起來,使用者則可以在各種應用程序中以不同的格式進行搜索和下載,免費重復的利用。更重要的是,對于數據提供者來說,數據的所有權依然在他們手中,數據只是用來創建可關聯的副本,因此LINDAS服務是非常值得信賴的。不僅節省了機構和用戶的時間與精力,還增加了數據的價值,實現了知識的組織與管理。

(三)官方出版物和數字化文檔的全文獲取

聯邦檔案館的官方出版物頁面上提供了包含官方出版物和有關歷史主題文本的數字化文檔。文檔類型一共有10種,分別為聯邦公報、官方收藏和調整后的收藏、聯邦政府的行政實踐、官方公報,會議記錄和聯邦議會談判概況、聯邦委員會的年度報告、聯邦會議紀要、州政府的法案和預算、聯邦州日歷、Helvetic Re? public中央檔案館(ASHR)的文件集合以及其他。它們都可以以文本的形式直接閱讀,原始文檔的掃描格式是PDF,皆可進行全文本搜索,為用戶帶來了極大的便利。在搜索頁面中也同樣擁有簡單搜索和高級搜索,主題分類清晰,可在線瀏覽的年限也準確標注,減少了用戶的查詢時間。此外還有按日期搜索和按內容搜索,每一個板塊都以文件夾的形式詳細分類,以便用戶能夠快速有效的獲取查詢結果。

(四)開放政府數據

瑞士開放政府數據(OGD)門戶網站(opendata. swiss)是開放的中央門戶,包含來自瑞士政府可供免費訪問的數據。目前已有86家組織機構向網站提供數據,包含人口、科學教育、金融、衛生等24個分類目錄,并且不存在任何個人數據,這些目錄由提供者自行管理。瑞士聯邦檔案館作為數據提供者之一,從2013年9月1日開始在瑞士開放政府數據門戶網站上提供免費的數據記錄,即檔案館藏中所有檔案的元數據可以自由訪問?!敖刂?020年8月,用戶可在線獲取聯邦檔案館中的384萬份文檔和257,000個文檔的元數據,包括超過25,000張預覽圖像,并且處于不斷更新的狀態?!盵5]用戶在開放政府網站的組織機構選項中查找聯邦檔案局SFA(Swiss Federal Archives),即可訪問到檔案館數據。

(五)維基媒體聚合

當今世界,信息量爆炸式增長,獲取自由和公正的知識比以往任何時候都更為重要。維基媒體(Wiki? media CH)是瑞士官方認可的非營利組織,旨在促進瑞士及其他地區知識的自由傳播。與此同時,維基百科也成為瑞士訪問量排名第五的網站,代表著屬于所有人的集體資源。目前,維基媒體正在推廣多個項目,通過與不同機構的合作,將知識組織起來,從而為用戶提供免費知識。瑞士聯邦檔案館就是維基媒體的外部合作對象之一,截至目前,檔案館一共在維基媒體上發布了三個項目,供用戶免費獲取,分別為:(1)卡爾·杜海姆(Carl Durheim)拍攝的無家可歸者照片;1852年初,伯爾尼的先驅攝影師卡爾·杜海姆受瑞士聯邦的命令,拍攝了被囚禁在伯爾尼監獄的無家可歸者和旅行者的照片。聯邦檔案館保存了相關的221張鹽紙照片,通過數字化處理將其發布在Wikimedia Commons上供大眾使用。(2)第一次世界大戰照片集;“第一次世界大戰照片集原稿由玻璃板底片組成,被存檔在《國防1848年至1950年》-E27中,聯邦檔案館對該照片集進行數字化處理,并為每個底片創建了高分辨率文檔和預覽副本?!盵6](3)日內瓦公約;聯邦檔案館將數字化的日內瓦公約原始文件和與該主題相關的其他文件發布在Wikimedia Commons上,并在檔案館網站上對這段歷史進行了簡單的闡述說明。

(六)阿爾卑斯山新鐵路線信息門戶

阿爾卑斯山新鐵路線信息門戶網站(Alptransit)是瑞士聯邦檔案館創建的用以記錄NEAT鐵路線歷史的一個在線網站(alptransit-portal.ch),是知識共享的平臺,為用戶獲取NEAT相關信息提供了便利。NEAT是穿越阿爾卑斯山的新鐵路線,是幾十年來瑞士最大的運輸項目,2015年受聯邦運輸局(FOT)委托,聯邦檔案館開始實施創建Alptransit門戶網站,并于2016年5月運行至今?!澳壳霸摼W站已記錄了從1882年Gotthard圣哥達鐵路隧道一直到今天阿爾卑斯山橫斷面的所有信息,包括文檔、照片、電影和可視化效果等各種形式,其中,瑞士聯邦檔案館館藏中就擁有與該主題相關的大約4,500個卷宗?!盵7]Alptransit門戶網站中有總覽、政治、社會、規劃、施工五大導航塊,極其詳細地記錄了鐵路線建設的整個過程。每一步的規劃、時間脈絡,都用結構化的方式清晰地向公眾和科學研究人員展示了NEAT的歷史信息。此外,聯邦檔案館還在不斷地用新資源進行擴展,盡可能地為用戶提供更全面的有關NEAT的信息資源。

(七)多來源數據庫的資源共享

聯邦檔案館為最大化地將館藏資源提供利用,通過檔案館以外的數據庫將知識共享出去,用戶可通過瑞士音像文化財產保護協會數據庫(Memobase)、瑞士外交文件數據庫(Dodis)和可共享訪問歐洲檔案的數據庫(APE)這些專門數據庫對聯邦檔案館文件進行在線研究。此外,聯邦檔案館自身作為一個知識共享的平臺,提供了訪問如瑞士國家聲音檔案館(Fonote? ca)、瑞士德語電視數據庫(FaroWeb)和國際家譜數據庫(Ancestry)的途徑,進一步擴大了知識共享的范圍。

四、瑞士聯邦檔案館的特點與啟示

(一)瑞士聯邦檔案館開發與利用方式

1.建設檔案資源利用服務平臺

在檔案資源的開發利用工作中,瑞士聯邦檔案館以自身為開發主體,根據館藏特點、用戶需求以及社會背景,創建了檔案資源利用服務平臺,如在線訪問平臺和專題網站阿爾卑斯山新鐵路線信息門戶網站,充分滿足了用戶的線上查檔需求。另外,專題性的網站還能擴充用戶的知識面,提高相關信息的了解程度。同時,在平臺設計上,為使用戶高效準確地獲取目標資源,檔案館添加了一系列便民化設計,在提高利用效率的同時,還增強了用戶與網站之間的交互性,使得針對檔案資源的開發與利用研究更加便利。

2.主題制模式

瑞士聯邦檔案館以用戶需求以及利用的便利性為出發點,采用主題制的模式,提供了包括瑞士發展史、移民史、外交政策、兩次世界大戰、婦女選舉權等在內的15個主題內容。將檔案館分散的資源按主題進行分類,一方面可以加深相關資源間的聯系,使主題與主題之間環環相扣,具有一定的內在關聯性;另一方面為用戶查檔提供了明確指引。主題之下也同樣根據內容劃分模塊,比如在“自1848年以來的外交政策”這一主題中,擁有“瑞士海外代表”“瑞士的人道主義傳統”以及“瑞士與世界組織的聯系”三大內容,清晰地結構劃分能有效縮短用戶的檢索時間。同時,用戶可根據需求下載資源的PDF版。此外,網站在每個主題中還提供了外部搜索鏈接,在一定程度上加大了開發與利用的范圍和深度。

3.開展外部交流與合作

為做好檔案資源的開發與利用工作,瑞士聯邦檔案館集合多方力量,建立合作關系。一方面積極發揮主體作用,秉持著“知識共享”的理念,根據檔案的開放程度以及檔案的內容和特點,積極與維基媒體、開放政府網站等開展外部合作,將資源免費提供出來;另一方面鼓勵公眾參與,從用戶需求的角度開發項目,建立反饋機制,設置檔案館聯絡人,并隨時更新用戶利用檔案的注意事項。比如新冠疫情期間,為了確保用戶的正常訪問,及時將相關防疫要求標注在網站首頁。瑞士聯邦檔案館有的放矢,精準制定相關措施,為用戶的知識獲取與檢索提供了便利,也進一步促進了用戶之間的數據共享。

(二)對我國檔案館網站建設的啟示

1.擴展資源共享平臺

目前,國內大多數檔案館的在線平臺只有檔案網站一個,可供用戶利用的途徑較少,呈現出內容不夠豐富、平臺量少、形式單一等特點。而信息化時代的到來,檔案利用者大多希望能夠在短時間內獲取更多地檔案信息,減少時間精力的輸出,所以實現資源共享成為檔案館建設的目標之一,也是檔案用戶的需求之一。而對于檔案館來說,要做好檔案資源的開發與利用工作,僅靠自身力量是不夠的。因此為適應時代需要,滿足利用者需求,“檔案館應該打破原有的思維定式,依靠傳統模式,充分利用信息時代的優勢,”[8]與外部網站進行合作,擴展資源共享平臺,將館藏資源多方位、立體化的提供出來。一方面根據本館館藏檔案的特點,有針對性地選擇合作對象,可以是其他檔案館,也可以是官方性的數據發布平臺;另一方面可以以某一主題的檔案為主體,創建特色專題性網站。將可開放檔案資源免費共享出去,在方便用戶使用的同時,還可以使檔案館融入其他行業,擴大“檔案”的傳播度。

2.開發適合于公眾參與的服務項目

公眾是檔案利用者,是使檔案價值發揮的對象。檔案館對檔案進行開發一定程度上也是為了滿足用戶的利用需求,因此,兩者是相輔相成的。瑞士聯邦檔案館在在線訪問項目建設過程中,發起了一項數據挑戰,希望外界能夠針對項目建設內容提出一些具有創造性的思路想法。公眾可以使用檔案館的數據搜索API編寫應用程序以改善對文檔的訪問;此外,有挑戰者為在線訪問項目創建了3個原型,并且提出了改進API的建議,這一數據挑戰使聯邦檔案館的在線訪問項目更加的成熟。因此檔案館在開發與利用工作中,也可以讓公眾適當地參與到項目建設中來,將項目進程中遇到的困難和需要改進的部分以征集的方式發布出去,以利用者的視角,為項目建設提供新思路。這不僅可以有力地提高檔案意識、擴大認知度,還能完善項目建設,更有效地為公眾提供信息服務。

3.對檔案資源進行知識關聯與組織

隨著Web3.0時代的到來,互聯網上的數據可不由網站個體獨占與孤立,數據間的關聯性以及語義化成為檔案館資源開發的目標之一。同時,隨著大眾知識水平的總體提高,用戶查詢檔案更加具有目的性,如何讓用戶快速有效地獲取更多相關信息,也是檔案館要思考的問題之一。目前,語義本體和關聯數據技術在農業、工商業、醫學等領域應用廣泛,并取得了巨大成效,因此同樣也可以將它們運用于檔案資源開發工作中?!氨倔w被認為是共享概念模型的明確的形式化規范說明?!盵9]國際檔案理事(ICA)于2016年陸續發布RIC(record in context)概念模型RIC-CM和形式本體RIC-O,目的是對檔案進行統一的,全過程的描述,對檔案資源進行知識組織與管理。因此,檔案館可以參考RIC-O及其他國際認可的本體,對各自領域的信息單元進行多層次、多維度的語義描述和組織,進而以關聯數據的形式發布出去,“將檔案資源融入社會關聯數據‘云,”[10]從而減少用戶的檢索時間,擴大用戶的檢索范圍。此外,關聯數據和語義本體具有推理功能,能夠挖掘與發現新的知識,為檔案信息資源的開發與利用提供了新的模式。

*本文為國家社會科學基金項目“非結構化電子文件管理研究”(16BTQ089)研究成果之一。

注釋及參考文獻:

[1]Swiss Federal Archives. Facts and Figures.[EB/ OL].[2020- 12- 31]. https://www.bar.admin.ch/bar/en/ home/about-us/the-federal-archives/facts-and-figures. html.

[2]大衛·伍德.關聯數據:萬維網上的結構化數據[M].蔣楠,譯.北京:人民郵電出版社,2018:3.

[3]吳鵬.高校數字校園數據共享與交換技術應用研究[D].北京工業大學,2016.

[4]Swiss Federal Archives .Project Online access.[EB/OL].[2021-02-04]. https://www.bar.admin.ch/bar/ en/home/research/searching/project-online-access.html.

[5]Swiss Federal Archives. Archive database of the Swiss Federal Archives[EB/OL].[2020-08-14]. https:// opendata.swiss/de/dataset/swiss- archives- archive- data? base-of-the-swiss-federal-archives.

[6]Swiss Federal Archives. "Active Service in the First World War" photo collection 1914-1918[EB/OL].[2019-11-25] https://www.bar.admin.ch/bar/en/home/ research/searching/search- engines- portals/wikimedia/ active-service-in-the-first-world-war--photo-col? lection-1914-19.html.

[7]Swiss Federal Archives. NRLA information por? tal.[EB/OL].[2019-11-25]. https://www.bar.admin.ch/ bar/en/home/research/searching/search- engines- por? tals/nrla.html.

[8]付永革.網絡環境下民生檔案資源開發利用方式探析[J].北京檔案,2013(10):22-25.

[9]Studer R, Benjamins V R, Fensel D. Knowledge engineering, principles and methods[J].Data and Knowl? edge Engneering,1998,25(1-2):161-197.

[10]呂元智.數字檔案資源知識“關聯”組織研究[J].檔案學研究,2012(06):44-48.

作者單位:遼寧大學歷史學院檔案系

猜你喜歡
知識共享引言
信息自由與版權法的變革
校企合作背景下高職院校學生管理制度的探索
解讀《歐也妮·葛朗臺》中金錢禁錮下的人生
基于思維導圖的線性代數復習策略
提高小學低段課堂寫字有效性的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合