?

中外學術圖書館公共域文獻資源合作存儲與開放利用研究

2024-03-04 11:04鄭雅鑫盛興軍
圖書館學刊 2024年1期
關鍵詞:版權保護學術利用

鄭雅鑫 盛興軍

(1.濱州醫學院圖書館,山東 煙臺 264003;2.上海大學圖書館,上海 200444)

作為開放獲取、免費平等使用的公共文化資源,公共域文獻是人類共有、共享的知識財富。20世紀以來,國內外對版權的過度保護、商業資本對公共域文獻資源加劇的逆向侵蝕,嚴重影響了公共域文獻資源的開放獲取和開發利用,基于此,學者們紛紛反思傳統版權制度利弊、聚焦公共域文獻開發利用研究。較早的如1982年Lange提出知識產權公共域正在被侵犯的觀點,突出強調公共域文獻作為人類知識再造原動力的功能和對于公眾文化繼承物的作用與價值[1]。2005年,美國學者Litman同樣提請學界密切關注由“版權戰爭”帶來的公共域文獻“損失、破壞和兩極化發展”[2]。在我國,梅慎實早在1990年即提出“作品的著作權消滅之后,有的作品便進入公共領域,不再屬于任何個人、法人或國家,任何人均可無償使用”[3]。之后,學者李雨峰、馮曉青更是從概念和原理出發,分別對著作權公共領域的基本性質進行了專題研究,突出強調開展公共領域研究的必要性和正當性[4-5]。

數字信息時代,作為科研創新、信息知識開放獲取主要陣地的學術圖書館,在公共域文獻資源免費獲取與開發利用方面具有不可替代的責任。因此,早在21世紀初期,美國部分學術圖書館即開展了關于公共域文獻合作保存與利用的嘗試,如康奈爾大學自2006年起便與微軟公司合作,數字化現有公共域圖書并提供Live Book Search服務供公眾使用[6]。2008年,美國高校學術聯盟“機構合作委員會”發起了HathiTrust項目,公共域文獻資源的總量超總文獻量的三分之一。同樣,早在2000年,我國在實施“中美百萬冊圖書計劃”(后為CADAL聯盟一部分)時,就特別強調公共域文獻資源收集、整理、存儲和開放利用的研究。

基于此,筆者以HathiTrust和“大學數字圖書館國際合作計劃”(CADAL)兩大公共域文獻資源存儲聯盟為個案,通過比較分析,探尋數字時代學術圖書館公共域文獻資源存儲和開放利用的有效途徑,為公共域文獻資源開放共享、平等獲取等方面的研究提供借鑒。

1 公共域文獻資源合作存儲與開放獲取利用的意義

1.1 概念解析

1.1.1 公共域與公共域文獻

公共域,即公共領域,最早源于政治學和社會學概念,作為版權制度和著作權法術語,與文獻資源密不可分,在19世紀法國《伯尼爾公約》[7]中被首次使用,最初指代版權保護期屆滿的各種作品,在后續的發展中,其范圍不斷擴大,增加有關“版權不予保護的作品”“版權作品中不受保護的內容,如思想、方法、系統等”[4]及其他資源類型。進入21世紀后,數字技術發展使得公共域文獻的概念延伸到虛擬存儲與開放獲取等諸多方面。

目前,圖書館的公共域文獻資源主要包括以下4種類型:一是版權不予保護的文獻資源及內容;二是版權保護期屆滿的文獻資源;三是經作者本人許可,供公眾免費利用和傳播的文獻資源;四是特殊情形下可合理使用版權的作品。

1.1.2 公共域背景下的開放獲取

開放獲取與公共域文獻資源在免費使用和平等共享等方面具有相似性,但二者也存在差異(見表1)。

表1 公共域文獻與開放獲取文獻比較

無論是從文獻類型、版權保護狀態還是文獻內容上,公共域文獻的范圍都更廣。究其根本,公共領域是基于文獻資源或思想的一種版權狀態而非使用狀態,公共域文獻無疑是開放獲取的重要文獻來源之一,而開放獲取則是公共域文獻資源最期望達到的使用狀態。

1.2 公共域文獻資源合作存儲與開放利用的意義

公共領域本身代表著維護所有人公共利益的契約精神,其文獻資源的規模數量、傳播利用水平及其開放度、共享程度,很大程度上影響著人類社會的知識創新活力乃至社會發展進程。公共域文獻合作存儲與開放利用既順應了數字時代信息傳播利用的要求,又有利于學術圖書館的發展和其本身價值的挖掘和利用。

在數字時代,新興信息技術的發展使得公共域文獻資源呈幾何級數增長,僅憑單一類型的信息機構難以使公共域文獻資源得到最大程度地利用,更不能為用戶提供最好的服務體驗。合作存儲和開放利用是集多方之力解決發展矛盾、擴寬信息廣度、深化服務內容的首要途徑。同時,學術圖書館自身的知識領航員性質,使其能夠充分發揮公共域資源作為人類知識文明基底的作用,建構完整學科發展脈絡,指引學者高效完成跨學科研究,發揮資源二次利用價值。同樣,對于學術圖書館本身,公共域文獻是其必不可少的資源構成之一,此舉也可合理改善其資源結構,減少版權糾紛,提高資源開放性。因此,公共域文獻資源是學術圖書館不可或缺的重要組成部分,學術圖書館的合作存儲與開放利用則是公共域文獻資源發展的最佳之路。

2 國內外學術圖書館公共域文獻資源合作存儲與利用

筆者運用文獻研究與網絡調查法,選取啟動時間相近、合作地域范圍同級、公共域文獻資源占比均達到35%以上的兩個代表性學術圖書館數字資源合作存儲與利用項目為研究對象,分別是美國的開放儲存項目HathiTrust和國內項目CADAL,擬從公共域文獻資源來源、文獻資源版權屬性界定、公共域文獻資源利用方式對二者進行深入分析。

2.1 HathiTrust項目公共域文獻資源儲存與開放獲取利用

HathiTrust項目是2008年由美國高校學術研究型圖書館聯合發起,為應對Google Book Search項目引起的商業機構對學術信息資源的壟斷而建立的非盈利性數字資源合作機構。至2021年底,HathiTrust可供用戶訪問的公共領域資源達到近七百萬卷,占總數的39%[9]。

2.1.1 HathiTrust項目公共域文獻資源來源

HathiTrust中公共域文獻資源主要由其數字圖書館項目、CRMS(版權審查管理系統)項目、聯邦文件計劃三大部分構成。

目前,由HathiTrust項目所組成的“數字圖書館”已經發展成為一個數字倉儲庫和可供訪問的、功能強大的虛擬平臺,其公共域資源主要來源于Google、Internet Archive、Microsoft合作項目以及其內部成員機構,種類繁多、綜合性強[10]。

CRMS項目及聯邦文件計劃則是具有極強針對性的專題項目,文獻類型專指度高,所屬領域相對集中,主要包括對已藏文獻資源進行版權大規模分布式調查后所形成的資源集合以及針對公共域文獻資源專題所開展的采集、審查項目[11],分為1923—1963年的美國專著、出版日期項目、Common Wealth Crown版權所有政府作品、美國州和地方政府文件4個部分。除此之外,HathiTrust項目還擴大了聯邦文件計劃并加強對包括GPO(國家印刷局)和其他聯邦機構發行出版物在內的美國聯邦出版物的數字訪問,旨在與政府出版機構合作建立一個全面的聯邦文件數字館藏[12]。這些合作計劃都在一定程度上彌補了HathiTrust公共域文獻資源的種類,增加了大量公共域文獻資源,更好地利用了項目本身的能力來挖掘公共域文獻資源。

2.1.2 HathiTrust項目文獻資源版權屬性界定

相較于Google Book Search計劃初始采取先使用后界定的版權管理方式,為明確館藏中公共域文獻資源的概念、類型與范圍,有針對性地對公共域文獻資源進行采集和利用,HathiTrust采取了主動標引的方式,實行嚴格的版權管理制度,其中包括CRMS和版權數據庫。兩種方式的具體工作內容有所關聯,詳見圖1。

圖1 Hathitrust項目版權信息管理

CRMS對HathiTrust項目收藏中作品的版權狀態進行大規模分布式調查,而版權元數據信息則由單獨的版權數據庫進行界定標引,與書目數據庫相連,共同組成每卷資源的元數據信息,其中既包含版權屬性信息,也包含確定版權屬性的原因代碼。HathiTrust項目根據這兩類信息決定該文獻資源版權元數據信息的優先級(1~5級)[13],并在更新中根據優先級數,由優先級高的版權元數據信息覆蓋低的版權元數據信息,保證了Hathitrust所藏文獻資源版權信息的準確度、清晰度和時效性。通過以上的兩種方式,Hathitrust對所藏文獻資源的版權進行嚴格的界定和管理,有效規避了版權問題的糾紛,極大程度上方便了公共域文獻資源的明確劃分和使用。

2.1.3 公共域文獻資源的利用方式

(1)一站式檢索,專題式訪問

HathiTrust將已搜集的公共域文獻資源作為數字圖書館資源重要的一部分為用戶提供開放獲取服務,訪問者既可以通過主頁一站式檢索平臺進行全文檢索,也可以通過訪問“collection”版塊,按已建成的項目進行分組訪問。其中一站式檢索平臺由HathiTrust項目在2011年與OCLC合作建立,在平臺主頁上即可實現跨庫一站式檢索[14]。檢索方式分為“全文檢索”和“目錄檢索”,“目錄檢索”中可按類型(領域)、題名、作者、主題、ISBN/ISSN、標題等選項[15]設定檢索范圍。在“檢索結果”中可使用“項目可見度”“出版日期”等功能篩選出可全視圖瀏覽的公共域文獻資源。

此外,HathiTrust還以項目主題形式對資源進行分類,供用戶瀏覽。通過訪問主頁上的“collection”[16],用戶就可輕松訪問HathiTrust項目中的公共域專題項目文獻數據集,并可通過檢索框檢索各種項目數據集的名字。

(2)分享數據集,提供分析工具

為進一步增加資源的靈活度和可用性,提供研究工具和數據挖掘服務,HathiTrust與印第安納大學和伊利諾伊大學聯合成立了研究中心(HTRC)[17],其包括算法、Data Capsules(數據膠囊)、工具集、數據集4個模塊[18]。其中,數據集模塊為用戶提供所藏文獻資源的描述性信息及研究人員合作開發的數據集,包括公共域資源的所有題錄信息及版權保護期內資源的特征信息,供用戶進行非消耗性分析——即研究人員在不直接閱讀原文本的基礎上進行分析[19]。工具集模塊為用戶提供信息分析服務,在下載數據集后,用戶可通過工具集創建所需的數據集合,并通過HTRC的算法模塊,利用基于網絡運行工具,對其中內容進行計算文本分析。而Data Capsules模塊,則為研究人員提供了單獨的、安全的線上計算環境,研究人員可在HTRC平臺上創建虛擬機(Capsule)并導入分析HathiTrust內的文本數據,為保護版權內資源合法權益,計算后結果需經過HathiTrust的審查方可導出[20]。

HathiTrust通過這些措施,擴展了公共域文獻資源范圍,增加了其有序性和二次利用的可能性,并創意性地通過非消耗性分析等方式不斷探索在不侵害原有利益情況下合理使用版權保護作品的策略。

2.2 我國“大學數字圖書館國際合作計劃”(CADAL)

CADAL源于“中美百萬冊圖書計劃”,是在信息技術發展的背景下由中美兩國計算機科學家共同發起的一項國際合作計劃[21],該計劃致力于滿足學術圖書館數字資源建設與共享的需求,并以此為目標對各學校和合作方的公共領域信息資源進行匯集和利用,在250萬冊CADAL數字資源中,除60萬尚在版權保護期內,剩余均為公共域文獻信息資源[22]。

2.2.1 CADAL項目公共域文獻資源來源

CADAL的公共域文獻資源主要來源于國內外研究型大學圖書館的館藏,其合作建設機構包括國內外高校、出版社、媒體單位等。同時,CADAL建設有“南北數字圖書館技術中心”、40所高校數字資源加工中心,并與美國互聯網檔案館(Internet Archive)合作,共同研究符合國際主流的標準體系以輔助文獻資源的收集和數字化處理[23]。筆者從文獻語種和文獻類別兩個視角展示對比CADAL內公共域文獻資源的內容(見表2)。

表2 CADAL公共域文獻資源組成

CADAL公共領域資源集中了具有學術價值、版權保護期屆滿或不受版權保護的文獻資源。值得注意的是,隨著國內外論文數據庫和各高校內部機構知識庫的快速發展和不斷完善,目前CADAL將資源建設的主要精力集中在與各合作機構共建共享特藏文獻專題數據庫項目上[23]。

2.2.2 文獻資源版權屬性界定

在最初資源建設時,CADAL主要集中建設版權明晰且經濟利益相對較低的學術性文獻,原則上不對文學作品或新出版的圖書進行數字化,以此來降低版權糾紛風險[25]。至資源利用時,CADAL主要通過數字版權保護技術(Digital Rights Management,簡稱DRM)實施版權管理,如根據IP、edu郵箱,對資源的訪問進行嚴格限制,并在此基礎上開展文獻資源的“受控數字借閱”,限制電子資源借閱副本數量,保證在不侵權的基礎上合理利用資源[23],最后在主頁提供版權問題的申訴渠道[26]。

CADAL版權管理貫穿文獻從建設到利用的全過程,發揮技術效能和版權管理的主動性,明晰版權狀態,避免復制等侵權行為,并在此基礎上開展受控數字借閱,以確保推動版權內文獻資源利用最大化。

2.2.3 CADAL公共域文獻資源的利用方式

(1)一站式檢索,主題資源展示

CADAL通過總數據庫集成為用戶提供了公共領域資源的直接訪問渠道,并通過展示各種推薦書單[27]和主題特藏數據庫[28]為用戶獲取公共域文獻資源提供了多樣化的方式。

CADAL門戶網站提供一站式檢索服務,用戶除通過名稱、作者、出版時間等進行全文檢索外,還可通過選擇出版時間、關鍵詞篩選檢索結果中版權保護期屆滿的作品。同時,CADAL設置有主題資源集合,按照載體類型對特藏資源進行專題展示,其中包括民國文獻、數字化甲骨、地方志、滿鐵資料等大量已過版權保護期的文獻,以及全球統計數據、政策庫等不受版權保護文獻的資源信息[28],用戶可根據需要分庫瀏覽。這是CADAL為用戶提供版權保護期屆滿、不受版權保護作品的主要方式。

(2)推動資源分析利用,提供知識產品和服務

CADAL還利用公共域文獻資源,通過以下兩種方式為用戶提供知識服務。一種是與中國工程科技知識中心合作,利用知領全球統計數據庫(以下簡稱“知領”)為用戶提供知領知識信息服務[29]。作為知識信息平臺,知領匯聚了大量不受版權保護的信息資源,包括全球公開的各項統計數據、國家級和省級政策及可公開的全球科研項目信息等。在此基礎上,知領為用戶提供分析工具,推動資源的二次利用,如“知領全球科研項目庫”可根據用戶搜索結果從承擔機構、承擔機構所在國家、資助機構、項目主題、學科領域等不同方面對檢索結果進行分析,并提供可選擇時間、地域、xy軸信息的自定義分析工具。另外,知領主動對所收集的信息進行整合加工,通過領域服務平臺按學科、領域等整合信息資源,為用戶開展知識服務。如材料領域設置新材料體系分類、材料專業分類、應用分類等,林業領域則提供動植物資源調查、林業統計、林業機構,同時,在學科專題內設置專業動態、最新信息模塊,持續對領域信息進行動態追蹤展示。此外,“知領·智庫觀點”還匯集了全球機構公開的智庫報告,可直接為用戶提供某一領域的知識產品[29]。另一種則是通過其數字知識服務平臺主動開展知識服務。目前,CADAL聯合各學術圖書館倡議成立數字知識服務聯盟,依托CADAL與合作方所藏的海量文獻資源,聯盟通過數字知識服務平臺開展包括知識檢索、知識揭示、知識關聯、個性化服務在內的知識型服務[23]。資源不僅包括公共域文獻資源,還擴大到版權保護期內的文獻資源。通過挖掘其中的隱性知識,在保護版權的基礎上共享海量數據。

綜上,CADAL通過主動探索和構建合作渠道的方式對公共域資源展開了二次利用,依托知領及數字知識服務平臺為用戶提供分析工具、數據集和個性化知識服務。同時,CADAL同樣積極探索版權保護內資源合理使用的途徑,進而擴大公眾所能接觸的公共域文獻資源范圍,提高知識生產創新的可能性。

通過對HathiTrust與CADAL公共域文獻資源存儲與利用的比較分析,可以看到兩個項目在版權管理、多方合作、文獻二次利用等方面具有諸多共性,而細化到措施上,兩大項目之間也存在差別(見表3)。

表3 HathiTrust與CADAL公共域文獻資源存儲與利用比較

3 公共域文獻資源合作存儲與開放利用策略

3.1 打破機構限制和地域壁壘,形成多機構資源共建聯盟

公共域文獻資源具有廣泛性和社會性特點,在版權保護之外,仍存在著類型多樣、形式復雜、具有獨特價值的公共信息。因此,要全面搜集、儲存和利用公共域文獻資源,必須聯合多方力量,形成共建聯盟。在兩個項目中,除作為主導的學術圖書館外,合作方包括政府機構、出版社、媒體、商業信息機構、情報機構、博物館、檔案館等部門機構,公共域資源范圍由此從圖書、期刊等傳統紙質類文獻擴展到政府文件、統計數據、多媒體資料(視頻、音樂、廣播、影印資料等)、生活資料(地方志等),極大豐富擴展了其內容。

除跨行業機構合作外,各國因意識形態、政治制度、社會背景、版權保護規定上的差異,嚴重阻礙了公共域資源共享利用。解決這一問題需要加強國際知識共享協議和版權保護規定的共通性、權威性建設,并根據不同文化、不同國家現狀因地制宜地支持公共域文獻資源的全域化與全球化,正如HathiTrust在版權戰略規劃中提及的,要“根據目前版權建設經驗,因地制宜進行海外資源的建設”。

3.2 掌握數字化主動權,規避商業機構壟斷與限制

大多數公共域文獻資源本身不存在財產權歸屬問題,但在數字化過程中,投入的資金和勞動力會使數字化后的復制品存在產權問題,如果所投入的資金來源于商業機構,就必然會有商業機構通過條款限制公眾使用的情況發生[30]。在HathiTrust項目中也曾發現這種問題,根據Google公司的要求,通過OCR制作的公共域文獻數字圖像不得重新托管、重新分發或用于商業用途[31],其下“Google圖書計劃”也會因為Google代理地區的限制,產生部分地區無法訪問的問題。

因此,為了保證公眾公共域文獻資源的訪問和使用權利,公益性機構如學術圖書館,要從資金、技術上全面支持公共域文獻資源數字化,采取設立數字化中心、爭取政府專項資金等方式,掌握公共域文獻資源數字化開放獲取的主動權。

3.3 積極實行主動版權管理,明確資源版權信息

主動版權管理,即在資源建設過程中通過多種方式主動明晰版權狀態,做好版權信息的標引工作。在Google圖書與HathiTrust建設之初,均受到版權部門的質疑,Google還曾因版權問題與著作權擁有者產生糾紛,最終不得不重新調整版權策略,HathiTrust則有效避免了對版權擁有者利益的損害,并實現了公共域文獻資源的合理使用。

可以看到,CADAL與HathiTrust皆在版權方面采取主動管理的形式,建立獨立的版權管理信息系統,嚴格控制不同類型信息的訪問,從而減少了版權糾紛,明確了資源的利用范圍和利用方式。具體來說,在版權界定時,應明確資源版權狀態,主動對資源的版權信息進行周期性更新檢查,掌握公共領域資源獲取的主動權,保證版權信息的準確性和公共域文獻資源開放狀態的穩定性;在資源利用時,應積極開發和利用新技術,根據用戶信息進行精確管理,開拓如受控數字借閱等用戶資源利用新形式,在保證版權不受侵犯的基礎上盡可能開拓用戶使用的邊界。

數字時代,信息類型復雜化和生產傳播渠道的變化對圖書館等信息機構版權管理方式提出了新的要求;不斷變化的法律政策和更為復雜的資源版權狀況也要求信息機構在版權管理時保證時效性和精確性。作為公共領域的捍衛者、消除版權過度保護的重要角色,學術圖書館應化被動為主動,迎戰版權所帶來的復雜問題,主動進行版權管理,搶占公共領域資源集成和利用的先機,捍衛好用戶學習研究的權利。

3.4 積極探尋版權內資源合理化轉化,拓展利用范圍

公共域文獻資源中最難界定的部分當屬版權保護作品內思想方法、內容的合理使用,關于其合理使用的討論迄今仍在持續。這部分信息對于社會而言具有極大的重要性,不僅擴大了公共域文獻資源的范圍、肯定了學術研究與非商業性研究的特殊性,而且為用戶提供了接觸版權內信息資源的機遇,增添了公共域文獻資源的時效性和創造性價值。因此,在公共域文獻資源存儲和利用的實踐中,應加強對版權信息、思想合理利用方面的探索。具體而言,一是通過與出版商合作,尋求解除對學術圖書館項目中版權內文獻資源數字化副本的借閱、復制等行為的限制。二是對版權內信息通過整合重組,挖掘其中可被利用的隱性知識成分,與其他資源一起成為二次創造的知識產品,從而產生新的價值,更好地為研究學習服務。同時,擴展公共域文獻資源的二次利用方式,有利于規避公共域文獻資源本身具有的數量龐大、類型冗雜、篇幅內容與可用信息不成正比、時效性不強等帶來的負面影響,降低用戶使用成本,充分發揮公共域文獻價值。因此,包括學術圖書館在內的信息機構除了提供公共域文獻資源的直接訪問方式外,還應充分對入庫的公共域文獻資源進行提煉和二次開發,通過提供信息分析工具、創新生成知識產品來增加公共域文獻信息的價值。

4 結語

隨著信息技術的快速發展,公共域文獻資源合作存儲和開放利用已成為發展的必然趨勢,而學術圖書館處于最佳的主導位置。HathiTrust與CADAL項目為學術圖書館進一步開展公共域文獻資源的合作存儲與開放利用提供了很好的范例。二者都能從學術圖書館實際需求出發,始終堅持促進知識共有共享、創新研究的目標,最大程度契合了公共域文獻資源存儲和開放利用的價值。同時,為社會公益機構實現打破商業信息機構的知識壟斷、維護公共域文獻的開放獲取、保障公眾共有和共享知識權益提供了切實可行的方案。

當然,如何更廣泛地打破商業機構壁壘、形成以公益性信息機構為主導、多領域共同參與的公共域文獻資源建設體系;如何更加合理地制定版權管理制度;如何更好地推動公共域文獻資源全方位、全球性合作存儲和開放共享;如何更好地挖掘資源知識創新價值,為用戶提供更便捷快速的公共服務等,都是學術圖書館仍需探討的問題。就我國而言,學術圖書館如何從法律和制度層面不斷探索符合國情的公共域文獻資源合作存儲和開放利用方式,更是值得深入思考的問題。

猜你喜歡
版權保護學術利用
利用min{a,b}的積分表示解決一類絕對值不等式
利用一半進行移多補少
圖書出版版權保護的困境與出路思考
如何理解“Curator”:一個由翻譯引發的學術思考
對學術造假重拳出擊
利用數的分解來思考
Roommate is necessary when far away from home
當前傳統媒體版權保護的難點及對策
互聯網環境下的音樂版權保護
傳統媒體版權保護面臨八大難關
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合