?

編制受控詞表的著作權侵權風險及其應對策略

2022-02-08 19:41黃國彬張士男
圖書館論壇 2022年3期
關鍵詞:詞表獨創性術語

黃國彬,鄭 霞,張士男,程 冰

0 引言

受控詞表指的是為消除自然語言的模糊性、滿足信息組織和檢索的需要而編制的人工控制語言系統,旨在明晰知識組織體系概念表述的專指度和語義關系的精確度,從而提高信息檢索的質量和效率[1]。據詞表注冊網站Taxonomy Warehouse的統計,截至2020年12月底,全世界的分類表和敘詞表已達820多種[2]。在此背景下,如何維護受控詞表編制主體的合法權益,盡可能規避參與機構在編制受控詞表過程中侵犯他人著作權的風險,值得研究。從現有研究成果來看,盡管國內對受控詞表著作權問題的探討較少,但與之類似的案例,如匯編作品、數據庫作品和字詞典等侵權案件受到廣泛關注。在匯編作品的著作權方面,王遷[3]認為匯編作品的獨創性主要體現在對作品、數據或其他信息的選擇和編排上,如果匯編者并非基于個性化的主觀判斷,那么匯編的結果不能作為匯編作品受到著作權保護。在詞典的著作權方面,張平[4]分析“王同億系列著作權糾紛案件”:由王同億主編、海南出版社出版的詞典《新法編排漢語詞典》雖然與中國社會科學院語言研究所編制的《現代漢語詞典》的詞條排列方式完全不同,但各個詞條的解釋和例句相似度達到90%以上,因此法院認為《新法編排漢語詞典》侵害了《現代漢語詞典》的著作權。對數據庫的著作權問題,具有較大分歧,主要體現在對其獨創性認定標準看法不一。許春明[5]認為,數據庫的獨創性既要體現“獨立”(即獨立完成)又要體現“創作”(即創造性);任玉翠[6]認為,對數據庫的獨創性應當從寬把握,只要其內容編排選擇、界面設計等具有獨創性,那么就可以認為數據庫是一個新的匯編作品;孔德周[7]認為,由于難以對數據庫的獨創性做出明確判斷,建議為其創立特殊權利加以保護。

由此可見,當前國內對匯編作品、數據庫作品和字詞典等的著作權問題尚未形成統一定論,而對于與之在內容編排和編制過程方面存在相似之處的受控詞表,其著作權侵權風險和保護問題也需要做出進一步分析??萍嘉墨I信息的知識組織體系(Scientific&TechnologicalKnowledge Organization Systems,STKOS)[8-9]是我國首個具有自主知識產權的大型外文科技知識組織體系,是最具代表性的受控詞表。本文以受控詞表的著作權侵權問題為研究背景,以STKOS超級科技詞表為研究對象,探討受控詞表編制過程中可能面臨的著作權侵權風險及其發生的原因,并在此基礎上提出應對侵權風險的有益措施。

1 編制受控詞表引發侵權風險的原因

1.1 STKOS概述

為促進科技文獻實現從信息服務向知識服務的轉型升級,由國家科技圖書文獻中心牽頭組織,中國科學技術信息研究所、中國醫學科學院醫學信息研究所、中國科學院文獻情報中心、中國農業科學院農業信息研究所共同參與實施“面向外文科技文獻信息的知識組織體系建設與應用示范”項目[10]。項目構建的STKOS詞表是在繼承、整合、映射等基礎上,基于國際上975部來源詞表(其中核心詞表201部[11])中的1,438萬個來源科技術語,以及千萬級外文科技文獻關鍵詞和用戶檢索關鍵詞,經過原型化處理、詞形規范、語義聚類、術語優選、術語合并等而建成的外文超級科技詞表(包括基礎詞庫、概念和范疇體系3個層面),它涵蓋理工農醫四大領域、擁有609萬個基礎術語和61萬個概念,是目前覆蓋領域最廣、規模領先的大型超級外文科技詞表體系,填補了我國大型外文知識組織體系的空白[10]。

STKOS的核心是概念,將具有相同涵義的、來源不同的術語及其變體通過概念標識聯系起來,并在超級科技詞表中通過概念釋義、概念范疇、概念內的關系(同一概念各種表達形式間的關系),以及概念中譯名等多種方式加以完善和擴充。在統一的詞表集成框架體系下,表達超級科技詞表的概念,確定超級科技詞表的規范概念集。規范概念集的建設實現了來源詞表、術語基于概念的整合,在整合過程中重點解決了同義表達的問題。其編制過程主要包括以下幾個環節。首先,STKOS建立素材遴選標準、詞表元數據標準、概念遴選規范、概念名稱規范和范疇類名漢譯生成規則等一系列術語遴選加工、概念歸并提煉、關系梳理的知識組織體系建設標準規范[10]。其次,規范概念的遴選與確定:通過詞形規范、詞義規范、顆粒度控制相結合的概念歸并原則,對來源術語進行遴選、歸并,形成基礎概念,并對概念的同義表達、優選詞進一步進行遴選和規范,確定規范概念集。最后,建立并完善概念釋義、范疇等。STKOS中的概念釋義來自來源詞表、專業詞典等,基于此建立的STKOS概念體系元數據倉儲需要注明釋義來源信息。通常,此類標識主要包括各層次術語字串的代碼標識,用以規定術語定義及關系的關聯與利用,以便計算機對其進行處理和使用。

1.2 編制受控詞表引發侵權風險的原因

受控詞表的編制需要以相對客觀的知識體系作為構建依據,其獨創性會受到一定限制。而且編制過程中涉及主體較多,加之國內外對受控詞表的著作權歸屬尚未形成統一定論,因此編制受控詞表容易引發著作權侵權風險。

(1)受控詞表的獨創性受到限制,使得侵權界限難以把握。受控詞表整體的著作權主要體現在其內容的“選擇”和(或)“編排”具有獨創性。但是,各國法律對受控詞表獨創性的規定存在差異,有的要求內容的“選擇”和“編排”都必須具有獨創性,而有的法律只要求其一具有獨創性即可。需要指出的是,受控詞表的功能是標準化、一致化、統一化,起到準繩的作用,如果任由編制者在內容的“選擇”和(或)“編排”方面發揮獨創性,那么受控詞表就失去了“被普遍遵循”的意義。這與我國圖書館圖書分類法從多元到單一的發展路徑就可窺一斑。另外,受控詞表中的許多內容(如釋義)往往具有權威性、唯一性,不能任由編制者發揮獨創性,只能“原樣拿來”,甚至“照抄”,這是否存在侵權問題,法學界尚有爭論。當然,公知、公用的“通用內容”和具有獨創性內容的區別與界定往往也是一個難點。

(2)編制受控詞表涉及主體較多且缺乏有效授權。受控詞表是信息組織的語義工具,在編制過程中需要利用的資源量較大而且細碎,涉及的權利類型廣泛、權利人眾多。然而,當前有關受控詞表的著作權管理信息,或者信息完全缺失,或者授權法律制度、授權機制不健全,且存在“無主作品”“孤兒作品”等問題,大大增加了授權的周折和成本,也增加了侵權的風險。但是,如果不為編制主體提供必要的自主管理和自由編制受控詞表的權利,會致使其被迫舍棄許多重要的、核心的匯編內容,那么勢必影響受控詞表的質量,也無法使受控詞表的功能發揮最大效用。

(3)編制受控詞表的著作權法律關系較為復雜,不利于授權的實施。編制一部學科范圍廣泛、內容構成豐富的受控詞表,一個研究者的知識水平往往是有限的,且不能恰如其分地把握詞間關系,往往需要采用集體組織編制的形式來確定詞表體系結構和內容構成。在此過程中,必然產生各種法律關系,如職務創作關系、合作創作關系、委托創作關系,而且這些法律關系往往套疊、交叉,相互制約,影響詞表編制者對權利主體的判斷,進而對授權起到負面效應。

2 編制受控詞表引發侵權風險的類型

2.1 內容構成特殊引發的侵權風險

如前所述,受控詞表是一個由眾多來源詞表構成的規范化知識組織工具,在其創建和開發中,通常需要采用相關工具完成詞表類目的自動映射、自動匹配、一致性檢驗等。由于受控詞表的內容構成存在特殊性,致使其可能面臨3類著作權侵權風險。

(1)來源詞表大多數是受知識產權法律有效保護的作品。以STKOS超級科技詞表為例,對其主要核心來源詞表的知識產權情況等進行調研,發現部分著作權信息尚不明確。對受著作權法律保護且處于保護有限期內的作品,其合法使用要么依據法律規定的合理使用或法定許可,要么利用著作權擁有人讓渡的專有權,否則,必須接受著作權擁有人提供的格式協議(如“下載-同意”協議),或者是雙方經過商議后簽訂的著作權作品授權使用許可。反之,無論是否出于公益的目的,都有可能引發侵權。

(2)缺乏著作權信息的來源詞表難以適用著作權集體管理條例?!吨鳈喾?2020修訂)》規定:“使用改編、翻譯、注釋、整理、匯編已有作品而產生的作品進行出版、演出和制作錄音錄像制品,應當取得該作品的著作權人和原作品的著作權人許可,并支付報酬?!眴栴}的關鍵是,無法獲取著作權人信息的來源詞表,其著作權擁有人尚且無法知曉且無法及時聯系,更不用說支付報酬了。那么,能否由STKOS承建單位先行提取一筆專項經費,留存在著作權集體管理組織,委托其在確認著作權擁有人后代為支付報酬?依據《著作權集體管理條例(2013修訂)》第19條規定:“權利人可以與著作權集體管理組織以書面形式訂立著作權集體管理合同,授權該組織對其依法享有的著作權或者與著作權有關的權利進行管理。權利人符合章程規定加入條件的,著作權集體管理組織應當與其訂立著作權集體管理合同,不得拒絕?!比欢?,從該規定看到,著作權集體管理組織能夠代為接收作品使用者支付的使用報酬,前提是“權利人可以與著作權集體管理組織以書面形式訂立著作權集體管理合同”。對STKOS承建單位來說,目前引用的主要是無法獲得著作權信息的來源詞表,多數屬于國外法人作品,而且這些法人作品,很少與我國的著作權集體管理組織以書面形式訂立著作權集體管理合同。因此,STKOS承建單位委托我國的著作權集體管理組織向這些來源詞表的國外法人代為支付使用報酬,在實現路徑上無法可依。

(3)只要有一部詞表被控侵權就有可能引發多部詞表的侵權指控。受控詞表的建設、開發與編制通常采用集體編目的形式,且由國家資助的國家級圖書情報機構聯合承建。無論是從建設定位與建設過程,還是從投入使用后的服務范圍來看,輻射面較廣,一旦發生著作權侵權糾紛,往往很容易產生極大的負面影響。再以STKOS超級科技詞表為例,由于該詞表所有來源詞表的著作權所有人均為國外法人,一方面國外立法界、司法界和學術界會借此大做文章;另一方面,相關詞表的著作權擁有人也會進一步關注自身的詞表是否會被STKOS不合法使用。而一旦在與國外法人的侵權訴訟中敗訴,則案件的起由、敗訴的原因、判決的依據,均有可能被STKOS所使用的其他詞表國外法人所借鑒,甚至是直接作為判例依據。因此,STKOS有必要及早采取有效的應對措施,杜絕任何一起侵權糾紛的出現,更不應該也不允許出現敗訴的情形。

2.2 編制過程復雜引發的侵權風險

與其他傳統的出版物不同,編制受控詞表需要眾多組織機構協同參與、共同商討才能完成,且需借鑒和參考已有公共領域詞表,并在此基礎上進行互操作處理。也就是說,受控詞表的編制過程具有一定的復雜性和特殊性,在此過程中易產生3類侵權風險。

(1)承建單位未簽訂授權使用協議引發侵權風險。通常在編制受控詞表之前,承建機構并不與委托方簽訂授權使用協議,且這種情況較為普遍。從微觀來說,根據引用的內容(術語、概念、釋義)、引用的比例,并不是每一部來源詞表的使用都需要獲得授權許可。從宏觀分析,在所引用的沒有獲得授權的來源詞表中,出現對一部分詞表的引用,難以有充分的證據來證明其完全處于某一部現行著作權法律規定的合理使用或法定許可的范圍之內。解決這一問題的唯一出路就是簽訂使用授權協議。但STKOS在此方面的實際情況是,先發生詞表的引用行為,而對多種詞表的使用,因編制時間的限制,加上難以或無法聯系到詞表的版權擁有者,因而并沒有事先簽訂使用的授權協議。從這一角度理解,只要某部來源詞表發生侵權行為,則需要整個STKOS組織單位或承建單位承擔侵權責任。

(2)受控詞表對來源詞表的使用涉及多項著作權專有權。在編制受控詞表過程中可能涉及多項著作權專有權[12]。具體來說,第一,編制受控詞表需要引用多個來源詞表,包括其術語、概念、釋義,這就涉及“復制權”;第二,受控詞表的開發需要集合多個來源詞表,涉及著作權法中的“匯編權”;第三,在此過程中需要將相關來源詞表的術語、概念、釋義進行漢化,涉及著作權法中的“翻譯權”;第四,如果引用一部詞表的術語、概念、釋義,其篇幅超過原詞表50%,且對這些術語、概念、釋義作了相關的修改,則有可能涉及“修改權”和“保護作品完整權”;第五,對來源詞表的術語、概念、釋義進行整合、匯編后,受控詞表將可能進行網絡傳播,則涉及這些詞表的“信息網絡傳播權”。概括起來,編制受控詞表過程中,若對他人享有著作權的詞表使用不當,則有可能侵犯詞表的復制權、匯編權、翻譯權、修改權、保護作品完整權和信息網絡傳播權等6項知識產權專有權。

(3)難以有效利用“唯一表達方式”的原則應對匯編作品的著作權侵權起訴?!拔ㄒ槐磉_方式”是指對于某種思想只有一種表達方式。在對來源詞表進行引用的過程中,有部分詞表只涉及對術語的引用,能否利用“唯一表達方式”來規避受控詞表承建單位的著作權侵權風險,這需要作深入剖析。對一些來源詞表,若受控詞表的承建單位只是少量引用(引用比例和引用的絕對數均處于“少量”的狀態)某一來源詞表的術語,而不涉及其概念、范疇、釋義等細節性內容,則可以利用“唯一表達方式”作為著作權侵權的抗辯理由。當然,若存在詞表的使用不屬于前述情形,則受控詞表承建單位對來源詞表的著作權侵權風險依然存在。

2.3 法律范圍模糊引發的侵權風險

除上述因受控詞表的內容構成和編制過程可能引發的侵權風險外,受控詞表還面臨法律范圍模糊的侵權風險。

(1)來源詞表的著作權擁有人身份難以或無法確定引發侵權風險。由于構成受控詞表的來源詞表具有公開性的特點,部分來源詞表存在著作權擁有人身份不確定的情況,這必然會引發受控詞表侵犯他人著作權的法律風險。對STKOS詞表知識產權的調研顯示,無法獲取著作權信息的詞表中,存在一部分無法獲取所有權機構信息。無法獲取著作權信息意味著其著作權保護期限不明、著作權擁有人無法聯系、著作權讓渡情況不明、著作權授權協議的簽訂方式(格式協議或經雙方商量的許可協議)不明??紤]到公益性使用是法律規定的合理使用或法定許可的必要非充分條件,因此,著作權擁有人身份不明確,將使STKOS難以遵循格式協議,也無法簽署使用許可協議,進而可能引發知識產權的侵權行為。

(2)受控詞表可適用的著作權法律的不確定性引發侵權風險?,F階段國內外尚未出臺有關詞表的著作權法律規定,這對受控詞表可適用的著作權類型、著作權糾紛處理考慮因素以及后續處理措施等造成了極大困擾。比如,STKOS的詞表涉及國外法人作品,圍繞其產生的法律關系屬于涉外民事關系。在處理涉外著作權問題時,包括可適用的法定合理使用或法定許可,簽署使用許可協議,通過訴訟、調解、仲裁等方式解決著作權糾紛等,均需要首先確定可以適用的著作權法律。著作權法律的適用,優先考慮著作權擁有人和使用方雙方的事先約定,其次才是依據法律規定,在侵權糾紛處理時再選擇可以適用的法律。事實上,STKOS所使用的詞表,面臨著部分來源詞表難以甚至是無法獲得著作權人信息的困境,如何約定可以適用的著作權法律,成為完全避免侵犯他人著作權的最大瓶頸。

(3)受控詞表缺乏法律明確、直接規定的合理使用或法定許可以作為支撐。依據國內外有關國家和地區現行著作權法律的規定:無論是引用數量占原詞表的比例超過50%,或者是引用數量占原詞表的比例不高(如低于25%)但引用的絕對數量卻構成受控詞表的重要實質組成部分(如直接引用的術語量超過1,000個),均不符合英國、美國、澳大利亞現行著作權法律可以適用的合理許可范疇。畢竟,公益性使用始終是法定合理使用或法定許可的必要而非充分條件。由此可見,由于缺乏法律明確、直接規定的合理使用或法定許可的支撐,受控詞表編制當前仍存在極大的侵權風險。

3 受控詞表引發著作權侵權風險的應對策略

為應對可能引發的侵權風險,作為受控詞表編制的承擔者與直接責任主體,詞表編制者應主動學習著作權法相關規定,精準把握受控詞表的合理使用范圍,將詞表引用比例、引用方式控制在合理范圍內,并呼吁相關立法機構設置專門針對受控詞表的著作權保護權限,有效應對受控詞表編制引發的著作權侵權風險。

3.1 精準把握受控詞表的合理使用范圍

從內容構成來看,STKOS主要包括科技術語、來源術語、來源概念、來源詞表、術語相關關系(如用、用和、組代、參)、規范概念、范疇類、范疇表、術語屬性(如術語類型、注釋)等[13]。其中,概念與術語相關關系基本屬于已“約定俗成”的社會公知或常識,可直接加以引用,且不構成侵犯著作權;而對于注釋等術語屬性,則是能夠體現出詞表編制者智力創造的模塊,具有獨創性。若對已出版受控詞表中的注釋內容直接進行引用,而沒有標明出處,或者是大量引用卻沒有獲得詞表原有版權人的書面許可,則可能面臨著作權侵權問題。對此,詞表編制者應當結合版權人所在國家的政策法律、編制者所在國家的政策法律,以及雙方簽訂的雙邊協議,進一步明確受控詞表不同內容模塊的合理使用規范。

3.2 設置專門針對受控詞表的著作權保護權限

由于內容構成、編制過程、編制形式等較為特殊,受控詞表與一般作品在著作權保護方面存在區別。為了有效平衡受控詞表版權人和使用者的合法權益,詞表編制者應當借助法律手段,基于自身學科特點,從判斷標準和保護方式等方面出發,通過合理方式呼吁立法部門設置專門針對受控詞表的著作權保護權限。判斷標準方面,需要清晰界定受控詞表各內容模塊的引用情況,重點判斷其是否具有“獨創性”,并以此作為編制受控詞表是否侵犯著作權的依據;要強調受控詞表的內容不應被隨意復制和使用的權利,進一步維護詞表版權人的合法權利。

3.3 合理控制受控詞表引用的比例

盡管術語概念和詞間關系是經過打磨的人類基本共識,在編制受控詞表時可以直接引用,但是也要注意合理控制引用比例。一方面要考慮直接引用內容在原有詞表中的比例;另一方面也要考慮所引用內容和篇幅在最終形成的受控詞表中的比例。需要指出的是,隨著互聯網技術在詞表編制中的廣泛應用,網絡版受控詞表在其后臺詞表架構中,對已有詞表的引用控制較為寬松;但對于即將呈現給終端用戶的詞表系統,必須注重細節,要規范其知識組織和管理方式,合理控制引用比例。

3.4 獲取詞表版權人的授權許可

與一般作品不同,詞表的編制往往需要花費大量的時間、財力和人力成本,其出版周期也相對較長。面對這一現狀,詞表編制者應當在出版受控詞表之前,制定著作權侵權的處理方法和應對措施。一方面,在引用已有詞表時,編制者應當盡可能告知并獲得來源詞表版權人的同意;另一方面,要出版相應標準,明確引用已有詞表的方式、時間和期限。如果確實難以獲得詞表版權人的授權,也可通過公開的渠道(如公告)進行版權聲明,以爭取抗辯權。

3.5 探索受控詞表的著作權集體管理模式

積極向著作權集體管理組織尋求幫助,對受控詞表的著作權實施更規范化的保護。對確實需要為詞表版權人支付報酬的,以本國現行的著作權法律為基礎,參照著作權作品有償使用的標準,按照詞表的使用目的、范圍和方式,提前將版權許可費交予集體管理組織,由其代為保管。一旦發生著作權侵權,可以由集體管理組織代為支付賠償費用。對于經過多方努力仍無法聯系詞表版權人的,有必要請集體管理組織協助,爭取與詞表版權所有人取得聯系,以本國現行的著作權管理組織標準,依據詞表的使用范圍和方式,支付相應的使用報酬。

4 結語

受控詞表的實質是對文獻情報內容和核心概念及其相互關系進行表達的概念標識系統[14]。作為知識的組織工具,其主要功能體現在以下幾個方面:一是標引文獻情報的外在特征和內容信息;二是揭示信息資源的相關性并對內容相同或相關的情報進行集中處理;三是對大量情報加以系統化或組織化;四是比較標引用語和檢索用語的相符性?;谏鲜龇治隹芍?,編制受控詞表可能面臨的侵權風險包括:內容構成特殊引發的侵權風險、編制過程復雜引發的侵權風險以及法律范圍模糊引發的侵權風險。若對此類風險的意識和重視不足,參與人員和編制機構或將承擔一定的行政責任和民事責任。囿于篇幅有限,筆者對受控詞表編制所涉及的復雜法律關系并未作詳細闡述。隨著計算機技術在受控詞表詞匯選擇與組織中的深入應用,受控詞表的編制過程所面臨的著作權風險類型和法律后果也愈發復雜,當務之急是盡可能規避受控詞表侵權風險,做好受控詞表的著作權保護工作。

猜你喜歡
詞表獨創性術語
論非獨創性數據庫的鄰接權保護模式
基于VOLT的藏漢雙向機器翻譯
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
近十年國內外專業學術詞表建立文獻綜述*
試論我國作品獨創性的司法認定標準
中國小說與史傳文學之間的關系
文學作品的抄襲認定法律問題
有感于幾個術語的定名與應用
從術語學基本模型的演變看術語學的發展趨勢
常用聯綿詞表
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合