?

“數據”可否納入知識產權客體范疇?*

2024-02-28 09:45肖冬梅
政法論叢 2024年1期
關鍵詞:商業秘密數據原始數據

肖冬梅

(湘潭大學知識產權學院,湖南 湘潭 411105)

客體作為人類社會的一項法律制度,最早出現在《德國民法典》,我國承繼了《德國民法典》的理論和立法模式,將客體納入權利的構成要素這一理論框架中,從而形成了較為穩定的“主體-權利-客體”這一權利分析模式。毫無疑問,客體在抽象法律關系和法律權利的體系化發展過程中充當了權利具體化的必備要素,換言之,客體成為了民事權利界定的必要工具。很長時間以來,物權、知識產權、人格權及其下轄的諸多具體權利都是以權利所涉及的對象或客體來標記或命名的,因為如果沒有客體和主體概念,權利本身的定位將變得困難。[1]

范疇區分是概念法學的基本原則,也是法律確實性的必然要求,沒有固定的范疇,客體的體系建構意義和解釋功能就失去了一個可靠基礎。然而,事實上包括知識產權在內的民事權利的客體大都尚處于理論爭論狀態。于是對民事權利的客體進行范疇化的努力一直在延續?,F代以來,國內學者對知識產權客體的范疇化做了許多努力,代表性的學說有“智力成果說”、“知識產品說”、“信息說”、“形式說”、“符號說”等,其對應的客體分別是智力成果、知識產品、信息、形式、符號等。[2]2017年我國頒布《民法總則》時,首次把商業秘密納入了知識產權的客體范疇,同時頗受關注的還有:《民法總則》(征求意見稿)曾把“數據信息”作為知識產權的一類新客體,雖然這一動議最終因反對之聲頗大未獲得通過,但因此帶來的知識產權客體邊界問題尤其是“數據”是否可以納入知識產權法進行保護,并未隨著時間流逝而讓人淡忘掉,反而引發了學界、業界越來越多的討論和關注。如楊立新(2016)認為將“數據信息”作為知識產權新客體這個規定是個突出亮點[3],但齊愛民(2017)卻認為應摒棄“數據信息”這一不當概念,《民法總則》草案將“數據信息”歸為知識產權客體是一個必須更正的錯誤[4],分歧明顯。本文遵循知識產權客體的擴張邏輯,對知識產權客體的一般特征進行分析和理論解釋,從“信息鏈”理論這一視角出發,對數據與現行知識產權客體的特征進行比較研究,在此基礎上,試圖從數據整體納入知識產權客體范疇的正當性問題、哪些數據可以納入知識產權客體范疇、將部分數據納入知識產權客體范疇的具體路徑三個層面來作答,旨在為我國數據基礎制度建設提供可鑒建議,也想拋磚引玉,助力知識產權基礎理論研究的進一步深入。

一、知識產權客體的擴張邏輯與一般特征

(一)知識產權客體的擴張邏輯

現代知識產權法是一個綜合性的法律規范體系,但在許多人看來,該領域正呈現一種無序的膨脹狀態。新的制度不斷地被建立起來成為知識產權法律體系的新成員,如植物新品種、工業版權、基因等;而舊的制度如商業秘密也被吸納過來[5]。正如Robert P.Merges所言,知識產權法猶如發展中國家里無序蔓延的大城市,建筑施工隨處可見,新的成長雜亂無章,而新增的建筑并不考慮舊城原有的構造及氛圍,彌漫著一絲眩暈[6]??腕w擴張是知識產權制度變革最鮮明的外在表現。

現代以來,隨著登記制度的建立,知識產權似乎變成了一種與智力有關的無形利益的“保護范式”,不再著重強調財產的智力來源,保護創造這種帶有強烈道德色彩的價值取向在褪化[7]。隨著商標的納入,知識產權的客體大致可以分為三類:一是創造性成果,包括作品和工業技術;二是經營性標記,如商標;三是經營性資信[8]。隨著知識產權客體的持續擴張,許多單行的權利分支,諸如域名權、商號權、動植物新品種權,被不斷提出并與專利權、著作權等處于并列地位。在主體范圍相對確定的情況下,客體是決定法律關系和法律內容的主要因素。知識產權客體的范疇化也是一個有歷史的命題,發明、作品等均是本質主義思維下范疇化的結果。在前現代,也就是新的客體形態出現之前,這些范疇適用良好,但現代以來開始失去包容力,進而出現了技術與藝術的二分,思想和表達的二分。

“智力成果說”、“知識產品說”、“形式說”、“符號說”、“信息說”是關于知識產權客體形態的幾種代表性學說?!爸橇Τ晒f”出現得較早,主張智力成果說的學者認為權利的客體是人的智力創造性成果,強調對象的智力來源[9][10],商標的出現讓智力成果說顯現出了局限;“知識產品說”是對智力成果說的吸收,主張知識產品說的學者認為其所謂的知識產品指的是“人們在科學、技術、文化等精神領域所創造的產品,具有發明創造、文學藝術創作等各種表現形式”[8],并較好地將商業性標記囊括在其中,突出了對象的內容為“知識”,而“產品”強調了其是由人所創造的;而后持“形式說”的學者認為有必要明確知識的物理屬性,認為“知識的物理屬性是形式”,知識產權的對象即為形式的知識[11];而“符號說”在繼承“形式說”的基礎上,認為“任何物質都包含了質料與形式,自然物也具備天然的形式,僅用‘形式’還不足以解釋知識產權對象作為人工物的特性”[7],并借用恩斯特·卡西爾的符號學理論,將人創的“形式”進一步解釋為“符號”,因此也同時突出了“符號”的人創物屬性[7];而主張“信息說”的學者認為知識產權的對象是特定有用的“信息”[12][13],這一解釋將對象上升到了本體的高度。

如果排除“法的語境”,從純粹認識事物的角度,或言之從廣義“哲學”的角度來看待這些學說所指出的對象,這些對知識產權“對象形態”的定義是朝著描述對象的“本質形態”逼近的。上述學說對應的對象分別為:智力成果、知識產品、形式、符號、信息。從學說發展的方向來看,從智力成果到知識產品,再到形式、符號、信息,范疇的位階由下位層次范疇不斷向上位層次范疇發展,“知識”是創造性“智力成果”的上位范疇,而形式和符號又是知識的上位范疇,信息直接上升到了構成世界本原的本體的高度,范疇位階的上升表明了其所包含的內容也得到了擴大。

“智力成果說”的局限在于其只關注一元的“人的創造性”,其解釋力在商業性標記出來之后顯得捉襟見肘。而“知識說”弱化了創造性屬性,將焦點定位于對象的“非物質性”,然而近來出現的關于基因可專利問題的爭論挑戰了這一“焦點屬性”?!靶问秸f”和“符號說”將焦點定位于“外觀表達形態”,本文認為這種視點受到了歷史制度的誘導,即受到了近現代以來形成的知識產權登記制度的誘導。登記制度要求的以文字、圖案等方式按照一定格式記錄的技術方案,和以類似“可視覺性識別”表達記錄的作品才能夠取得權利。這種制度歷史形成的痕跡使得知識大部分以“形式”或“符號”的樣態得以存在,但知識存在的樣態確實是包括但不限于這種視覺性識別表達的,例如口耳相傳的“音律性”民間文藝。因而,“形式”和“符號”也是一元屬性定義的產物。而“信息說”所指向的對象——“信息”,這種上升到本體的概念毫無疑問囊括了絕大部分的非物質形態存在,但并非沒有“漏網之魚”,例如藥品,這種物質形態的存在,目前為止也是可以獲得權利的對象。

當前知識產權制度對財產的保護已經形成了一種“范式”,即授予一種有限的壟斷權利制造稀缺以保護客體利益。本文并不一味地反對擴張,但對于由理論推動而不是實踐或利益推動的擴張卻是反對的,現代知識產權制度當然地需要具備一定的前瞻性,但回顧歷史,雖然自然權利與功利主義兩種理論的此消彼長并沒有阻斷知識產權的擴張進程,跟隨著技術文化和商業經濟發展的節拍流變,但總的來說是在小心翼翼地擴張[14]。如果將已有客體形態間交叉形態的不斷出現稱作客體的橫向擴張,將超越已有客體根本形態的擴張稱為縱向擴張,那么上面所述這些學說所指向的客體范疇將使得縱向擴張過于超前,并不符合客體擴張的因果邏輯。

(二) 知識產權客體的一般特征及其理論解釋

知識產權的客體是智力成果或商業標記,其本質是一種信息?;仡欀R產權客體當前存在的形態,發明、作品、商標、商業秘密、集成電路布圖和植物新品種等等,本質主義思維下的范疇理論實踐表明,很難找到一種合乎知識產權法語境的共同屬性來將這些客體形態統一串聯起來,但能夠發現,不同客體之間卻存在著特征交叉的聯系。發明與作品的共同特征是智力創造性的成果,但發明與商標之間就很難用智力創造性聯系起來,因為現代的理論認為商標之所以成為權利客體不是因為載體標記也不是智力創造成果,而是因為商標具有顯著性,可區分性。如果不承認這一點,而是以智力創造性勉強解釋商標是存在問題的,這也是“智力成果說”局限所在。但商標與作品是具有相似性的,即可以因為都屬于“符號表達”,循此路徑,還可發現,商業秘密與專利之間存在技術性創造的共同特點;而集成電路布圖與專利存在功能性交叉,與作品存在獨創性表達的交叉等等。

從上面的敘述可以看到,如果知識產權的對象是一個“家族”,那么這個家族里面的成員的確滿足“家族相似”的特點,既便并沒有一個共同的特征來概括所有的成員,但這并不妨礙這些成員因為相互間的特征交叉而聚集在一起,或言之,在這一意義上,知識產權確實可以因為客體成員的家族相似性而成為一個體系。再來回顧知識產權客體擴張的歷史,可以發現,新增的成員是以與某個已有的“原型”成員具有相似性,因而逐漸成為知識產權家族中的新的一員,而當新增的成員越來越多的時候,這個新的成員因為也具備了多數的共同特征而具有了中心性,因而也成為了“原型”之一。最鮮明的例子就是商標,在19世紀50年代左右的英國,現代商標法制度開始形成,當時對商標的保護一開始并不是在知識產權體系中的,由于當時許多從事專利代理的人同時也從事商標代理業務,于是,商標法在形成過程中就具備了一種視野,當時的著作權法、外觀設計法甚至專利法就為此提供了一個“類比點”。當時的制造商就效法報紙商將名稱和標簽作為在出版公會進行登記的做法,他們也利用外觀設計登記簿,將標簽登記外觀設計,從而使其商標作為外觀設計獲得保護,1843年的英國《實用性外觀設計法》第9條設置了將標簽作為外觀設計進行登記的條款。[15]由此,商標漸漸的也成為了知識產權客體中的一個成員,并逐漸發展成為我們現在所熟知的形式。

而在現代知識產權法中,商標顯然已經發展成一個與專利、作品地位類似的“原型”,這種從邊緣成員發展到原型成員之間的變化是如何發生的呢?原型范疇理論中對原型的定義是,當一個成員具備所有成員中最多的共同特征時,便成為一個中心化的原型。正如當我們還認為“黃瓜”屬于水果又不屬于水果,它與水果的原型成員之一西瓜之間的相似性的多寡還有爭議的時候,這種邊緣成員因為水果攤販在販賣水果時將其與水果擺在了一起。這種額外的推動力,就如同商標代理人尋求與外觀設計獲得同等保護時,將其注冊為外觀設計是類似的邏輯,當越來越多的水果攤販將黃瓜與其他水果擺在一起,并且銷量也不錯的時候,黃瓜因此便獲得了水果中原型成員的地位。如果商標的進入可能是一個偶然,那么當我們觀察現代以來的集成電路布圖設計、植物新品種,以及商標中越來越多的非文字和圖案的形式,如聲音商標和氣味商標的納入,都是循著一種由外部需求推動,進而進入法的內部,通過與既有原型的相似性來尋求進入知識產權大門的緣由。

以本質主義來解釋客體范疇化思維是存在局限性的,因為本質主義的一元特征會造成孤立的視點,將原本廣泛聯系的兩個原型機械地割裂開來,而原型范疇理論卻與此完全不同。原型范疇理論認為,在兩個范疇之間,或者一個“家族相似性”范疇內部的兩個原型成員之間,它們彼此的界限是模糊的,在這些模糊地帶存在著許多的結合形式并有機會在這之中發展出新的原型。這一點依然可以找到歷史的依據,技術與藝術的二分,在歷史上也曾表述為專利保護機器,而著作權保護書本,這種二分法忽略了在機器與書本之間存在著許多人類創造結合了技術與藝術的諸多形式。[16]這些形式一直到商標進入了知識產權之后,智力創造從客體的要件中漸漸褪化才得以顯現,今天我們認為的“準專利”或“準著作權”所存在的保護形式,正是對這些對象形態的保護,但這些對象并不是新的,而是長期被遮蔽所導致的。

原型范疇理論中,新的原型建立所導致范疇的無中心化或中心的轉移是另一個視點。我們還是回顧在商標法進入知識產權領域之前,創造性成為了“中心要件”,主導了專利與作品這兩個原型的建立,盡管專利與作品的具體形態之間存在明顯的差異,但創造性成為了統轄兩個范疇的中心法則。而當商標進入視野,并逐漸成長為一個新的原型,三元構造的知識產權法的中心要件開始褪化、轉移,因為這個新的原型已經足夠為其他與之類似的對象形態借以與新原型的相似性而進入這個家族,而在表象上,尋求知識產權哲學本質的“傾向性”的產物——范疇成員的中心要件——創造性,開始喪失作用,因而表現出褪化。但是創造性并沒有因此而消亡,而是轉變成為了專利法中的非顯而易見性和著作權法中的獨創性,以新的形式分別獨立存在于兩個原型之中,并分別對這兩個原型的成員發揮作用。因而,知識產權法所顯現出的一種非哲學又非自然的特性,正是這些中心要件的分解、轉移所造成的。

綜上所述,原型范疇理論為我們提供了一幅這樣的圖景,即知識產權的客體范疇并不是一個封閉或即將封閉的概念體系。它因為成員間重疊的特征和相似性聚合在一起,形成了事實上的一個體系,而在這個體系中,新的成員借助于既有原型成員的相似性在外部因素的推動下不斷地進入并逐漸形成新的原型。而每一個原型從中心到邊緣是梯度變化的,人類創造的豐富對象形式存在于這種梯度性的過渡范圍中,而范疇的邊界是由原型成員模糊的邊界構成的,因而范疇的邊界也是模糊的。簡而言之,原型范疇理論描繪的知識產權客體范疇的圖景是一個多元的、開放的、無中心的體系。這就為本質主義渴望從一元特征來邏輯統轄知識產權體系做了一個否定的回答,另一方面也為客體擴張的必然性做了一個哲學注解。

二、“信息鏈”理論視角下數據與現行知識產權客體的特征比較

(一)“信息鏈”理論視角下數據與信息、知識、情報的關系

根據“信息鏈”理論,事實(fact)、數據(data)、信息(information)、知識(knowledge)、情報或智能(intelligence) 是信息鏈 (information chain) 的五個基本節點[17]。事實是客觀事物運動的表現,數據是載荷或記錄信息且按一定規則排列組合的物理符號(包括數字、文字、圖像、聲音或計算機代碼),信息是數據被賦予現實意義后在信息媒介上的映射,知識是對信息加工、吸收、提取、評價的結果;智能是被目的所激活的知識[18]?!靶畔㈡湣奔础罢J知鏈”,在信息時代,人類對描述或呈現“事實”載體或形式的認知,經歷了從情報——知識——信息這樣的一個過程,大數據時代人類對“事實”的認識則越來越依靠數據,數據被認為是荷載“事實”的最小單位?!皵祿?data)在拉丁文中是“已知”的意思,也可以理解為“事實”(Fact)[19]。人們對“事實”的認知,一是通過親身經歷,即通過“眼見”或“耳聽”;二是通過還原事實,即通過不同的載體、形式來“親歷”事實。由于親歷往往有限,所以更多的場景下我們都會選擇以形成鏈條的證據來還原事實、推定真相,如刑事偵查中的嫌犯活動軌跡研判,競爭對手博弈時的知己知彼,司法裁判中的證據說話,都是通過對荷載“事實”的信息或數據進行分析推理和預測。雖然數據、信息、知識、情報均不能夠等同于事實,但都是事實的局部反映,其中數據能最大程度地客觀接近事實。與數據相比,信息、知識、情報有不同程度的主觀性,在“信息鏈”中,數據是原始素材,信息是加工處理后有邏輯的數據,知識是經過組織的信息,情報是知識的應用,越接近事實其客觀性越大而主觀性越小,故直接源于數據的“還原”比源于信息的“還原”更加精確[20]。

從范圍角度對數據、信息、知識、情報這四者關系的定義,也是多數學者認同的觀點。數據涵蓋信息,信息涵蓋知識,知識涵蓋情報。如:“5”是一個數據,“今日溫度為5℃”為一條信息,“受冷空氣影響,溫度驟降,出現5~10℃降溫”則屬于知識,“今日降溫5~10℃,山西多地開始供暖”即為情報[21]。故主流觀點認為四者之間是包含關系,譬如數據和信息是種屬關系,數據是屬概念,信息是種概念,數據的外延包含了信息的全部外延,信息是有價值和意義的數據,知識是可以被解釋和理解的信息。

但若從離事實的遠近來看,數據比信息、知識、情報都更能還原事實或是還原真相。在當前的技術環境下,還原事實比以往任何時候都更容易,事實和數據只有一步之遙。在信息公開階段,個人隱私或企業商業秘密的風險都不及數據開放階段令人擔憂,因為一旦數據開放,其影響就會呈幾何倍數放大。

圖1

(二)數據與知識產權客體的特征比較

數據是以電子或其他方式對信息的記錄,在計算機系統中,數據是以二進制編碼序列顯示的信息。[22]一方面,數據與知識產權客體具有相似性。它們二者都有一個共同的特征,即都是無體無形物。知識產權客體是通過法律賦予其獨立性,并非是以其所承載“知識”的載體而獲得獨立性的;數據也是無體無形物,其以比特形式呈現,但并非比特本身,而是比特所承載的內容,數據不是協助民事主體取得或轉讓某種民事權利的比特,而是比特所承載的內容,因此數據也具有特定性。數據與知識產權客體二者具有相似性,可以在同一時間被多個主體使用。就客體生成的過程而言,知識產權的客體系具有創造性的智慧成果或經營性標記,此為法律擬制知識產權排他性的基礎;而數據系對信息的識別,系智慧主體“收集”生成,對于同一信息不同主體可以形成內容相似乃至相同的數據,排他性相對有限。[23]

另一方面,數據與知識產權客體又有明顯的不同。第一,數據作為知識產權客體的載體和源泉,雖然頗有淵源,但與知識產權客體卻是明顯不同的存在,正如模擬時代美術作品的客體不是那畫家用以作畫的紙張,數字時代數據也是一類載體,但客體是客體,載體是載體;第二,數據作為客體的條件及其所涉及范圍,也與知識產權的客體條件及范圍不同。知識產權客體幾乎都是人創物,但數據并非如此。創造性、非物質性、公開性和共享性是知識產權客體的一般特征[24]。創造性是指個體產生新奇獨特的、有社會價值的產品的特性,區別于已有的作品或技術,不同的知識產權客體對創造性的要求程度各不相同。根據《建立世界知識產權組織公約》第二條的規定,知識產權應當包括有關下列各項的權利:(1)文學、藝術和科學作品;(2)表演藝術家的表演以及唱片和廣播節目;(3)人類在一切活動領域里的發明;(4)科學發現;(5)工業品外觀設計;(6)商標、服務標記以及廠商名稱和牌號;(7)制止不正當競爭。無論是專利權、著作權,還是商標權都體現了發明者、作者、設計者等主體的創新性智力成果,是相關主體某種思想的客觀呈現,且是其主觀上積極取得的。而數據大多數情況下是一種客觀存在,并非人創物,如不管是手機、街角攝像頭,都是數據的自動記錄儀和采集器,由機器自動采集的原始數據不體現相關主體主觀意圖和思想。正如有學者進一步認為,作品或專利無體無形,是純粹精神創造物,而數據文件雖然無形但卻是物理上的存在[25]??梢?數據的范圍事實上與以上所列明的知識產權客體范圍不同。第三,從立法依據來看,《民法總則》(草案)第108條將“數據信息”納入知識產權客體范疇,但該規定最終未獲通過?,F行《民法典》第123條和第127條對數據作為客體與知識產權的客體做了立法上的劃分。

三、將數據整體納入知識產權客體范疇的主要問題

(一)將數據整體納入知識產權客體范疇的正當性不足

區分數據的不同類型是認識數據可否納入知識產權客體范疇的重要前提條件和基礎,不同類型的數據不宜一概而論。按照數據處理程度可以將數據分為原始數據和衍生數據。原始數據是指通過合法的方式直接從被記錄者處取得的、未經過處理的數據,最常見的原始數據有:用戶登錄信息、互聯網留下的數據備份、支付信息等。衍生數據則是基于某種特定目的,利用技術算法對原始數據進行清洗、脫敏、匿名、加工、計算、聚合等技術處理后而成的可被系統讀取的數據[26]。不管是用洛克的財產權勞動理論還是邊沁的功利主義,要論證以知識產權保護衍生數據的正當性,似乎不難,但要論證以知識產權路徑保護原始數據的正當性,似乎很難。根據主體不同,數據還可以分為個人數據、企業商業數據和國有數據,這是確定數據客體歸屬的一個重要分類方法,這種劃分是我們要更好地認識數據能否納入知識客體范疇的一個重要條件。如果我們不區分個人數據、企業數據和國家數據而全盤納入知識產權客體范疇,給予相同的保護,那無疑將存在正當性的問題。

(二)將數據整體納入知識產權客體范疇將沖擊現有知識產權保護邏輯

鄭成思認為,知識產權客體是專利、商標和作品,特別情況下行為也可以成為客體,其本質是特定的信息[24]。在持續擴張態勢下,發明、作品、商標、商業秘密、集成電路布圖和植物新品種等當前存在的知識產權客體形態,雖然很難找到一種合乎知識產權法語境的共同屬性來將這些客體形態統一串聯起來,但能夠發現,不同客體之間卻存在著相同的特征和聯系,這些客體的本質還是特定的信息,換言之,上述知識產權客體是具備不同法定條件的不同類別的信息。譬如各國專利法幾乎都規定了授予專利權的條件是滿足新穎性、創造性和實用性,商標的顯著性和作品的獨創性,則是各國商標法和著作權法將商標和作品區別于一般信息進行特殊保護的基本要求。

雖然知識產權客體一直呈擴張態勢,但如果對知識產權客體家族進行考察,不難發現,并沒有哪一種客體的增加會沖擊知識產權的保護邏輯和權能體系,發明、作品、商標、商業秘密、集成電路布圖和植物新品種等客體之間是并列關系,都是一種具備某種特質的信息,是“信息”的下位類,如商業秘密的稱謂,明顯是信息的一類,在TRIPs協議第二部分(關于知識產權的效力、范圍及使用的標準)第七節第三十九條中,被表述為“未披露過的信息”。但迄今為止,沒有哪一國立法直接將“知識”“信息”整體直接納入知識產權客體范疇,這顯然是知識產權保護的一個基本邏輯:對特定知識產權客體進行保護是手段而不是目的,保護知識產權的終極目的恰恰是為了促進知識或信息的共享和傳播,通過賦予貢獻者一定時間和空間的有限壟斷權,是促進這個目的實現的手段。

由此可見,不是所有的數據都能夠納入知識產權的客體范疇,或者說數據不宜完全納入知識產權的客體范疇。區分數據的不同類型是認識數據可否納入知識產權客體范疇的重要前提條件和基礎。事實上,對“數據可否納入知識產權客體范疇”這一問題的回答,直接決定著數據的保護模式,所以這是一個非?;A又是非常重要的問題。因此本文接下來將著重回答以下兩個問題:(1)既然不能將數據整體納入知識產權客體范疇,那么哪些數據可以納入知識產權客體范疇?(2)將部分數據納入知識產權客體范疇的可選路徑是怎樣的?

四、哪些數據可納入知識產權客體范疇?

(一)數據的分類標準及具體類型

根據不同的分類標準,數據有不一樣的類別。

(1)根據數據的重要程度和被非法獲取利用的危害程度,我國網絡空間安全領域的三大支柱性法律——《網絡安全法》《數據安全法》《個人信息保護法》,將數據劃分為核心數據、重要數據和一般數據,并對這幾類數據采取不一樣的保護規則。

(2)根據數據是否可商業交易,數據被分為商用數據和非商用數據兩種。2022年11月國家市場監管總局發布了《中華人民共和國反不正當競爭法(修訂草案征求意見稿)》,在第十八條第二款規定,“本法所稱商業數據,是指經營者依法收集、具有商業價值并采取相應技術管理措施的數據?!备鶕撘幎?只要滿足經營者依法收集、具有商業價值、采取相應技術管理措施這三大構成要件的數據,均可獲得保護。

(3)根據數據是否公開,可將數據分為公開數據和非公開數據。公開數據不能獲得商業秘密保護,非公開數據則有可能滿足商業秘密保護的要求。

(4)按照數據的處理程度,可區分為“原始數據”和“衍生數據”。這種數據分類對于本文的研究頗有意義。實踐中,按照數據的處理程度,數據既有二分法,也有三分法。二分法將數據分為“原始數據”和“衍生數據”,而三分法是在二分法的基礎上,增加了一類“創生數據”。事實上,二分法和三分法并無實質差異,因為“創生數據”事實上也是廣義的“衍生數據”,“衍生數據”既有狹義的理解,也有廣義的理解。原始數據是通過傳感器、社交網絡、移動互聯網等方式采集獲得的各類結構化、半結構化及非結構化的海量數據,是事實和客觀現象的數字化記錄。也有觀點認為,原始數據是指通過合法的方式直接從被記錄者處取得的、未經過處理的數據。最常見的原始數據有用戶登錄信息、互聯網留下的數據備份、支付信息等。從《網絡安全法》《數據安全法》《個人信息保護法》三大法來看,大多規定指向的是原始數據,是沒有經過加工的各類數據,只要是采集過來的,包括結構化的、半結構化的,甚至是非結構化的數據,都是事實和客觀現象的數字化記錄。衍生數據則是在原始數據的基礎上,經過算法的加工、計算、聚合而形成的系統的、可讀取、有使用價值的數據,如購物偏好數據、信用記錄數據集合,可形成對應的數據產品,換言之,用“數據產品”可以更加形象地表達衍生數據的結果,即通過技術處理形成的數據集合,更多的是以數據產品的形式得以呈現[24]。對于衍生數據,還有一種界定,即衍生數據是利用算法技術對散亂無序、難以直接應用的海量原始數據進行加工處理而生成的預測型、統計型、指數型數據,具有超越原始數據的應用價值和商業價值。這種定義是對結果的一種描述。比如淘寶公司“生意參謀”數據產品、阿里巴巴旗下的芝麻信用、百度指數、淘寶魔方、公司內部CRM系統、營銷系統、風控決策系統等,都是在原始數據基礎上加工形成的衍生數據,而衍生數據的俗稱,即“數據產品”。

(二)法院對不同類別數據法律屬性的認定

近年來,有關數據的糾紛頻繁發生,但梳理相關案例可以發現,在我國司法實踐中,迄今尚未對數據的法律屬性進行定性,明確表明數據究竟應該由哪一種權利進行保護。相關的裁判文書多認為數據是一種商業資源或商業競爭資源,如新浪微博訴脈脈案、大眾點評訴百度案、微播視界公司訴銳創公司不正當競爭案;或者認為數據是財產性權益,如淘寶(中國)軟件訴安徽美景案和汽車消費者投訴信息抓取案;或者認為數據是商業資本,如北京淘友天下等訴微夢創科案(見表1)。而這些判例對數據屬性的描述都暗含了對數據的財產屬性的認可。

表1

但從以上案例來看,涉案數據的類別決定了其收集或持有主體是否享有法定權益。如在“淘寶(中國)軟件訴安徽美景案”中,法院認為,淘寶公司對其數據產品依法享有競爭性財產權益,但單個用戶的數據本身并不具有直接的經濟價值,在無法律規定或合同特別約定的情況下,網絡用戶對于其提供給網絡運營者的單個用戶信息尚無獨立的財產權或財產性權益可言,故對于淘寶公司訴稱其對涉案原始數據享有財產權,法院不予支持。由此可見,數據產品被視為有競爭性財產權益,單個用戶數據則被認為無財產性權益。

(三)何種數據可納入知識產權客體范疇?

不管是理論成果還是司法判例,似乎大都否定將原始數據納入知識產權客體范疇,卻同意對衍生數據進行知識產權保護。在當前的司法實踐中,數據糾紛的起訴主體多是商主體之間,作為數據主體的個人似乎并不樂意參與糾紛。這主要是因為數據的價值性體現在成規模的數據中,單個數據的財產屬性相對于規模的數據來說財產屬性極低加之數據主體的人身受到侵犯,經過處理后的數據都是淹沒在茫茫的數據海洋里難以取證,且進行交易的數據一般都是經過脫敏或匿名化后的數據,與原始數據蘊含人身屬性不同,衍生數據由于經過技術處理,人格性逐漸與數據實現了分離[24]。

原始數據不宜納入知識產權客體范疇,一方面,是因為原始數據的屬性與現有知識產權客體的屬性迥異,不論是作品、發明、商標還是技術秘密,都可以說是有創造性的智力活動成果或具有顯著性的工商業標識,原始數據則更多的是人類特征和行動的記載,并不涉及人的智力投入,若將原始數據納入知識產權客體范疇,則與知識產權制度宗旨不符。

五、將部分數據納入知識產權客體范疇的可選路徑及其局限

由以上論述可知,不能將數據整體納入知識產權客體范疇,同樣地,知識產權客體也不能完全地排除數據,換言之,不能將數據與知識產權客體全然切割開來,機械地認為凡是數據都不能成為知識產權的客體。部分具備知識產權客體條件的衍生數據或者商業數據,可以納入到知識產權客體的范疇。具體而言,在非結構化數據或半結構化數據基礎上形成的衍生數據,或者在公共數據、混合數據(公共數據和商業數據集合)基礎上形成的商業數據,且符合某類知識產權的構成要件,是可以納入知識產權客體范疇的。需要注意的是,由于衍生數據和商業數據分別是依據不同的標準劃分出來的兩個概念,事實上二者在很大程度上呈現出交叉重合之勢。在實踐中,公共數據、平臺數據、企業數據,包括個人行為數據,都被視為商業數據。其中比較特殊的個人行為數據這塊,既屬于個人數據,又屬于商業數據。商業數據中大多是對原始數據經過算法的加工、計算、聚合,而形成的系統的、可讀取、有使用價值的衍生數據。這就意味著,將數據納入知識產權客體范疇,需要我們將目標數據集合或數據產品與知識產權的保護條件、某類知識產權客體構成要件進行審慎地對比,將那些具備某類知識產權構成要件的數據,納入到知識產權客體范疇之中。將衍生數據或商業數據納入知識產權客體范疇主要有“舊瓶裝新酒”和“老樹發新芽”兩條可選路徑。

(一)將部分數據納入知識產權客體范疇的可選路徑

“舊瓶裝新酒”路徑是指以現有知識產權客體保護數據,在我國“舊瓶裝新酒”路徑又有兩條:一是著作權和鄰接權路徑,二是商業秘密保護路徑。

1.舊瓶裝新酒:著作權和鄰接權路徑

一是數據滿足著作權法對于一般作品的規定,獲得著作權保護。著作權法保護的是創新性的表達,而不是事實、想法、程序或操作方法等。這意味著數據本身通常無法受到著作權保護。然而,如果數據被組織成一種獨特的表達,這種組織方式具有獨創性,那么這種表達可以受到著作權的保護。例如,單就一個電話簿中的名稱和電話號碼這樣的原始數據而言,是不能受到著作權的保護的,但是如果你將數據編制成一個特殊的目錄或數據庫,并且這種編制方式有一定的創新性和獨特性,那么這個目錄或數據庫就可能受到著作權的保護。

物聯網環境下原始數據正呈指數級增長態勢,大街小巷的探頭、無處不在的人臉識別、游走在人體的納米級傳感器和須臾不可分離的手機等等,都在實時收集和產生原始數據,海量的未經處理的原始數據往往難以滿足著作權法對作品的規定,所以能納入著作權保護范圍的數據,一般都是在原始數據基礎上經過處理形成的衍生數據。但并非所有的衍生數據都能獲得著作權保護,衍生數據能否構成作品獲得著作權的保護,取決于數據生成過程中能否體現人的創作性投入[27]。根據人在數據生成過程中的參與程度的差異,可以將衍生數據區分為有創作性投入的衍生數據和無創作性投入的衍生數據。若衍生數據是人從大量的統計數據中通過輔助軟件分析得出,那么,可以將其作為特定主體通過輔助工具對獨創性思想進行的表達,構成作品。但有些衍生數據是人工智能程序智能化處理原始數據、人的參與度極低的情況下自動生成的結果,缺乏人的個性化表達,不具備著作權法所要求的獨創性。雖然人對其創造的人工智能和算法享有知識產權,但是,應用算法自動產生衍生數據的過程,并不構成著作權法意義上的創作,因此,衍生數據生產者無法對機器自動生成的數據享有著作權。

二是數據匯編滿足著作權法的規定,構成匯編作品。根據《與貿易有關的知識產權協定》第十條第二款的規定,數據匯編或者其他資料匯編,不論是用機器可讀形式或者其他形式,其內容的選擇或者安排屬于智力創作的,應予以保護,但此種保護不及于數據或者資料本身。我國《著作權法》第十五條則規定,匯編若干作品、作品的片段或者不構成作品的數據或者其他材料,對其內容的選擇或者編排體現獨創性的作品,為匯編作品。如在“四維圖新訴奇虎等公司”一案中,雖然一審法院認為涉案導航電子地圖不構成著作權法的規定的地圖作品,但二審法院認為導航電子地圖作為地圖數據產品,對于地物、地貌、信息點的選擇取舍,對于地物、地貌的繪圖顏色、標注,以及繪制方式的選擇取舍都體現了獨創性,因此構成地圖作品[28]。在“if影響因子”數據庫著作權侵權糾紛案中,一審、二審法院認為原告所擁有的“期刊引證報告”在對相關數據的選擇、編排上具有獨創性,構成匯編作品[29]。

三是以鄰接權保護不具獨創性的數據庫(衍生數據)。根據我國著作權法規定,鄰接權包括表演者權、錄制者權、廣播組織權和版式設計權,袁博認為,為回應實踐的需要,應當合理擴充鄰接權的范圍,如將那些“辛勤收集”的有價值的數據信息但在編排上缺乏獨創性的數據庫,納入著作權法中的“鄰接權”的保護范圍,因為創編數據庫的勞動主要在于前期數據的采集而非后期的選擇與編排。[30]鄰接權的立法目的是為了保護作品的傳播,在原始數據基礎上產生的衍生數據的價值恰好在于傳播和利用。故林華認為,通過鄰接權來保護不具有獨創性的衍生數據,與其他現有立法模式相比,更加合乎邏輯和法理,也具有更高的操作性[31]。

值得注意的是,歐盟理事會1996年通過的《關于數據庫法律保護的指令》對那些有實質性投資卻未能獲著作權法保護的數據庫賦以特殊權利,該權利人有權禁止他人對其數據庫進行復制、發行、出租和傳播。由于指令需通過成員國的國內法予以落地,歐盟有成員國如德國、意大利,都將這項權利納入其已有的領接權制度體系,如德國2008年在其著作權法的“與著作權有關的權利保護”部分新增“對數據庫制作人的保護”,意大利在1999年修訂著作權法時在“與著作權行使相關權利的規定”中增加了“數據庫創建者權利、用戶權利及義務”的相關內容。歐盟成員國中也有國家對其采取單獨立法的,即將這項特別權利獨立于著作權和鄰接權。

2.舊瓶裝新酒:商業秘密保護路徑

數據可以作為商業秘密來保護,但它需要滿足一些特定的條件。商業秘密是指不為公眾所知的,能為其持有者帶來經濟利益,具有實用性,并且其持有者已經采取了相應的措施來保守其秘密的信息。作為商業秘密保護的數據,通常指的是持有者的特殊數據集,如上文所述衍生數據或商業數據,用戶數據、算法、研究數據等。這些數據集若對持有者的競爭地位有重要影響,并且公司已經采取了相應的保密措施來保護這些數據,那么這些數據就可以作為商業秘密受到法律保護。需要注意的是,原始數據或者公共數據,比如天氣數據、市場行情等一般不能作為商業秘密保護。同時,如果持有者沒有采取合理的保密措施來保護這些數據,那么這些數據不能作為商業秘密保護。

從法律特征來看,衍生數據具有非人格性、可控制性、價值性等財產屬性,屬于智力勞動創造的無形財產,即智力成果。有學者提出,未公開的衍生數據符合商業秘密的構成要件[31]。以商業秘密來保護未公開衍生數據,能夠為權利人帶來現實或者潛在的經濟利益或競爭優勢。事實上在實踐中,運用商業秘密保護未公開數據是當事人在匯編作品之外選取的另外一條專門法保護路徑。如在萬聯網絡訴周惠民侵害商業秘密糾紛案[32]、北京何晨亮等侵犯商業秘密糾紛案[33]中,法院肯定了原告網站數據庫中的用戶信息等數據能為原告帶來經濟利益,具有實用性,不易為相關領域人員普遍知悉和容易獲得,且采取了保密措施,符合商業秘密的構成要件。2019年《反不正當競爭法》修訂后,增加了電子侵入的侵權手段,且將商業秘密的范圍在技術信息和經營信息之外又增加了“等”字。這一點看似解決了以商業秘密保護數據的法律障礙。

對未公開數據主張商業秘密,這就意味著,未公開數據須滿足三個條件:不為公眾知悉、具有商業價值、權利人采取保密措施。一般情況下,衍生數據作為企業獲取經濟利益的重要資源,企業必然會采取一定的保護措施,而這一層面的事實在訴訟當中也不存在舉證難度。所以,企業衍生數據要滿足一定的保密條件這一要件并不困難。

3.老樹發新芽:在知識產權之下新設一種數據專有權

衍生數據作為一類智力成果,區別于信息、數據庫,具有重要的財產價值。衍生數據具有無形性、專有性、可復制性等知識產權通常所共有的特點,然而卻不具有地域性、時間性等特點,因此基于衍生數據建立的數據專有權是一種新型知識產權[34]?!睹穹ǖ洹返?23條開放性地規定了知識產權的客體,符合知識產權客體屬性但未明確列舉的“法律規定的其他客體”,該條款似乎為數據納入知識產權客體范疇提供了法律依據。近年來,有多位學者先后提出了要在知識產權之下新設一種數據專有權。楊立新(2016)提出,應以公開衍生數據為客體創設新型知識產權——數據專有權,與著作權、專利權、商標權等并列[35]??紫榭?2022)提出,由于數據與知識產權都具有無體財產、蘊含價值需要發掘等共性,因此數據可歸入知識產權的無體財產保護,進一步要探討的問題則是數據能否作為新的知識產權類型進行保護,抑或有必要創建一種新的知識產權類型。其實,數據是信息的載體,信息是數據的表達。信息層面的數據法律關系可以受專利法、商標法、著作權法的規制。反不正當競爭法既保護具體權利,也保護一般性的權益,同時其具有“孵化性”,也可以對未來可能出現但當下還不能確定的權益進行預先保護[36]??紫榭∵€結合工業產權的歷史邏輯和制度內涵,認為商業數據權可歸入工業產權范疇,成為獨立的新型工業產權類型。[37]高陽(2022)則認為,企業衍生數據具有非物質性、非競爭性、不發生有形損耗的占有,符合知識產權客體的特征,但卻不屬于傳統的知識產權客體,基于勞動賦權理論和激勵創新理論,應為企業衍生數據設定新型知識產權[38]。由以上可知,學界似乎在知識產權框架下新設數據專有權達成了一定程度上的共識。

(二)將部分數據納入知識產權客體范疇的局限

1.以著作權或鄰接權保護數據的局限

舊壺裝新酒雖然也不失為一種解決方案,但采用著作權法的路徑來保護衍生數據,不免還是具有其天然的局限性。一是很多衍生數據并不能滿足獨創性條件,因為衍生數據的核心價值主要體現為深度挖掘、分析、提煉、整合數據內容獲得有用信息,而不在于數據經選擇、編排后形成的結構順序。著作權法保護的作品以具有獨創性為必要條件,而衍生數據是根據事先選定的算法自動生成的,信息表達缺少受著作權保護作品所要求的獨創性。二是著作權僅保護以衍生數據為基礎形成的表達,不保護衍生數據本身。衍生數據是數據控制者借助計算機程序或算法進行技術處理而自動生成的,而非作者自己選擇、取舍、安排、設計的結果,故衍生數據所呈現的信息本身不符合受著作權保護的作品所要求的須由人腦思維自主產生獨創性。

將收集到的用戶數據進行匿名化加工處理之后產生的數據產品,其數據的權屬其實已經有所變化。最顯而易見的就是原始數據中的人格屬性在逐步消失,其數據權屬由個人轉變到了數據產品生產方,數據的財產價值已然產生。數據產品經過生產方的采集、整合、匯總的手段似乎可以看作勞動,形成了智力成果。這類成果似乎也已經滿足知識產權制度中關于匯編作品的保護需求,但事實并非如此,企業衍生數據的價值在于數據內容本身,而非編排結構上的獨創性,企業對數據進行采集、編排需尊重原始數據,在數據選擇和編排上的個性化選擇空間有限,難以達到匯編作品的獨創性要求。當企業數據集合的獨創性未滿足最低要求,該數據集合將無法獲得財產規則下賦權模式的保護。例如在大眾點評訴愛幫網的著作權糾紛案[39]中,法院認為,大眾點評中的網友點評信息的時間排序方式是一種常見的排列方式,并非具有獨創性,得出大眾點評網中關于餐廳的介紹與網友點評不構成著作權意義上的匯編作品的結論。由此可看出,是否構成著作權法意義上的作品,前提就是需要具有獨創性,法律保護的也只是數據集合的獨創性本身。

2.以商業秘密保護數據的局限

采用商業秘密保護衍生數據,也有其不足之處。主要體現在如下三個方面:

一是商業秘密不保護公開的衍生數據。商業秘密的秘密性和保密性要求使得該保護路徑僅適用于未公開的數據,所以在大數據時代,大量公開數據都不具備納入商業秘密的范圍進行保護的條件。

二是即使是未公開的衍生數據,也需要滿足法定條件,才能獲得商業秘密的保護。目前商業秘密的保護門檻較高,對于互聯網平臺上積累的海量用戶數據,如微博上的大量用戶言論、大眾點評上的用戶評論等無法獲得商業秘密的保護。由于企業數據具有海量、來源廣的特點,通常是數據收集者經過大范圍收集公開或從被授權收集信息中經過加工整理得到的,該類數據是否滿足秘密性的要求,是企業數據商業秘密保護的基本門檻。同時,企業數據所采取的保密措施通常只限于收集、處理過程的必要技術手段,這些手段是否構成法律上的合理保密措施有待在個案中予以證明。上述要求使得相當一部分企業數據難以達到商業秘密的構成要件。

三是未公開數據以商業秘密方式進行保護也有其不足。對于不公開的衍生數據僅規制不當獲取行為,并非“賦權”的積極保護。以商業秘密保護衍生數據或稱商業數據,會加劇數據壟斷與數據孤島,不利于數據的公開和社會福利的最大化。企業數據權益的實現不僅來自對數據的占有和控制,更有賴于數據在數據市場的流轉和使用。商業秘密的保護方式可能導致公眾難以獲取和利用他人在先收集控制的數據,有礙于數據作為生產要素的價值實現和數據產業的發展。在新浪微博訴脈脈案[40]中,新浪亦通過合同約定將相關數據界定為商業秘密,針對淘友公司超授權范圍抓取數據行為,微夢公司原本試圖通過商業秘密保護路徑進行維權。但是,一、二審法院對于“微夢公司的數據是否屬于商業秘密”“淘友公司是否侵犯微夢公司的商業數據”等問題均沒有予以認定,而是援引反不正當競爭法第二條認定淘友公司的訴爭行為構成不正當競爭。上述裁判結果表明了司法機關對于通過商業秘密保護企業數據的審慎立場,也凸顯了在現有法律框架下運用商業秘密保護企業數據權益的局限性。

3.在知識產權之下新設數據專有權的局限

在知識產權之下新設數據專有權,可以有其些許的個性,但更需滿足與專利權、著作權、商標權等現有知識產權都具備的共性,如創造性、獨創性、顯著性等往往需要人的參與,才會具備的屬性。這意味著,只有少量的數據能被納入知識產權之下新設的數據專有權,大量的有價值的數據很難滿足這樣的要求,被排除在知識產權客體范疇之外。隨著人工智能、物聯網等新技術的迅猛發展,數據井噴、數據洪流態勢日益明顯,相對剛性且嚴密的知識產權制度框架很難有足夠的容量,無法敞開懷抱接納數據這類新的生產要素。在知識產權之下新設數據專有權,猶如在大門緊閉的狀態下,開啟了一扇小窗,讓少量滿足條件的數據納入進來,更多的無法滿足創造性、獨創性、顯著性等要求的數據,則不能獲得知識產權之下的數據專有權的保護。

六、余論 數據在民事權利體系中的應然位置

本文認為,信息產權與知識產權本質上仍是在同一范疇,其區別在于保護范圍的大小;數據產權與前二者分屬不同的范疇,與其既有并列又有交叉;特定數據已具備知識產權客體形態,則適用知識產權保護(如數據庫)。未能納入知識產權客體范疇的數據集獲得法定權利保護的路徑,是在知識產權(信息產權)之外,新增一種產權保護模式——數據產權。

在數據產權的保護中,數據主體就個人原始數據享有數據權(人格權和財產權),企業就衍生數據享有數據產權(財產權),相比于知識產權,數據產權獲得的門檻理應更低,因此相比于知識產權,數據產權無法也不必要求創造性、獨創性、顯著性等。衍生數據源自原始數據,無論是從權利來源或正當性來考慮,還是從數字經濟時代數據利用的需要考慮,數據產權制度設計不宜采強保護模式,相比現有的知識產權,其取得更容易,故其保護宜比知識產權弱。

在民事權利框架下,信息產權與知識產權本質上仍是在同一范疇,二者的區別在于保護的范圍有大小之分,信息產權包含知識產權,故知識產權范圍比信息產權的范圍要小;數據產權與知識產權、信息產權分屬不同的范疇,與其更多的是并列關系,但也有少量交叉??梢?民事權利是個很大的框架,其包含了知識產權、信息產權、數據產權和其他民事權利(見圖2)。如何配置民事權利家族中的新成員數據產權,是當前人類社會急需解決的一大難題。

圖2

猜你喜歡
商業秘密數據原始數據
泄露商業秘密 依法支付賠償
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
受特定變化趨勢限制的傳感器數據處理方法研究
全新Mentor DRS360 平臺借助集中式原始數據融合及直接實時傳感技術實現5 級自動駕駛
美國《保護商業秘密法》的立法評價
一種借助數據處理構建的智能食堂管理系統
數據化藝術的生成探究
淺談計量自動化系統實現預購電管理應用
侵犯商業秘密罪中“重大損失”的內外審查方法
美國對涉華商業秘密的“337調查”及國內行業的應對做法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合