?

數據爬蟲侵權行為研究

2021-12-04 04:44李凡迪徐家力
關鍵詞:爬蟲隱私權網頁

李凡迪,徐家力

(1.中國航天系統科學與工程研究院,北京 100037;2.北京科技大學文法學院,北京 100083)

引言

人類自誕生起就在通過各類方式爭奪有限的資源,延續生命??茖W技術就是競爭的重要手段[1]。社會生產力的發展帶來科技的進步,在網絡世界中,依托于虛擬網絡的互聯網企業對于數據、信息資源的爭奪激烈,其對象從有形財產轉變為無形的虛擬財產。數據爬蟲因為快速且有效提取網絡中的信息提供解決方案得到廣泛應用,但網絡技術日新月異,法律在本質上具有滯后性。人們在技術進步與技術應用的狂歡中也產生了大量因獲取信息行為和數據使用行為不當引發的糾紛。例如“百度訴360 案”①參見北京市第一中級人民法院(2013)一中民初字第2668 號。、“車來了”APP 網絡爬蟲技術刑事案②參見深圳市南山區人民法院(2017)粵0305 刑初153 號。等。對數據爬蟲應用過程中的侵權行為進行認定,以應對數據爬蟲應用中出現的問題成為討論熱點。

一、數據爬蟲概述

(一)數據爬蟲

數據爬蟲(也稱作網絡爬蟲、網絡機器人)本質上是通過分析網絡路徑獲取相應數據信息的一系列計算機程序。搜索引擎通過數據爬蟲程序訪問網站爬取網站信息內容,并將獲取的數據信息進行呈現?;ヂ摼W企業發展迅速,提供的網絡服務越來越多樣,數據爬蟲的應用也越來越廣泛。例如利用數據爬蟲整合航班信息提供購票服務,通過爬蟲程序爬取新聞信息構建聚合式新聞移動客戶端等。

(二)數據爬蟲工作原理概述

數據爬蟲技術最早應用于搜索引擎,其工作的原理是:根據數據爬蟲實施目的建立需要抓取數據網頁的URL——統一資源定位符隊列,按照一定順序從中取出地址,并對該統一資源定位符對應的網絡頁面進行訪問,解析該頁面,再提取該頁面中的網址將其加入等待數據爬蟲下一步訪問的隊列中,在經過循環爬行后,訪問所有統一資源定位符對應的網頁[2]。從應用的角度,可以將其總結為獲取網頁—解析網頁—存儲數據三個步驟。

(三)數據爬蟲應用現狀

網絡用戶通過鍵入關鍵字或者根據網絡服務提供者列出的目錄索引進行搜索便可以在很短的時間內獲得大量的檢索結果。在技術應用方面,數據爬蟲為搜索引擎工作中提供檢索匹配、自動獲取網頁信息功能提供了非常有力的支持。如今,技術的發展已經將數據爬蟲的主要應用場景從搜索引擎擴展到了各類電腦端、移動客戶端應用軟件中。例如在聚合類軟件中的應用,以及企業和個人使用數據爬蟲技術進行數據搜集、數據分析,開展商業活動或者學術研究。

二、反爬蟲技術與Robot s 協議

(一)反爬蟲技術

隨著數據爬蟲技術應用的深入,大量的網站為了避免其成為除搜索引擎爬蟲被實施者之外的惡意數據爬蟲被實施者,正在積極努力探索更有效、攔截范圍更廣的反爬蟲技術(Anti-Spider)[3-4]。例如對IP 進行限制(限制IP 訪問的頻率,當某個IP 訪問達到一定頻率后對該IP 進行封鎖,不允許該IP 再訪問網絡頁面),設置訪問驗證碼(通過使用輸入驗證碼,滑動滑塊來判斷是爬蟲還是人在進行操作,例如Google 的人機驗證,各類網站的滑塊驗證等),利用JavaScript 加密信息等。

除了反爬蟲技術,具有互聯網行業共識的Robots 協議因為其內容清晰、簡單高效等優點,為國內外互聯網行業人員所使用,成為國內外互聯網行業內普遍通行、普遍遵守的技術規范①參見北京市第一中級人民法院(2013)一中民初字第2668 號。。

(二)Robots 協議的內涵

1994 年6 月30 日,經數據爬蟲程序的實施者——搜索引擎服務商和數據爬蟲程序的被實施者——網絡內容服務商的商討后,Robots 協議被認為是一項在數據爬蟲程序實施過程中被廣泛認可的行業規則。Robots 協議(Robots Exclusion Protocol,網絡爬蟲排除標準)也可以稱為爬蟲協議,指的是網站構建過程中通過設置robots.txt 對網絡爬蟲進行指令的協議。各大搜索引擎服務商,例如谷歌、百度,相繼表明遵守Robots 協議。我國《互聯網搜索引擎服務自律公約》第七條也對Robots 協議進行了明確的規定。

網站依據Robots 協議確定的robots.txt 文件語法規則和公平、開放、促進信息自由流動原則進行robots.txt 文件的編譯。robots.txt 是存放于根目錄下的ASCII 編碼文本文件[5]。該文本文件被用來告知網絡機器人在服務器上可被查看文件范圍,爬蟲程序對目標網頁進行訪問時,將首先訪問網頁根目錄下的robots.txt,網絡機器人根據robots.txt 文件確定可以訪問的范圍并對網站進行訪問。

數據爬蟲程序對于robots.txt 文件內限制指令的遵守,會對數據抓取的結果產生直接影響。但是從形式上看,該文件只是存放于根目錄下由網站所有者創建和編輯的一個文本文件,并不是命令,無法主動攔截網絡機器人對文件聲明不可訪問內容的訪問。換言之,robots.txt 是網站針對爬蟲程序依Robots 協議在站點根目錄下“張貼”的關于訪問權限的“告示”。

(三)Robots 協議的法律性質與效力

Robots 協議中的“協議”與民法上的“協議”有很大的差別。民法上的“協議”與“合同”具有相同的語義。從性質上看,合同是一種協議,該協議的具體內容和目的是合同雙方設立、變更、終止財產性民事權利義務關系[6]。從英文名稱上看,民法上的“協議”是“Agreement”,與要約承諾有關,對應的是權利與義務;而互聯網中Robots 協議中的“協議”是指“Protocol”,只是一種規則。

Robots 協議作為國際互聯網通行規則,自誕生以來幾乎被所有搜索引擎商承認并使用,但對于Robots 協議的法律效力,一直存在不同的觀點,不同的國家在案例中也有不同的態度。

“菲爾德訴谷歌案”①參見Field v.Google,412F.Supp.2d1106(D.Nev.2006)。中,美國法院將有沒有設置Robots 協議看作一種默示許可?!肮雀鑸D片搜索案”[7]中德國法院對于Robots 協議的態度與美國法院對Robots 協議的態度相近,都認為有沒有設置Robots 協議是一種默示許可。但在“科皮出版社訴谷歌案”[8]中,比利時法院認為,版權是排他性專有權,在谷歌使用網頁內容的時候應該事先獲得授權,比利時法院雖然表明網絡內容提供者可以通過Robots 協議對數據爬蟲程序的訪問范圍進行聲明,也可以采取技術措施阻止爬蟲訪問,但并未將Robots 協議作為判斷是否默示許可他人使用的依據。根據國內外案件事實具體情況與判決的分析,可以發現各國均認為Robots 協議并不是一種強制性手段[9]。

我國司法實踐目前并沒有明確認定Robots協議的法律性質,學術界從不同角度給出了相對肯定的結論。楊華權和曲三強認為Robots 協議是網站可采取的一種技術手段,其主要功能是對數據爬蟲程序的實施范圍進行引導,是國際通行的行業慣例[10]。張平認為,Robots 協議是權利人為保護網站、用戶信息所采取的非強制性手段[9]。蔣舸指出,Robots 協議最開始是在技術應用中使用并具有一定效力的方式,之后發展為具有共識的應當被遵守的行業通行規則或商業道德[11]。在實踐當中,違反爬蟲協議的行為在業界最受譴責,也最容易引起相關法律爭議[12]。然而,如何從法律的角度評價“爬蟲協議”的效力,目前尚無定論[13]。

從國外多個案例的判決中可以看出,法院對于Robots 協議法律性質的認定雖然較為一致但并不完全相同,但均對Robots 協議應該得到遵守表示認同[12]。事實上,程序編譯中的計算機語句有的用來規定程序運行的邏輯,具有技術上的效力;有的只是用來做出聲明,例如,表明程序的名稱、對某些功能做出注釋,在程序運行上并不會產生效力。顯然,作為Robots 協議有實質內容的robots.txt 文件在技術上的效力屬于后者。綜上,本文認為,Robots 協議在法律上應該被認定為數據爬蟲實施過程中應該遵守的非強制性的行業通行規則。

三、數據爬蟲程序實施法律邊界分析

數據爬蟲程序的實施可以分為獲取網頁、解析網頁與存儲數據三個步驟。獲取網頁與解析網頁直接通過程序實施實現,具有較強的關聯性;數據存儲與使用具有連續性,數據存儲的情況與數據使用的程度和范圍依據數據爬蟲程序實施者的意志具有較大差別。

(一)數據爬蟲獲取網頁與解析網頁中的法律問題

數據爬蟲獲取網頁與解析網頁中的法律問題主要集中在數據爬蟲技術實施中訪問數據爬蟲被實施對象時對該計算機系統和其中數據安全的危害,在侵入、破壞計算機系統,或者獲取數據信息的過程都有構成犯罪的可能性。

具體來說,在數據爬蟲侵入信息系統的過程中,如果使用該技術的目的在于非法侵入有關例如國家事務、國防建設、尖端科學技術領域的計算機系統,此時的數據爬蟲程序可僅僅看作計算機程序,數據爬蟲技術使用只要實施了侵入行為就構成非法侵入計算機系統罪。

而在數據爬蟲訪問目標網站或系統后,針對爬蟲技術對系統的破壞,如果利用數據爬蟲技術對計算機系統的功能或者其中儲存、處理或者傳輸的數據和應用程序進行破壞,或者故意制作、傳播計算機病毒等破壞性程序,影響計算機系統正常運行,后果嚴重的行為可構成破壞計算機信息系統罪①參見天津市第一中級人民法院(2018)津01 刑終300 號。。

通過數據爬蟲技術獲取數據信息,雖然相對于人工查看網絡中的信息和對數據進行逐一錄入,利用爬蟲程序抓取數據只是加快了訪問的速度,提高了錄入的效率。但是,利用該項技術非法侵入特定的計算機系統,獲取了該計算機信息系統中存儲、處理或者傳輸的數據,或者對該計算機信息系統實施非法控制,情節嚴重的,可構成非法獲取計算機信息系統數據罪②參見深圳市南山區人民法院(2017)粵0305 刑初153 號。。

針對抓取數據的屬性,如果非法抓?。ǜ`?。┑臄祿畔儆诠駛€人信息,或者該內容是商業秘密并給商業秘密權利人造成重大損失的,可能會構成侵犯公民個人信息罪或侵犯商業秘密罪。

(二)數據爬蟲存儲數據與使用數據中的法律問題

對數據使用行為的過程進行分類,可以將其具體從數據的儲存、數據的傳播延伸到數據的分析運用。將數據爬蟲獲取數據之后的數據使用再進行細分,可以將其劃分為數據存儲行為、數據分析和數據反饋三個過程。

除2021 年3 月1 日起施行的《中華人民共和國刑法》對一些特定屬性的數據內容(例如,屬于淫穢物品的數據內容的傳播,對公民個人信息的出售、非法提供,有關商業秘密的內容等)進行規制,數據爬蟲數據使用中的法律糾紛主要集中在民事侵權糾紛(主要是著作權侵權)和不正當競爭糾紛。根據現有案例的爭議內容,數據爬蟲侵權行為主要集中在數據存儲和利用數據開展其他活動這兩個部分。但由于互聯網中技術的隱蔽性和法律的滯后性,數據爬蟲數據使用中侵權行為的認定往往具有一定的難度,有關數據爬蟲的侵權糾紛往往和不正當競爭糾紛同時出現。

侵權行為的認定可從一般侵權責任的構成要件進行分析:以著作權侵權為例,數據爬蟲程序的實施者存在侵犯被實施者著作權的行為并在主觀上具有過錯,該行為造成了損害事實,損害的結果與數據爬蟲程序實施者的行為之間具有因果關系。然而,數據爬蟲程序具有技術上的特殊性,其實施行為與損害結果具有一定的隱蔽性。對數據主體個人信息權和隱私權的侵犯可能存在于數據的收集和使用行為中,對個人信息權和隱私權侵權的認定除了滿足一般侵權責任的構成要件,還需根據場景的不同對數據信息的類型和性質進行判斷。

數據爬蟲技術實施后數據使用過程是否構成不正當競爭,需要從互聯網企業之間的競爭關系和該行為對市場競爭的影響來進行判斷。隨著“互聯網+”行動計劃的深入,大量企業通過O2O模式跨界融合,傳統商業模式在與互聯網的結合中呈現新的面貌,這就要求司法實踐需要對網絡環境中的競爭關系、市場秩序和商業道德進行更加確切的判斷。

在“大眾點評訴百度地圖案”③參見上海知識產權法院(2016)滬73 民終242 號。的審判過程中,各方對互聯網企業競爭關系、商業道德以及行為的正當性與否等問題進行了激烈的討論。被告百度認為,百度地圖上的商家信息服務本質上是搜索引擎,作為搜索引擎服務商,百度通過數據爬蟲程序爬取大眾點評網的信息,嚴格遵循行業慣例,并沒有違反Robots 協議。二審法院認為,適用《中華人民共和國反不正當競爭法》第二條即一般條款應同時對以下三個方面進行判斷:一是無特別規定;二是具有實際損害;三是存在可責性。百度地圖和大眾點評作為兩家長期經營的網站,都累積了大量的用戶和用戶信息,百度地圖截取大眾點評商家評論信息的行為將會導致大眾點評網站瀏覽用戶分流,已經對大眾點評的商戶評價信息服務構成實質性替代,會使其利益受損。

不僅是在“大眾點評訴百度地圖案”中,“百度訴360 違反Robots 協議案”和“騰訊訴360 不正當競爭案”等等案例的審判都是根據互聯網行業規則推導出該領域應當遵守的商業道德,對案件中所涉及原被告做法的正當性進行判斷。

四、數據爬蟲侵權行為認定

(一)著作權侵權

除在數據爬蟲程序的編譯中可能會有計算機軟件著作權侵權行為出現,數據爬蟲著作權侵權行為主要集中在數據爬蟲程序實施后的數據使用行為。對數據爬蟲著作權侵權的分析需要對軟件編譯和數據使用階段分別進行討論。

1.軟件著作權侵權。數據爬蟲作為一種以通過分析網絡路徑獲取相應數據信息為主要功能的計算機程序,其程序設計目的具有一致性,即訪問網頁、獲取數據。該類程序的編譯在邏輯上具有統一性,首先,設定需要訪問的URL 范圍,然后,獲取需要的數據信息,接著將數據進行儲存,最后對URL 隊列進行重新匹配直至所有的URL 都被訪問。我國《計算機軟件保護條例》對軟件著作權保護的具體內容進行了規定,但由于計算機技術的發展,對軟件侵權的認定具有較高難度。

在實踐中,對軟件侵權認定的標準經過了從鏡像復制標準到SSO(Structure、Sequence、Organization)標準,再到AFC(Abstract、Filter、Compare)標準的轉變。在技術判斷上,計算機軟件編譯因其表達方式和編譯方式的多樣在侵權判斷上具有一定難度。在司法實踐中,法官在認定過程中存在重“實質性相似”、輕“接觸”的傾向[14]。數據爬蟲程序在功能上具有很高的相似度,其編譯代碼往往存在較多重合。這就要求法官在判斷數據爬蟲軟件著作權侵權過程中,不僅對技術上的實質性相似進行甄別,更要加大對“接觸”和數據爬蟲實施行為的綜合判斷。

2.網絡頁面中著作權內容的認定。隨著互聯網技術的深入使用,網頁的內容和形態越來越復雜多樣。一個網頁中很可能包含文字作品、美術作品等多種作品類型,并采取了豐富的信息形態進行組合。從網頁構成的形式上,不少網頁制作精美、排版巧妙。

我國《著作權法》第三條對作品的種類進行列舉和兜底式規定。對于網頁進行展示的內容,如果該內容屬于文字作品、美術作品等著作權法所保護的作品范圍,理應對這些作品內容進行保護。但對于網頁整體,是否屬于作品?是否也可以受到著作權的保護?

根據有關司法解釋①具體為《最高人民法院關于審理涉及計算機網絡著作權糾紛案件適用法律若干問題的解釋》。表明,對網絡中不屬于著作權法列舉作品范圍但屬于作品的內容應當將其納入著作權法保護范圍。網站在設計的過程中不僅需要考慮界面的美觀感受、操作的邏輯,也需要對人機交互模型進行設計,網站設計是藝術、科學領域的智力成果。網頁在代碼編譯后通過計算機進行呈現,無論是數字的方式還是其他方式,都具有可復制性。而在獨創性上,雖然網頁的構建在直觀感受上具有比較統一的排版方式,但隨著網站數量的增多,不少網頁在視覺效果、排版編排上具有明顯的差異性,無論是在布局、內容分類方面,還是在背景的創作方面,很多地方都體現了網站設計者獨特的智力判斷和選擇。

在司法實踐中,法院在裁判中認為①參見南京鐵路運輸法院(2017)蘇8602 民初564 號。,在網頁是否具有獨創性上,如果該網站的網頁在網頁文字、圖片等內容的挑選、編排布局與表達方式上符合了獨創性的要求,就可以認為該網絡頁面為匯編作品,并通過著作權法對其進行保護。

因此本文認為,網頁中的著作權不僅包括了網頁內容中的文字作品、美術作品等的著作權,如果網頁的選擇、協調和編排事實的方式達到了最低限度的創造性[15],就能夠將網頁整體作為匯編作品。

3.數據爬蟲著作權侵權行為認定。判斷數據爬蟲行為是否侵犯信息網絡傳播權需要將其中數據使用行為的數據反饋過程進行細分。根據數據反饋的形式不同可以將其分為網絡鏈接、快照和商業活動。

通過網絡鏈接進行數據反饋是指在網頁與網頁之間通過超文本和超媒體進行鏈接,其中包含普通外鏈和內鏈(也可以稱為深鏈接)兩種。普通外鏈直接跳轉到被鏈網站或者彈出顯示內容來源的下載框(主要針對格式為mp3、pdf 等的文件)。內鏈在不跳轉到被鏈接網絡頁面的情況下,可以獲取該網站的內容,并且設鏈網站不儲存被鏈網站的內容??煺张c網絡鏈接方式不同,通過快照進行數據反饋時,會對網頁進行備份,將網頁的內容儲存在自己的服務器中,再對儲存的內容進行展示。具體來說,網頁快照針對網頁中的文字作品進行顯示,縮略圖針對圖片進行顯示。

通過商業活動進行數據反饋是企業、個人在開展商業活動時實施數據爬蟲程序的常見反饋形式,是指企業或個人在利用數據爬蟲程序抓取數據后,通過數據分析方法對其進行分析,了解本企業、客戶和競爭對手的相關信息,并通過分析結論對本企業的商業模式進行優化。其目的是為了獲取更大的經濟利益。

信息網絡傳播權是著作權財產權利中的一種。有關法律法規及保護條例②具體指《信息網絡傳播權保護條例》(國務院,2013 年3 月1 日)。表明,侵害該種權利的行為主要是內容提供行為和網絡服務提供行為兩類。

內容提供行為具體指網絡服務提供者未經著作權人許可,將作品上傳至信息網絡上,并通過此為網絡用戶提供諸如美術作品等的各類信息,網絡用戶能夠于受個人意志支配確定的時間、地點瀏覽或者獲取作品的行為。通過此種方式為網絡用戶呈現數據信息在合理使用之外沒有免責條款,也就是說,內容提供者僅需有傳播行為就應當被認定為侵權[16]。

網絡服務提供行為是指網絡服務提供者為信息網絡傳播提供的中介服務和技術支持,包含接入、儲存和傳輸等多種包含技術的內容。比如說,第三方電子商務平臺為商品的買賣提供平臺技術支持的行為。對此,避風港規則規定了網絡服務的提供者承擔責任的情況——網絡服務者若是明知或者應知則需要承擔侵權責任。在“通知—刪除”規則之下,避風港制度對提供技術支持的網絡服務提供者給予了較好的保護。同時,其價值也在對著作權人在互聯網中的權益保護和互聯網行業發展之間平衡的維系中得到體現[17]。

通常,內容提供行為和網絡服務提供行為的區分比較明顯,能夠直接進行判定。但是,數據爬蟲的實施不僅包含了技術服務內容,也包含了對網絡內容的獲取與利用,數據爬蟲的行為已經超出了單純提供數據搜索的技術行為。對數據爬蟲侵權行為的判斷還是要回到各類數據使用行為中進行。

數據反饋的形式有網絡鏈接、快照和商業活動三類。在提供網絡鏈接的形式中,網絡服務提供者通過技術手段將網頁進行鏈接,并沒有將具體內容直接呈現在用戶面前。例如搜索引擎爬蟲在抓取數據后,通過網絡鏈接為搜索引擎用戶提供查看網絡頁面的服務。在這種情形中,網絡用戶查看的內容仍然是原網頁中的內容,在查看的過程中直接跳轉到被鏈接的網站,可以認為該爬蟲提供的是一種鏈接服務。這種情況下,不會被追責。但是如果企業或者個人通過數據爬蟲技術將網頁中受著作權法保護的的內容進行下載,并長期、穩定地儲存在自己的服務器中以便提供用戶瀏覽網頁內容的功能,此時可以認為這類爬蟲不僅提供了數據抓取行為,還對數據的內容進行了著作權法意義上的復制,可能構成對著作權中復制權的侵犯。即使網絡服務提供者為用戶呈現的內容標明了播放源,但與檢索行為、網頁中的鏈接行為存在本質上的差別,此種行為依舊屬于著作權法意義上的復制①參見北京市第二中級人民法院(2014)二中民終字第00919 號。。

(二)個人信息權與隱私權侵權

數據作為信息的載體,以多種形式存在于網絡中。數據共享既是一種數據財產的利用、使用行為,也是數據開發與再利用行為[18]。個人信息權與隱私權權利保護范圍的交錯性,在權利受到侵害后有可能產生責任競合的現象,所以對數據爬蟲個人信息權和隱私權侵權行為同時進行討論。

1.隱私權和個人信息權的區分。隱私權是人格權的一種[19],包括私人生活安寧和私人信息秘密[20]。隱私權保護的范圍包括個人的生活私密領域和信息自主(信息隱私)[21]。

個人信息權與隱私權都是與個人信息密切相關的民事權利。但這兩種權利的性質、客體范圍等都具有差別,《民法典》第一百一十一條以及第六章對隱私權和個人信息權有關內容分別進行規定[22]。隱私權的客體是隱私。該項權利保護的范圍與個人信息的范圍有一定的交叉,一方面,有些隱私屬于個人信息的范圍,例如個人的財務信息、房產信息;另一方面,有些未對外公布個人信息中包含了隱私的內容,比如家庭住址信息。

在網絡環境下,作為信息載體的數據量巨大,個人信息自動處理的能力加強,與人的私生活安寧和私人信息秘密相關的內容發生了擴張。個人信息權作為民事權利中的一種,兼具人格權和財產權雙重屬性。由于隱私權和個人信息權保護范圍的交錯性,這兩種相關權利在受侵害后有可能產生責任競合的現象。

2.數據爬蟲個人信息權與隱私權侵權行為認定。我國的法律體系中,多個法律部門的法律規范如刑法、民法典、網絡安全法、電子商務法等對個人信息的有關內容進行了規定。美國法通過隱私的形式保護個人信息,我國法院在案件審判過程中通常也是按照此種方式對個人信息的權利人提供救濟[23]。對于數據爬蟲隱私權或者個人信息權侵權的判斷應當對網絡空間的屬性進行分析并理清網絡空間中個人信息權和隱私權保護的范圍。

首先,對于網絡空間是否屬于公共空間的界定應當根據網絡用戶的期待、場景的特性綜合衡量,不能一概而論。網絡空間的信息流通使其具有公開場所的特性,例如網絡空間中的信息對于網絡服務使用者具有開放性,這也是公共場所的特性之一。曲新久認為,當今社會已經步入了信息社會,對原有概念的理解應當隨著社會的變化而變化,互聯網中的有些空間具有“公共場所”的屬性[24]。網絡空間作為信息技術構建的空間,有與其技術特性相關的內部規則。部分學者基于物理性特征將搜索引擎等網絡空間排除在公共場所之外[25]。也有學者認為,網絡空間是否屬于公共空間應當根據場景的不同分別討論。本文認為,如果將網絡空間作為通過技術對現實世界“虛擬化”的呈現,那么對其是否屬于公共空間的界定應該根據其網絡用戶期待、網絡場景的屬性與功能的實現情況綜合衡量。比如說,在同樣的社交媒體中,發布于該網站所有用戶可見的信息可以認為是發布于公共空間的信息;但是如果在該網站建立了私人的聊天場景,那很有可能進行的是比較私密的話題,很難將這個場景歸于公共空間;同樣是聊天場景,如果該場景中的人員具有流動性和開放性,例如購物群,那在此場景中用戶并不會期待通過此群便可阻斷其發布信息的傳播,這類場景應該屬于公共空間。

其次,在公共空間中,公民有合理的隱私期待,對于在該空間中沒有公共價值的部分應該仍然存在隱私權。事實上,自隱私權這一權利在美國侵權法中被確立,對于公共空間是否存在隱私權這一議題的討論一直存在。沃倫和布蘭代斯認為,隱私權是公民享有免受打擾的“獨處權”[26]。公民如果將私密的信息發布于公共場所之中,那可以預見的是,該信息很有可能會為不特定多數人所知曉。做出這種行為的人應該能夠意識到其發布的信息會有被他人得知并進行傳播的風險。因而可以通過物理空間的劃定來判斷是否存在隱私權。但是,隱私權是隱私主體所享有的權利,其中包括了按照其意愿同意或拒絕他人進入其生活空間兩項內容[27]。在公共空間中,公民可以預計到發布信息或者做出某些行為很可能會被不特定多數人知曉或者審視,然而對于其范圍和程度無法預計。特別是在網絡中,信息的傳播方向、傳播方式和傳播范圍往往是網絡用戶所不能估計的。通過數據爬蟲獲取用戶的網絡行為后,可以利用數據挖掘、數據分析等技術對其行為偏好進行分析并加以利用,在用戶無意識的情況下得到有關用戶隱私的信息。因此,個人對于自我隱私披露的對象、范圍的控制應當享有主動權,不應該通過空間劃定直接判斷。在公共空間中,公民有合理的隱私期待,對于在該空間中沒有公共價值的部分應該仍然存在隱私權。數據的屬性常常高度依賴于具體場景[28]。因此,數據的權屬與其場景相關,網絡平臺中的數據可能屬于公共領域,也可能與個人隱私相關。

最后,對數據爬蟲個人信息權和隱私權侵權行為的判斷應當分別進行考量。除法律另有規定外,對于隱私信息應該以同意作為合法性判斷的標準,而對于個人信息中非隱私信息的部分不必然需要取得信息主體的同意。根據信息的流動,對數據爬蟲程序實施過程中個人信息權和隱私權侵權行為的判斷應該從信息的源頭——數據的獲取和信息使用的結果——數據的使用兩個階段進行討論。

在數據的獲取階段,本文前文論述了在數據爬蟲的技術使用過程中入罪的情形。在此過程中,如果非法搜集他人個人信息或隱私,也可能構成對個人信息權和隱私權的侵犯。那么,什么是非法搜集個人信息或隱私?或者換句話說,如何判斷個人信息收集行為的合法性?獲得數據主體的支持后收集其個人信息的行為當然合法,但是收集的所有個人信息都需要信息主體的同意在包含海量數據的網絡世界中并不具有可操作性和正當性。各個國家和地區對個人信息保護進行立法主要是為了彌補個人隱私保護的不足[29]。保護個人信息權的方式主要在于規范其數據的收集、利用等行為,為現有隱私權保護的不足進行補充,達到強化個人信息中隱私利益保護的目的[30]。隱私的側重點在于私密性,個人信息則在于身份識別[31]。由于身份信息與隱私信息可能存在交叉重疊,個人信息中既包含與隱私有關的內容,也包含不屬于隱私的內容。也就是說,對個人信息的收集并不必然會對隱私權造成侵害。因此,除法律另有規定外,對于隱私信息應該以同意作為合法性判斷的標準,而對于個人信息中非隱私信息的部分不必然需要取得信息主體的同意。

在數據的使用階段,對于數據爬蟲技術的實施者合法獲得的個人信息或隱私信息若使用不當仍然可能對個人信息權和隱私權造成侵害。一方面,在分析、使用數據的過程中如果違背信息主體的意愿利用該信息的行為,應屬于非法使用的行為。例如,數據爬蟲的實施者未遵守其與數據爬蟲程序被實施者之間關于個人信息利用的約定,或者在其抓取數據、利用數據的過程中因其未盡到安保義務使數據爬蟲程序被實施者的個人信息中的隱私信息泄露,造成隱私權的侵害[32]。另一方面,對數據的不當使用可能侵害其他人格利益。個人信息在某種程度上可以看作是其“數字身份”或“數字人格”[33],與信息主體在現實世界和網絡世界的社會評價密切相連,對個人信息的不準確利用和展示會導致對其他人格利益的侵害。

結語

首先,技術提供者應當承擔合理的注意義務。技術具有中立性,但如果技術實施者摒棄其中立的地位惡意實施技術,損害社會公共利益或他人合法權益,應受到法律的制裁。數據資源的共享不僅是互聯網開源精神的具體體現,也是實現數字經濟發展的必由之路,但是,面對數據價值的日益凸顯與私權保護的需要,選擇適合我國國情的方式對數據進行保護也是亟待完成的課題[34]。技術的快速發展對原有法律規則發起挑戰,在法律適用過程中應當注意對個案特性進行考量。

其次,對法律道路的思考與探索,應該牢牢把握科技之中所蘊含的社會關系。對于科技與法律的關系,傳統的法學研究往往先分析技術的特征,然后根據技術的特征提出法律應對,并不過多考慮其中的人文因素[35]。但是,科技由人主導,技術并不是憑空產生,而是由一代代人探索、創造并積累。這也就意味著科技是建立在人、社會關系和社會倫理之上的,科技的發展方向也體現了人類的需求。從這個層面上看,完全客觀或者必然的科技并不存在[36]。同樣,互聯網基于現實社會而建,可以認為是人類傳統社會向網絡更具有協作性與聯通性的遷移。

最后,個人信息保護立法應當更加針對技術使用行為,特別是針對數據信息中個人信息的收集、處理和使用等行為進行制度設計。個人信息權作為一項民事權利,一方面需要獲得其他民事主體的尊重,另一方面個人信息主體作為國家公民,國家公權力機構的態度在個人信息保護中也十分重要。相對個人隱私的被動防御,個人信息更側重積極利用[31]。因此,個人信息權重點在數據信息的收集、使用等行為進行規范,隱私權則更多體現在事后救濟上。個人信息保護的立法應當更加針對技術使用行為。對個人信息的保護不僅需要關注立法,也需要數據主體個人信息意識的覺醒。并且,網絡數據呈現的多種關系類型、多重屬性以及復雜的結構表現[37]對數據權屬問題提出了整體性要求。數據確權應當將數據爬蟲技術實施邏輯與場景化特點相結合進行綜合考量。

猜你喜歡
爬蟲隱私權網頁
利用網絡爬蟲技術驗證房地產灰犀牛之說
基于Python的網絡爬蟲和反爬蟲技術研究
基于HTML5與CSS3的網頁設計技術研究
媽媽,請把隱私權還給我
谷歌尊重雕像“隱私權”的啟示
基于Scrapy框架的分布式網絡爬蟲的研究與實現
基于HTML5靜態網頁設計
“人肉搜索”侵害隱私權的法律解析
誰搶走了低價機票
搜索引擎怎樣對網頁排序
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合