?

數字經濟中的數據和算法規制

2022-12-27 02:09張文魁
重慶理工大學學報(社會科學) 2022年10期
關鍵詞:規制數字算法

張文魁

(國務院發展研究中心 企業研究所, 北京 100010)

在數字經濟發展中,數據正在成為關鍵投入品。本文將說明數字經濟領域一些比較典型的企業策略性行為,包括自我優待,“二選一”及其他形式的拒絕交易,大數據殺熟及各種花樣的差別性定價,屏蔽、封禁以及拒絕鏈接等等,都與對數據和算法的利用密切相關。盡管傳統行業也有一些類似現象,但對數據和算法的利用,可以將這些行為升級為系統性的競爭和反競爭手段,以自動化、隱秘化的方法實施,從而發生性質上的變化。因此,數字經濟領域的反壟斷與反不正當競爭,應該進一步聚焦于那些策略性行為背后的數據和算法。同時,數據權屬以及數據所涉及到的國家安全等問題,雖然已經納入政策議程,但如何正確認識并把握分寸,也需要認真思考。

一、數字市場典型策略性行為背后的數據與算法

事實上,在傳統市場中,差別化定價和其他歧視性行為、自我優待、拒絕交易等屢見不鮮,譬如對于“熟客”給予優惠定價。而數字經濟領域的“殺熟”,即對這類客戶給予更高定價,就顯得“離經叛道”了。但是,優惠定價和更高定價,本質上都是差別化定價,或者可以定性為價格歧視。為什么優惠定價不是問題,而更高定價卻是問題?優惠定價雖然是讓利行為,被視為一種“善意”,可以幫助廠商吸引更多高頻次消費的穩定性客戶,同樣也可以起到壓制競爭對手、強化本企業競爭地位的作用,但是也可以視為一種不正當競爭,更何況這樣的定價對其他客戶是一種不公平行為。

數字經濟領域之所以存在較多的大數據殺熟,可能是因為處于快速發展中的數字企業要大量“獲客”,即獲得更多的新客戶,不得不對大量新客戶進行補貼,以吸引他們加入數字化場景,并使他們接受、喜愛這樣的場景,而對“熟客”的價格則是不含補貼的正常價格。對新客戶進行補貼是因為新客戶從傳統場景轉換到數字化場景,存在轉換成本,包括操作成本和心理成本。因此,簡單地將大數據殺熟定性為不正當競爭行為的確存在一定的問題。當然,還有可能是因為,許多“熟客”對特定數字化服務及其場景形成了習慣性和依賴性,或者他們對價格不敏感以及支付能力更強。這種情況下的大數據殺熟就與“獲客”目的差別化定價大不一樣。不過更加復雜的是,數字企業可能給予了接受更高定價的客戶以更加特殊的增值服務組合。

數字企業對客戶數據的廣泛采集,普遍是無授權、不知情的采集,而客戶并未意識到這些數據及分析結果會用于企業的差別化定價策略,而實際上的結果就是,自己是數據的貢獻者,反過來又成為數據貢獻后的受害者,這使事情的性質發生了變化。很顯然,大數據殺熟的要害不是“殺熟”,而是“大數據”;其他差別化行為的要害也不是差別化,而是數據。數字企業,特別是互聯網平臺企業,廣泛地采集客戶和其他參與者的數據,并開發算法模型對這些數據進行有針對性的分析,利用分析結果實施差別化、歧視性的定價行為。而且,數據的采集、分析、使用,一般并不為被采集對象知情和授權。

在數字市場中,其他基于數據和算法的差別化和歧視性行為也有不少。在雙邊性互聯網平臺市場中,平臺企業對不同的上家和下家進行組合性定價,包括實施不同的組合性優惠措施,從而實現復雜的交叉補貼,使平臺可以追求利潤最大化。這樣的交叉補貼,不借助于數據和算法是不可能實現的?;跀祿退惴?,可以比較容易地實現對優質客戶的篩選,或者對脆弱客戶的剔除,以及將那些易受誘導、易受情緒侵染的客戶篩選出來并實行針對性高強度營銷。同樣,可以進行反向操作,即對不合意或者缺乏較好支付能力的客戶設法避免交易,這樣的做法也可以發生在對上家的選擇、對供應鏈的管理上。大量實施這些系統性行為,無疑可以強化互聯網平臺企業的談判地位,弱化入駐平臺的廠商和個人的談判地位。平臺企業如果還兼有自營業務,與入駐廠商存在競爭性,也容易實施基于數據和算法的自我優待行為。

基于數據和算法的差別化行為,可以用于精準推送。精準推送大量存在于數字化新聞報道和信息資料的閱讀領域,平臺企業或者媒體機構對讀者的題材偏好、關注點和興奮點、閱讀習慣等進行隱秘的數據收集,然后不斷地向其推送同類的文章和資料。精準推送現在越來越普遍地滲透到購物、旅游、出行等訂購領域以及短視頻觀看和娛樂領域,并且伴隨著越來越多的廣告投放和高頻度推銷活動。精準推送顯然免除了客戶的主動搜索環節,實行基于數據和算法的自動匹配,在很多時候是一種可以極大提高效率的良性行為。但是,精準推送本質上也是一種差異化行為,基于數據收集實現對個體差異的識別,從而涉及到隱私問題或者個體信息的非自愿公開等問題,所以可能是不良行為。那么,到底是提高效率的良性維度占上風,還是侵害個人隱私和違背個人意愿的不良維度占上風?這就給規制帶來了難題。不過,未經同意的大體量、高頻度的廣告投放和信息推送,很可能違背了接收者的意愿,從而在較大程度上屬于單維度的不良行為。

不僅是差別化、歧視性行為極大地受益于數據和算法,數字經濟領域其他的一些典型行為,大致具有同樣情形。利用大數據和算法是否容易導致合謀,從而通過定價等手段來損害客戶利益,已引起了學術界的討論。而數字平臺企業廣泛存在的自我優待和拒絕交易行為無疑是基于數據和算法,因為兼有自營業務的平臺,可以系統性地收集其他賣家和買家的數據,從而及時發現暢銷商品及其客戶群,然后快速推出自營的同樣商品并進行算法推薦營銷,其他任何賣家都不可能系統性地獲得這樣的數據。搜索引擎企業也具有同樣優勢?;跀祿退惴ǖ淖晕覂灤途芙^交易不但可以升級為系統性行為,而且可以自動地、隱秘性地實施,即數據的采集、分析、利用并未得到客體的知情和同意,算法的使用并未得到參與人的充分認知與自由選擇。

總而言之,數字經濟領域那些廣受關注、飽受爭議的典型策略性行為,其要害在于它們基于數據和算法。不管是業已形成強大市場勢力的數字巨頭企業,還是新設的中小數字企業,都有可能利用自己獨特的數據采集方法和算法模型實施這些行為,也就是說,即使規模較小、市場份額較少的企業也很有可能采取這些行為來加強競爭和排斥競爭。因此,數據和算法可以改變企業規模和市場份額在產業組織中的角色。盡管對數據和算法的利用是極為重要的產業創新,極大地提高了生產和生活效率,但由于它們也隱藏在這些受爭議、受關注的策略性行為背后,所以需要引入科學合理的規制,這不會抑制反而會促進創新。

二、數據和算法規制初探

毫無疑問,數據是算法的基礎。要對數據和算法進行必要的、合理的規制,首先就要探討數據規制問題。

數據規制就是要建立并施行一套關于數據采集、流轉、開發、利用的規則。數據是客觀世界在人類認知上的投射,當人類有了身體器官之外的器具和方法去采集客觀世界的狀態信息,數據體量就可以無窮無盡地膨脹。對數據進行加工和分析的方法也在不斷發展之中,使原始數據和加工數據有了各種各樣的用途。歐盟于2016年頒布實施的《通用數據保護條例》(General Data Protection Regulation,GDPR),就是引入數據規制一個重要嘗試,這部法律特別強調對個人隱私數據進行嚴格保護;2022年通過的《數據治理法》(Data Governance Act)初步建立了一個在數據保護基礎上促進數據共享和鼓勵數據利他主義的法律框架。我國于2021年頒布實施的《個人信息保護法》也包含了許多重要內容。但由于客觀世界可采集的數據是無窮無盡的,投射數據的客體以及采集數據的主體各自應該擁有什么權利、享受什么利益、擔負什么責任,至少目前來看不可能由幾部法律來詳盡和準確界定。而且,數據流轉會使原始數據投射物與數據的后續加工者、訪問者、利用者之間關系越來越模糊,也會使數據的資產屬性越來越強。因此,學術界對數據權利及引致的利益分配等問題進行了探討。湯琪就從數據的交易合法性、安全性角度,探討了數據產權問題,認為數據已經具有財產性質[1]。蘇可依從數據產業發展的角度分析了數據產權不清晰對數字經濟發展所造成的掣肘,強調應該加快數據權利方面的立法,進一步明晰數據權利邊界[2]。

不過,無論是在歐美,還是在我國,關于數據權、利、責的爭論還非常大。我國有法律專家把“數據權屬”的主流觀點大致概括為4種,即“新型人格權說”“知識產權說”“商業秘密說”“數據財產權說”(1)見中央財經大學法學院黨委書記吳韜:法學界四大主流“數據權利與權屬”觀點,https://wwww.sohu.com/a/117048454_481893,2016年10月24日。。實際上,隨著對數據利用的擴展與深化,以及算法模型的不斷升級,數據權、利、責關系會越來越復雜。美國學者Nissenbaum曾經將這種復雜關系歸之為各種場景(contexts)的復雜性,從而主張,在未來的數字經濟發展實際中,基于“對場景的尊重”(Respect for Context),遵循“場景性正直”(Contextual Integrity),在具體場景中實現隱私保護與信息采集和流轉的合理平衡[3]。Waldman也強調了具體場景的重要性,從信任的角度來探討數據授權等問題,認為數據隱私權等問題的本質在于信任,所以在數字化社會,不能完全以個人權利來理解涉及個人信息的數據,而要根據個人對具體場景中數據使用的合理期待來分析權利邊界[4]。當然,從各國的實際經驗來看,對具體場景的判斷以及對場景性正直的把握,應該需要通過大量的法庭訴訟來積累。也就是說,對數據以及對算法的規制,并不是狹義的行政規制,而是包含訴訟與判決的法律規制。因此,需要鼓勵這方面的訴訟并培養大量的專業法庭人才,以便在各當事方陳述、爭辯并提供證據的過程中逐漸建立科學合理的規制。

只有對數據進行挖掘和利用,數據才有價值,而算法等技術是挖掘和利用的集中體現。在數字經濟中,盡管數據是基礎,但算法才是利器。正如韓旭至所分析的那樣,在數字經濟中,數據價值主要來自于算法;在較大程度上,數據經濟的實質便是算法定義的經濟[5]。姚前進一步分析了算法應用的各種場景,指出隨著云計算、區塊鏈、人工智能等新應用的發展,以智能算法為核心的新型經濟模式正在出現,從而給數據創造了更新的價值挖掘空間;而算法經濟活動也存在算法濫用、算法偏見、算法鴻溝等問題,所以應該對算法以及基礎性數據進行合理規制[6]。在數字經濟發展的實際中,算法正在成為最強大的競爭武器之一,如精準匹配可以極大地節約搜尋成本、提高配置效率;也是最強大的限制競爭、追求壟斷的武器之一,如大數據殺熟、對鏈接的控制都是基于算法。而根據用戶習性和弱點進行高頻度推送形成致癮性,則是算法濫用的典型現象之一。人工智能的快速發展和越來越強的滲透式使用,使得算法的威力更加強大,這種威力已經而且必將進一步超越經濟領域。譬如,現在越來越多的人已經注意到了算法合謀問題,這種技術方法可以輕易突破傳統反壟斷法對共謀卡特爾的禁止。無論從哪方面來看,都需要給算法設立規制。

歐盟有關機構在2019年提出的《算法問責及透明度治理框架》(A Governance Framework for Algorithmic Accountability and Transparency)中,對數字企業利用算法向用戶進行內容推送的行為提出了公平、透明方面的要求,要求它們在服務條款中說明算法決策的基本方法,并禁止某些特定決策僅由自動化方式作出。美國國會一些議員于2019年提出了《算法問責法(草案)》(Proposal on Algorithmic Accountability Act),旨在對基于算法的自動化決策所形成的歧視性行為和侵犯隱私行為進行規制。我國于2021年頒布實施的《互聯網信息服務算法推薦管理規定》,要求算法推薦服務提供者應當以顯著方式告知用戶其提供算法推薦服務的情況,并以適當方式公示算法推薦服務的基本原理、目的意圖和主要運行機制等;算法推薦應當向用戶提供不針對其個人特征的選項,或者向用戶提供便捷的關閉算法推薦服務的選項。

歐美的上述政策性文件公布之后,引發了不少爭議,反映了算法規制之復雜和困難。算法規制的最大難點在于算法的不透明性和非人工性。因為許多算法決定是由通過處理大數據而進行深度學習的智能化機器所作出的,有時連算法的創造者和設計者也很難搞清智能化機器為什么會作出某項決定,以及什么時候作出決定。算法程序還可以不斷地快速更新,從而很難進行事前監管。即使數字企業通過算法實施不當行為,但由于這些行為是通過自動化程序而大規模和隱秘化地實施,監管部門要搜集足夠有力的證據也存在很高成本?;蛟S,未來需要通過智能化程序對算法進行科學合理規制。這是一個“以科技之矛攻科技之盾”的方式,需要花費很長的時間來等待。

對數據和算法實行規制還面臨一個重要議題,就是對數據采集、流轉、開發、利用與國家安全之間的關系如何把握。尤其在我國,不但強調網絡主權,而且數據越來越多地被認為涉及產業安全和國家整體安全。我國于2021年頒布實施的《數據安全法》明確指出,對數據實行分類分級保護,關系國家安全、國民經濟命脈、重要民生、重大公共利益等數據屬于國家核心數據,實行更加嚴格的管理制度,各地區、各部門應當按照數據分類分級保護制度,確定本地區、本部門以及相關行業、領域的重要數據具體目錄,對列入目錄的數據進行重點保護;國家建立數據安全審查制度,對影響或可能影響國家安全的數據處理活動進行國家安全審查。2022年開始實施的《網絡安全審查辦法》也明確規定,網絡平臺運營者開展數據處理活動,影響或者可能影響國家安全的,應當按照這個辦法進行網絡安全審查。而關于工業領域的數據安全,有關部門還在制訂《工業和信息化領域數據安全管理辦法》等政策性文件。但是,數字經濟具有天然的跨越物理隔閡、地理障礙的特點,數據的跨主體、跨地域、跨國界配置,是數字經濟發展的強大內在趨勢。因此,我國在加強數據安全工作的同時,如何避免出現數據孤島效應,是一個必須認真對待的問題。對數據的跨境采集、流轉、開發、利用應該如何進行規制,遠遠超出了反壟斷、反不正當競爭的范疇,未來將在較大程度上影響一個國家數字經濟的全球化發展進程。

三、一些討論

上述分析表明,數字經濟領域諸多涉及壟斷和不正當競爭的企業行為,在工業經濟中并不鮮見,但基于數據和算法,使得數字經濟中的這些行為可以成為自動性、隱秘性很強的系統性行為。也就是說,這些行為的要害在于它們基于數據和算法。在數字化社會,數據可能被廣泛應用于從未有過的各種用途,而算法不斷開辟大量的應用空間。但對于大多數普通人和普通企業而言,數據的采集和加工利用,尤其是算法的奧秘與玄妙,簡直是黑箱,或者是魔球,他們根本不能意識到、認識到自身所處的環境和所受的影響。因此,對數據和算法進行規制,應該成為數字經濟、數字社會中的關鍵性規制議題。

但應該指出,這并不是說數據和算法注定是一種危害物,恰恰相反,它們不但是新的賦能工具,而且是新的生活方式,更是一個前所未有的創新領域。因此,對數據和算法的規制不應該扼殺創新的推進和社會福利的提高。而技術的革命性與顛覆性,場景的豐富性和復雜性,使得規制在興利與除弊之間的平衡變得非常困難。

正因為存在這種困難的平衡,才使規制探索更有必要、更有意義?,F在,無論政策界還是學術界,都在積極探索數據和算法的規制依據、規制手段、規制尺度,并且取得了初步成果,但也引發了不少爭論。從長遠來看,在數字革命浪潮中,在全世界范圍內可能需要建立一個數權(Data Rights)體系,就如過去幾百年里,在工業革命浪潮中建立了一個包括物權、債權、股權等權利主張的產權(Property Rights)體系一樣。這將花費較長的時間,并經歷較多的糾葛。世界上最早、最完備地建立產權體系的國家是英國,建立過程經歷了訴訟與判決互動、普通法與衡平法交織的數百年漫長時間。比較完備的數權體系的建立,盡管不需要上百年時間,但很可能需要幾十年時間。與數權體系相配套,可能還需要建立算責(Algorithmic Responsibilities)制度,建立專門的數據法院,非常有利于數權和算責體系的建立。數權和算責體系應該告訴人類社會,數據的權利如何分配、如何確定、如何保護、如何重置、如何獲利,算法和其他此類的自動化、智能化程序產生的行動應該如何界定責任、追究責任。盡管這是人類歷史上一個前所未有的新范疇,不可能一蹴而就,但重要的是,應該樹立這樣的意識,并以這個意識引導人們邁出堅定步伐。而廣泛討論和無數回合,正是通向這個目標的正確道路。

猜你喜歡
規制數字算法
互聯網平臺的封禁行為及其法律規制
哪種算法簡便
Travellng thg World Full—time for Rree
進位加法的兩種算法
根據問題 確定算法
共享經濟下網約車規制問題的思考
答數字
完善地方政府行政作為法律規制的思考
數字看G20
內容規制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合