?

算法歧視的敏捷治理
——以D短視頻平臺為例

2024-03-05 13:25進,劉
關鍵詞:用戶算法

高 進,劉 聰

1.東北大學 文法學院, 遼寧 沈陽 110169

2.北京航空航天大學 公共管理學院, 北京100191

一、問題提出

(一)算法歧視的風險挑戰

算法作為大數據時代的重要產物,能夠將低價值的原始數據轉化為高價值的衍生數據[1],有效應對海量數據收集、分析和利用難題。算法實踐已然成為人與代碼結合的運行規則,人類社會由此邁進“算法社會”。然而,基于“算法為王”邏輯下的算法泛化也暴露出算法的陰暗面,滋生出嚴重的算法歧視問題。算法歧視是以算法為手段實施的歧視性行為[2],是由于數據誤差、認知偏見、暗中操縱等原因導致算法喪失中立性而造成的差別對待和歧視性后果。算法歧視具有高度的隱蔽性、單體性、連鎖性,嚴重損害社會公平正義?!捌娺M、偏見出”的算法運作流程形象地概括了算法歧視的邏輯機理[3],這種建立在“先天不足”基礎上的算法設計和應用勢必會造成算法運算的“最佳結果”與客觀現實的偏差。年齡歧視、性別歧視、種族歧視、消費歧視等均為常見的算法歧視類型,故此“技術中立”及其衍生的“算法中立”能夠自覺實現算法向善和社會治理的論斷本身就是一個偽命題。因而,厘清算法歧視的負效應,探索實現算法治理的實踐進路成為一項亟待解決的重大理論和現實問題[4]。

算法歧視的負向效應可歸納為三點。其一,擾亂市場秩序。以算法技術賦能互聯網平臺是提升企業競爭力的重要手段。然而,企業具有天然的逐利性,平臺憑借算法技術和大數據優勢能夠更好地掌控消費者的個人數據信息,從而增添博弈砝碼,實現利益最大化。例如,通過算法測度用戶消費習慣、消費頻率、消費能力等個人信息,預測研判消費意愿,精準設定價格邊界,實現區別定價和“大數據殺熟”[5]。差別定價是算法歧視的突出表現,新老用戶極易產生“物美價廉”的錯覺,墜入被“割韭菜”的陷阱難以自拔。算法歧視塑造“檸檬市場”的同時也嚴重擾亂了正常的市場秩序。其二,危害社會公正。算法計算具有傳統人工難以企及的效率優勢,但是算法自動化決策盲目追求效率忽視公平也會滋生算法歧視。例如,崗位招聘中的性別歧視、融資信貸中的種族歧視、就業市場中的年齡歧視等均為歧視性的算法設計。此外,算法介入司法領域進行案件審理、犯罪預測等工作也會因開發人員主觀價值而造成結果偏差,損害司法公信力。主觀設定使得歧視對象被算法割裂,長期處于弱勢地位、背負算法污名[6]、淪為邊緣群體,誘發“馬太效應”,危害社會公正。其三,損害公民權利。侵犯平等權和隱私權是算法歧視突出的表現[7]。算法運作以掌控海量數據為前提,資本一旦介入算法開發,算法必然不遺余力地收集個人后臺信息有針對性地實施歧視性行為,從而實現利益最大化,算法歧視不僅侵犯了個人隱私,而且還會誘發信息泄露的連鎖反應。此外,算法通過深度分析私人信息塑造對個人全景畫像,實現標簽化處理,為個性化推送、差別定價等歧視性行為做鋪墊,損害公民平等權。

以算法歧視為代表的算法“算計”行為已然成為擾亂市場秩序、損害公平正義、侵犯公民權利的重大社會風險。此外,算法歧視具有隱蔽性、多樣性、高風險性,因而亟須回答算法歧視“何以產生”“以何治理”等現實之問。

(二)算法歧視何以敏捷治理

算法歧視是算法技術產生的黑暗面,技術的不確定也加大了算法治理的難度?!捌脚_治理場域”作為算法歧視的高風險區亟須強化算法治理,實現可持續發展。為此,國家互聯網信息辦公室等部門制定了《互聯網信息服務算法推薦管理規定》(簡稱《規定》)并于2022年正式施行,《規定》主要聚焦算法監管和規制層面的內容,闡述了全程監管的核心理念,蘊含著互動監管規制、賦能社會監督、探索治理革新等路徑和舉措,為破解算法歧視,提升算法張力指明了方向。此外,算法歧視作為兼具技術和價值雙重屬性的新興治理難題必然離不開新型治理工具、治理理念、治理手段的助力加持,因而治理模式轉型升級成為助推算法歧視治理的關鍵舉措。

敏捷治理作為一種針對大數據、人工智能等新興產業監管而提出的治理理念[8],為算法治理提供了借鑒。敏捷治理是一套具有柔韌性、流動性、適應性的行動或方法,是一種自適應、以人為本、具有包容性和可持續的決策過程[9],能夠有效適應復雜多變的環境,提升社會治理的質效。敏捷治理強調治理節奏的靈活與迅捷,治理規則的彈性與剛性有機結合,治理關系的多元主體協同共治以及治理方式引導性治理。在人工智能等新興產業技術迭代升級速度明顯超過治理變革速率的大數據時代[10],敏捷治理憑借強大的靈敏感知、快速響應、持續發展能力重塑了治理的理念、工具、范式,已然成為實現算法治理的必備利器。此外,敏捷治理依托先進技術和多元主體優勢,構建政府、社會、企業、公民互助合作的治理共同體,促進由被動響應向主動施為過渡的治理轉向,實現結果導向到過程導向的治理變革[11],打造出整體智治和協同共治的治理機制,為破除算法歧視風險,實現算法治理提供了智力支持,進而助推國家治理能力和治理體系現代化的實現。

與傳統治理模式相比,敏捷治理具有多方面的價值優勢:

其一,治理主體優勢。大部分傳統治理模式是單一主體主導下進行的治理嘗試,例如政府治理、公司治理,實則是對傳統管理、管制思想的延續。盡管部分治理模式強調多元合作治理,但合作主體的主動性、合作程度、合作成效等尚有待提高,治理過程難免淪為主導者的“獨角戲”。敏捷治理倡導協同共治,契合治理多元化趨勢的同時賦予主體更多的治理權限[12],是合作深度和治理向度的躍遷,是共建共治共享的有機統一。

其二,治理工具優勢。借助行政、法律、經濟手段施行治理是傳統治理的顯著特征,但是治理工具剛性有余而韌性不足[13],因而治理質效相對低下。整體智治是敏捷治理的應有之義,大數據、人工智能等技術工具為敏捷治理提供了精準、高效、韌性的治理手段,從而靈活應對“算法社會”的治理難題。

其三,治理價值優勢。結果導向是傳統治理的邏輯核心,其治理理念僅側重對最終結果的量化評價而缺乏對治理過程的關注,因而治理節奏和治理成效相對不足?!懊艚荨弊鳛槊艚葜卫淼暮诵睦砟?強調過程治理和結果導向的有機統一[14],是對治理節奏和治理質效的優化提升,彰顯了敏捷的價值優勢,實現了對傳統治理理念的進階和超越。

其四,治理范式優勢。先破后立的被動響應式治理是傳統治理的通病[15],是建立在問題爆發基礎上的事后“亡羊補牢”,治理成本和治理難度較高。敏捷治理則是由應對型治理向預見性和敏捷性治理的轉型,強調先立后破和破立并舉[16],是彌補治理滯后、治理未預風險,實現動態、靈活、敏捷的治理優化,塑造了一條新型治理范式。

算法歧視是技術和倫理問題的統一體,難以一蹴而就,因而其治理重點在于實現技術治理和協同治理,治理難點在于保持治理靈活性、敏捷性、動態性。以敏捷治理理念賦能算法歧視治理,提升算法治理質效大有可為。一方面,算法設計、算法測試、算法運作等各個階段都有可能導致算法歧視,因而算法治理必須是全過程式的治理,必須涵蓋事前、事中、事后的算法全生命周期。敏捷治理也是一個動態性的治理過程,“靈敏感知—快速響應—持續發展”的運作流程體現了敏捷治理的內在邏輯和價值優勢[17]。因而,算法歧視和敏捷治理具有較高的契合度,聚合二者優勢能夠更好地取得算法治理的成效。另一方面,算法歧視既是一個技術問題,又是一個倫理問題,因而算法治理需從技術維度和主體維度進行綜合施策。敏捷治理聚合了敏捷和治理的價值優勢,強調整體智治、協同共治、動態管治,蘊含著對先進技術的考量和多元主體的重視,能夠以快速、靈活、有效的方式回應公眾的訴求[18],從而與算法歧視治理產生強烈的共鳴,實現合作共謀?;诖?本研究以算法歧視為切入點,運用敏捷治理模式,嘗試將兩大命題組合研究,以期為破解算法歧視難題、優化算法治理提供智力支持。

整體而言,本研究主要包括以下內容:其一,厘清算法歧視的負向效應,歸納敏捷治理的價值優勢,論證敏捷治理與算法歧視結合的合理性、適切性、必要性,從而奠定本研究的理論基礎;其二,以短視頻平臺算法為切入點,通過參與式觀察總結歸納算法歧視的隱形邏輯;其三,在短視頻平臺隱形邏輯的基礎上對算法歧視的類型進行劃分并揭示問題的成因;其四,將算法歧視和敏捷治理相結合,嘗試構建短視頻平臺算法歧視的敏捷治理框架,助力算法治理的實現;其五,總結歸納研究結論,簡要說明本研究的邊界價值和研究局限。

二、“黑箱代言”:短視頻平臺算法運作的隱形邏輯

截至2022年,中國短視頻用戶規模首次突破10億人,用戶使用率高達94.8%,人均單日使用時長超過2.5個小時,短視頻平臺已成為人們信息獲取、情感交流和意見交換的重要場所。D短視頻平臺憑借強大算力支持和算法優勢,通過迭代優化升級,聚合資源優勢,創制出“短視頻+”的發展模式,衍生出購物、直播、放映、知識、游戲、音樂等多重服務功能,從而精準捕獲個人需求、迎合用戶偏好,不斷強化用戶黏性。D平臺2022年數據報告顯示,其用戶規模已超過6億人,月均熱點視頻播放量超過4 000億次,月均熱點創作者超過70萬人,月均熱點數超過100萬次,月均熱點視頻漲粉數超過3億人,已然成為當下短視頻行業的“龍頭”。然而,D短視頻平臺“頂流”的生成實則是基于“流量至上”的算法邏輯“精心設計”的產物,因而亟須在厘清算法隱形邏輯的基礎上,有效實現對“看不見的不正義”的敏捷治理。敏捷治理作為算法治理的新范式,能夠有效應對算法技術與倫理所帶來的歧視性挑戰,尤其適用于“強算法”主導下綜合類短視頻平臺治理,即以D平臺為代表的具有社交、拍攝、購物等多種功能的短視頻平臺。為此,本研究嘗試利用敏捷治理賦能D短視頻平臺治理,以期化解綜合類短視頻平臺存在的算法歧視難題,而對于缺乏推薦模塊與熱門模塊等功能的主打特定領域視頻的聚合類短視頻平臺和以視頻剪輯功能為主的工具類短視頻平臺等“算法不足”或“歧視不顯”平臺而言,敏捷治理模式的適用性尚待驗證。

算法作為“非人性”的行動者,其能動作用的發揮需要借助代言機制來實現。因而,算法運作以“代言人”的價值觀念為基礎,算法執行的是“代言人”的意志。D短視頻平臺正是基于這種模式,通過與算法合作的方式將平臺的意志、利益、價值等注入算法設計、執行的全過程,從而實現算法“私用”,造成算法不公,滋生算法歧視危機。

由于算法“黑箱”的存在,平臺的算法邏輯往往具有隱蔽性。技術性問題僅是產生算法歧視的表象,平臺價值層面的倫理問題才是算法歧視泛濫的根源,因而亟須厘清D短視頻平臺算法運作的隱形邏輯,維護算法的公平正義?;诖?筆者通過1個月的參與式觀察對D短視頻平臺手機應用軟件(App)界面推送的內容進行了統計和整理,最終獲取了914條數據信息,進而總結歸納出引致算法歧視的3條算法設定和6條隱形邏輯,如表1所示。

表1 D短視頻平臺的算法邏輯

(一)用戶圈層:基于精準畫像的數字化營銷

1.用戶偏好:基于用戶客觀行為的相似性推薦

發掘用戶個人偏好,進而實現精準“投喂”是D短視頻平臺算法的首重邏輯。偏好的捕獲是基于D短視頻平臺對用戶私人信息的數據抓取、描繪用戶畫像、實現標簽化處理基礎之上的,進而“投其所好”謀求利益最大化。筆者通過參與式觀察發現涉及用戶偏好的內容最多,共計270條,占總數的29.5%,其中多為與筆者點贊的視頻、收藏的內容、參與的評論、瀏覽的商品等有關的內容。盡管不同用戶興趣點可能千差萬別,但是基于特定標準下連續30天的觀察結果的一致性同樣說明D短視頻平臺對用戶偏好的重視。雖然這種設計滿足了用戶的需要,但是建立在獲取用戶信息和利益優先基礎上的“服務”誘發了信息泄露風險和內容同質化危機,也搭建了算法歧視的“溫床”。

2.社交關系:基于用戶社交群體的圈層化推送

“社會人”是用戶的基本屬性,基于用戶社交關系的相關性進行算法歧視是D短視頻平臺的另一隱形邏輯。具體來看,用戶社交又可分為一級社交關系和二級社交關系,D短視頻平臺根據用戶關注博主和通訊錄好友等信息判定用戶興趣,從而在一級社交網絡中推薦深受圈層內群體喜愛的內容和產品。關注好友的好友、通訊錄好友的好友等可能認識的人構成用戶的二級社交關系,平臺借助大數據優勢深度分析用戶偏好,從而迎合用戶需要。筆者觀察發現與社交圈層相關的內容共有136條,占比為14.9%,其中一級社交關系101條明顯超過二級社交關系35條,客觀說明二者與用戶連接的強弱和影響力大小。此外,基于社交圈層的算法邏輯助長了隱私泄露的風險,如“推薦給可能認識的人”的功能往往處于默認開啟狀態,用戶信息在算法推薦之下暴露在公共空間之中,嚴重損害個人利益。

(二)議題場景:基于場域關聯的關系再生產

1.公共議題:基于熱點或媒體的持續性推介

短視頻的快速崛起迫使傳統媒體向新媒體轉型,媒體的集聚也促使D短視頻平臺對于公眾議題進行適當關注。然而,由于D短視頻平臺新聞推介的公益性置于平臺私利性之后,因而其公共議題的推送帶有明顯的選擇性,對于獵奇、娛樂等用戶感興趣的話題報道頻次明顯高于用戶不太“感冒”的內容。筆者在調查過程中發現“獨臂猴‘星星’”“多地加入下雪群聊”等類型的議題、熱點多次出現,而“問天艙轉位成功”“諾貝爾獎”等內容出現頻次和時長明顯不如前者,盡管二者都來自各大主流媒體,最終內容呈現卻是平臺選擇的結果,這也在一定程度上反映了平臺流量至上、利益優先的歧視性思維。98條與公共議題相關內容占總數的10.7%,相較于用戶偏好、社交圈層而言數量明顯偏少,此外以時效性和流量為依據的選擇性推介也加劇了算法歧視的風險。

2.特定場景:基于用戶位置和情景的相關性推廣

基于本地或情景的內容推薦是產生算法歧視的又一重邏輯。筆者調查發現“附近”的內容占很大比重。如根據空間位置的差異,推送內容差異性明顯,從區、到市再到省、全國算法推薦的內容頻次、數量等呈明顯的下降趨勢。D短視頻平臺將本地市場視為最基本的單元,從而挖掘最有用的信息,增強用戶黏性,刺激用戶消費,實現收益最大化。此外,基于特定場景和時間段的內容也具有差異性,如“雙十一”多推送產品與消費,節假日多呈現“吃喝玩樂”相關的內容,一天中的某個時段定點更新特定內容等。特定場景下的算法推送是D短視頻平臺精心設計的產物,其目的在于通過蹭熱度實現平臺利益更大化。該種情況共計105條,占11.5%,是基于平臺內容與地理位置或特定情境等內容最優化匹配的結果。

(三)誘導邊界:基于利益優先的用戶再俘獲

1.平臺優先級:基于商業邏輯下的合作化運營

平臺優先是D短視頻平臺內容呈現的關鍵因素之一,即相較于其他信息,與平臺組織的活動、參與合作的對象等內容會在不經意間優先呈現在用戶面前。D短視頻平臺正是基于這種商業邏輯暗中攫取最大化的收益,而其他高質量的內容由于缺乏與平臺的“合作”容易被“雪藏”。筆者調查發現,此類信息多以“小標+文字”的形式出現在D短視頻平臺界面左側,具有明顯的提示性和故意誘導性色彩。筆者共計獲取了219條相關數據,占參與式觀察數據總量的24.0%,平臺優先級的算法設定是一種隱蔽的商業邏輯,呈現出D短視頻平臺商業資本的意志,因而也是一種歧視性行為。

2.差異化:基于用戶邊界興趣的嘗試性探索

有別于上述五種情況,D短視頻平臺也會偶爾呈現一些“另類”的內容。其主要目標并非豐富用戶體驗,而是用來試探用戶的興趣邊界,從而為“歧視”行為鋪路。差異化的試探多出現在“新手期”,由于平臺缺乏對新用戶的信息掌控,需要借助該策略拋出“誘餌”,并根據用戶行為分析個人偏好,因而內容具有較高的隨機性和公平性,但本質上還是算法歧視。此外,平臺借助大數據和算法“黑箱”優勢能夠及時監測用戶行為的變動,一旦察覺用戶“反?!?平臺會及時推送差異化的內容和產品,從而再次把控用戶。經調查發現,差異化的內容較少,僅有86條,占比最小,但其仍是平臺實現算法歧視行為的重要手段。

三、“看不見的大象”:短視頻平臺算法歧視的形態及成因

算法作為數字時代的重要產物,匯聚了人類的智慧和經驗,無時無刻不在影響和塑造人們的生活。D短視頻平臺正是憑借其算法優勢成為當下最火的短視頻平臺之一,滿足了不同群體記錄美好生活的需求,豐富了大眾的精神世界。然而,看似客觀公正的算法背后實則暗藏玄機,隱性的算法歧視無形之中侵犯了用戶的合法權益,以“合理”的方式延續不合理的行為,成為房間中“看不見的大象”。

(一)短視頻平臺算法歧視的形態

1.千人千面:用戶畫像

用戶畫像是對用戶信息分析而來的高度精練的特征標識,是指根據用戶的屬性、用戶偏好、生活習慣、用戶行為等信息而抽象出來的標簽化用戶模型。研究表明,構建用戶畫像模型有助于更好地理解用戶需求,實現個性化、精準化信息服務。然而,D短視頻平臺用戶畫像的生成是基于特定算法設計的基礎上對用戶特征的標簽化處理,其中可能摻雜著“歧視性”的算法設定,從而影響畫像質量和服務供給的有效性。

用戶信息和用戶行為是D短視頻平臺進行用戶畫像的算法邏輯。其一,從用戶信息獲取來看。一方面,D短視頻平臺對用戶設計了信息完善提示以及數據默認獲取的條款,一旦用戶禁用App獲取某項權限,算法機制將會反向禁止用戶訪問平臺,例如禁用App允許訪問互聯網、通信記錄等功能將無法瀏覽作品等,從而以“提供服務”的方式裹挾用戶,持續對用戶進行“數據壓榨”,不遺余力地掌控個人信息,為算法歧視鋪平道路。另一方面,基于認知偏見和客觀偏誤所設定的算法可能會導致D短視頻平臺因為用戶性別、個人職業、受教育程度、經濟狀況等差異性而生成的用戶畫像發生扭曲和丑化。例如,算法默認性別差異存在內容偏好,并對女性和男性用戶分別長期推送化妝品和煙酒等與性別高度相關的內容;算法佩戴“有色眼鏡”,并根據經濟差距誘導高收入群體消費奢侈品而對低收入群體推送低價促銷產品等。其二,從用戶行為觀察來看,D短視頻平臺能夠有效捕捉點贊、評論、轉發、收藏、購物等用戶行為,進而在根據個人行為生成“刻板印象”的基礎上有針對性地進行服務供給。然而,用戶畫像的本質是機器學習基礎上的標簽化管理,簡單化的行為統計難以適用于全部用戶,極易引致算法歧視危機。例如,新用戶由于接觸時間短,用戶黏性較小,能夠捕捉到的行為有限,因而算法可能會將用戶“不經意間的小動作”貼上特定標簽,例如瀏覽涉及宗教、民族內容可能被判定為狂熱分子,制約用戶高清畫像的描繪,從而對其產生歧視性影響。此外,對于App忠誠度高的用戶而言,其頻繁的個人行為也加劇了算法數據分析的難度,因而D短視頻平臺后臺有時難以實現對同一用戶的不同來源數據的有效取舍和科學整合,例如經常性地隨手點贊關注可能會導致無效推送的泛濫。此外,一旦機器算法接受默認設定,將會導致同一用戶的不同特征分散在不同用戶對象上,無形之中產生歧視性問題,進而無法進行標簽間的關聯分析或降低分析的精確性。因而,基于“只言片語”或“微末小事”而生成的用戶畫像可能將會被打上特定的烙印,進而誘發“看不見的不正義”。

2.千人千方:個性化推送

短視頻推送是D平臺的首要功能。盡管推送內容理論上具有隨機性,實則暗含“你是誰”決定“給你推送什么”的邏輯,算法歧視以一種“高明”的方式長期“合乎邏輯”地侵害用戶合法權益[19]。D平臺視頻推薦算法是在平臺主導下,通過與用戶、合作對象等相互影響和互動博弈而建構生成的“最優產物”,其蘊含著平臺的價值觀,而非完全客觀中立。

D短視頻平臺算法推送形式包括三種。其一,冷啟動?;趨f同過濾算法實現內容精準推送,即根據“用戶分類中屬于同一類別的用戶會對同一類內容感興趣”的指導思想對用戶進行畫像[20],并按照內容標簽進行用戶匹配。其二,加權。通過疊加推薦算法將視頻進行逐級推送,即將初級流量池中的“精品”溢出到更高一級流量池進行二次推送,多次重復上述環節實現逐級加權和疊加推薦。其三,合作?;谄脚_開發和管理者的分發加碼推薦,即通過與平臺合作、付費推薦等方式對視頻進行人為“加碼”,從而提升熱度和曝光率。D短視頻平臺算法推薦機制如圖1所示。

圖1 D短視頻平臺算法推送機制

D短視頻平臺算法推送本質上屬于流量至上的推薦方式,以用戶與算法互動為前提。一方面,算法通過捕獲性別、年齡、定位、興趣、社交等個人信息分析用戶需求對用戶進行畫像和標簽化處理,從而實現個性化推送;另一方面,用戶播放、點贊、評論、轉發等行為也在不斷修正既有的算法進而影響算法的下一次推送。個性化推送是算法極力挖掘并分析個人信息的必然產物,精準化的背后是建立在違規獲取用戶信息的基礎上的,平臺“上帝視角”下的用戶變成一個個“透明人”,既是對法律的漠視,亦是道德的淪喪。算法推送契合用戶需要的同時蘊藏著極大的不確定性,同質化內容推送束縛了用戶的個性化發展,極易造成“信息繭房”。此外,流量至上導向的算法推送過分強調“熱度”,缺乏對作品質量和用戶實際需求的考量,難免陷入“馬太效應”的泥淖,誘發“檸檬市場”危機,阻礙內容創新的同時有損平臺和用戶的長遠利益。算法推薦的“千人千方”實質上造就的是“單向度的人”。標榜平臺算法推薦公平實則是一個偽命題,個性化推薦背后蘊含著嚴重的算法歧視,D平臺亟須反思算法推薦的公平性、透明性、倫理性,而不是打著“一視同仁”的幌子繼續“圍獵”用戶,延續“千人千方”的算法傳統。

3.千人千價:大數據殺熟

數字經濟熱潮助推了短視頻平臺消費購物業務的快速崛起,集多功能于一體的D短視頻平臺已然發展成為當今世界最大的“獨角獸”企業之一。用戶在享受短視頻樂趣的同時也能夠借助D平臺商城、直播帶貨等新途徑滿足消費需要產生全新的體驗。消費購物業務的拓展無疑符合平臺、企業、用戶等多方的利益訴求,但是消費熱度攀升的同時也須時刻提防消費風險。囿于平臺算法“黑箱”和用戶有限認知等多方面的原因,算法歧視屢見不鮮,特別是算法定價下的“殺熟”問題。

“大數據殺熟”本質上是價格歧視,是平臺憑借算法優勢實施的價格違規行為,即購買同樣的商品,老用戶往往比新用戶的價格高。算法價格歧視的生成是平臺經過精準計算的結果,其具體邏輯如下:首先,信息收集,打造“數據倉庫”,即通過采集用戶設備信息、行為偏好、服務記錄等內容,實現信息歸集生成“元數據”;其次,數據分析,生成“用戶畫像”,即借助大數據和機器語言深度處理數據源,將“元數據”轉化為“智能數據”;最后,算法定價,實現“千人千價”,即借助算法優勢研判消費意愿,預測價格邊界,實現平臺利益最大化。算法定價是建立在平臺充分掌握用戶私人信息的基礎上的歧視性行為,損害消費者合法權益。D短視頻平臺算法定價機制如圖2所示。

圖2 D短視頻平臺算法定價機制

D短視頻平臺算法定價是以一種極其隱蔽手段實現的價格歧視行為。后臺在挖掘用戶個人信息的基礎上,通過運用大數據深度分析用戶的消費頻率、消費習慣、消費地域、消費能力等原始數據,借助平臺算法優勢進而實現“區別對待”和“差別定價”。D短視頻平臺算法歧視性定價不但嚴重侵害消費者的合法權益,而且擾亂了市場交易秩序,算法不僅難以契合造福社會的設計初衷,反而容易異化為維護平臺權益的“私人工具”。D平臺主要是通過在技術上運用算法技術和在結果上設置價格歧視來損害消費者的公平交易權。一方面,算法權力作為平臺最大程度攫取利益的手段,具有維護平臺利益的天然性,價格歧視在所難免;另一方面,平臺通過與算法權力結合生成一系列行為準則,將算法歧視隱匿到合理合法的定價之中,實現“暗箱操作”。D平臺利用算法權力以低價吸引新用戶,培養新的消費增長點,進一步拓展消費市場,為“割韭菜”做準備;以高價示意老用戶,營造“物超所值”的錯覺,增強用戶黏性,運用“大數據殺熟”,持續剝削剩余價值。平臺差別定價僅是“大數據殺熟”的表現,算法歧視才是“大數據殺熟”的實質,因而破解“千人千價”的治本之策在于算法治理,否則算法難免陷入由“計算”到“算計”的怪圈。

(二)短視頻平臺算法歧視的成因

1.刻意為之:主觀設計下的“杰作”

滋生算法歧視的首要原因在于算法開發者及平臺管理者的主觀因素。無論算法如何高明,其自始至終都無法脫離人而獨立存在,算法的設計、運用、修正等都離不開人的參與,因而算法本質上屬于人類智慧的結晶,這也決定了算法中充斥著人類主觀價值的必然性。

算法開發者的主觀歧視造成算法歧視。算法歧視很大程度上是對現實社會中偏見、歧視的虛擬映射,算法設計者自身難免存在顯性或隱性的歧視,如果算法設計者將主觀意愿及隱含偏見用以設計算法就必然導致算法歧視。例如,算法中性別歧視、種族歧視、就業歧視等都是算法設計者主觀思維的產物。此外,囿于算法開發者認知、經歷等條件的限制,其不可能是完全理性的人,即使算法開發者沒有任何歧視的初衷,通常還是難以完全屏蔽刻板印象與偏見。算法設計者長期的思維和邏輯使其容易固化唯技術主義的“科學”,選擇性忽視算法模型適用領域的知識背景和價值規范,僅以代碼“轉譯”公平正義等倫理價值,因而在算法開發中極易陷入“只見數字不見人”的陷阱。從倫理方面入手,加強行業自律,實現價值重塑,從源頭遏制和預防算法歧視是破解開發者算法歧視頑疾的首要環節。

D平臺主動干預導致算法歧視。企業具有天然的逐利性,D短視頻平臺引進算法的首要目的在于實現利益最大化。平臺管理者通過利用誘導、施壓等手段與算法開發者暗中達成協議,從而促使算法設計更加符合平臺的利益。開發者與管理者暗中結對的行為是以犧牲平臺用戶合法權益為前提,將利益凌駕于倫理道德和國家法制之上,算法歧視在所難免。此外,平臺與企業也存在利益勾連。企業通過顯性或隱性尋租與D平臺展開合作,促使平臺在算法設計中穿插企業利益進而大肆宣傳,從而潛移默化地影響用戶的消費行為。但這種合作往往僅出于利益多寡的考量,僅是對金主實力的價值排序,平臺對于企業資質、產品質量、視頻內容等缺乏足夠的重視,虛假宣傳、誘導消費等成為常態,例如D平臺界面下的游戲廣告投放、熱榜提醒等。而對于高質量“無背景”的作品難免受到算法的歧視,始終保持不溫不火的狀態,最終淪為熱門視頻的“陪跑員”。D短視頻平臺對于算法的主動干預勢必會將利益、價值取向等主觀因素嵌入到算法當中,刻意為之的行為必然導致算法歧視的惡果。從外部入手,強化平臺的監管和懲處是應對算法歧視的重要手段。

2.無心之失:客觀局限下的產物

算法歧視并非都是主觀設計下的產物,客觀局限性的存在也是滋生歧視性問題的重要原因。D短視頻平臺算法流程大致包括構建初始化模型、輸入訓練數據、算法自我訓練、輸入驗證數據、驗證算法結果、生成算法應用等步驟[21],任何環節出現問題都有可能導致算法歧視。樣本數據偏差、算法“黑箱”等客觀局限性是算法歧視問題蔓延的主要原因。

數據偏差導致算法歧視。樣本數據常被喻為算法的“教科書”[22],機器學習的效果與樣本狀態存在莫大的聯系。參與訓練的數據來源應當兼具隨機性和均衡性,訓練數據數量既要適中,樣本差異性又要適度,從而構造出可供訓練的數據集。如果數據采集過程中樣本過于集中,忽視其他邊緣樣本,算法最終也僅適用于部分群體,未被采樣的群體自然而然地被排斥在外,無形之中滋生算法歧視。D短視頻平臺是基于用戶現有數據實現內容推送和消費報價,如果用戶注冊信息不完整或不準確,算法歧視也會隨之而來。此外,訓練數量太小、異質性過大的數據集同樣無法代表現實中數據的整體分布狀態,數據訓練過程往往過于順暢,結果易于擬合,難以揭示其他小概率事件,因而后續算法開發和運用時常面臨“失算”的風險。數據偏差既可以直接導致算法歧視,也可以通過間接影響機器學習誘發算法歧視,而后者的隱蔽性更高,危害性也更大。算法自學是當下算法開發的重要趨勢,但是由于算法自身信息甄別和過濾功能的滯后,算法在自學的過程中無法準確識別暗含歧視性色彩的信息,這種信息一旦被算法吸納并固化為思維定式就極有可能在特定場景下展現出“攻擊性”行為,進而導致嚴重的算法歧視問題。因而,合理規范平臺用于訓練的數據源,從源頭出發確保數據集的科學性是有效規避算法歧視的前提。

算法“黑箱”導致算法歧視。算法作為D短視頻平臺的商業機密,從數據輸入到輸出結果的全過程都在后臺統一實現,“黑箱”下的算法歧視問題由此產生。社會成員被完全隔絕于“黑箱”之外,算法運算的數據、過程分析邏輯等信息皆不對外開放,最終只會呈現一個冰冷的數字。關鍵過程的缺失加劇了平臺算法的非透明性,同時也導致算法歧視變得更加隱蔽,甚至在某些情境下,即便算法開發者和專業人士都難以察覺,算法歧視被“理所當然”視為“正常邏輯”,“黑箱”治理也顯得有心無力。此外,算法“黑箱”還加劇了平臺與用戶之間的信息不對稱性,使得用戶深陷算法歧視囹圄卻不自知。一方面,平臺能夠利用大數據優勢掌握用戶的大量個人信息并對用戶進行精確畫像和標簽化處理,從而實現有預謀的區別對待;另一方面,用戶之間相互獨立,個人無法掌握其他用戶的信息數據,因而不能橫向比對平臺算法運行的結果,即便成為被歧視的對象也渾然不知。算法“黑箱”加劇了算法歧視的風險性和隱蔽性,尚無治本之策,因而亟須社會多元合作建言獻策,防止無心之失誘發的算法危機。

四、逾越陷阱:短視頻平臺算法歧視的敏捷治理

算法歧視是算法社會無法回避的問題。政府以敏捷治理賦能平臺算法歧視治理,構建集政府、社會、平臺、用戶為一體的平臺算法歧視的敏捷治理機制實現共建、共治、共享,從而紓解算法歧視的難題。平臺算法歧視的敏捷治理機制如圖3所示。

圖3 平臺算法歧視的敏捷治理機制

(一)事前監測預警:靈敏感知機制

算法歧視治理的基礎在于通過信息賦權實現提前預防和洞察感應,平臺、用戶、政府、社會憑借各自的優勢共同構建起監管、評價、問責于一體的規范化機制是實現靈敏感知的前提。公眾參與和公開披露是實現有效治理的關鍵。

其一,構筑多元主體參與的監測預警機制。D短視頻平臺作為算法歧視的責任主體亟須在倫理反思的基礎上實現價值重塑和算法公平,嚴格遵循平臺算法規范,破除歧視性思維慣性。D平臺通過利用平臺大數據優勢實現全天候自我監控,及時發現算法漏洞和歧視問題。唯有實現倫理、技術、人三者之間的協調才能增強平臺的洞察力和敏捷度[23],才能走出算法歧視的困境。事前審查是確保算法公正的前提,政府有權對D短視頻平臺算法進行規范和防范,為此必須配置科學合理的規章制度,事先規避算法歧視。政府按照“包容審慎”的原則不斷強化對D短視頻平臺算法的動態監管,既要在數據層面嚴格規制算法歧視,又要鼓勵D短視頻平臺算法技術賦能,不斷強化技術能力,以算法監測算法,從而提升感知和預警能力。用戶作為“弱勢群體”更應提高對算法歧視的重視程度和感知察覺能力。避免被“被歧視”的最優路徑在于意識培養和能力提升,通過多種途徑獲取算法知識和反歧視技能并時刻保持清醒的頭腦,筑牢用戶防范平臺算法歧視的心理防線,從而更好地監測算法歧視。政府為解決這一“頑疾”需要集行業、媒體、專家等多元主體社會合力實現對算法歧視的常態化監控,構筑全方位無死角的感知預警機制,破解算法“黑箱”背后的歧視難題。

其二,充分利用輿論、數據、算法優勢預設“敏捷評價”系統。依托云計算、智慧大腦等新型基礎設施建設實現風險預警與評估,通過多維測評具體算法歧視的風險性及危害程度,有針對性地編制治理預案和防范措施。此外,通過遠程接入和實時動態的方式,密切關注平臺算法歧視的動向,研判其運作路徑和變化曲線,并參照專業團隊的評價意見快速有效地得出應對策略。

其三,落實合理問責機制。針對短視頻平臺算法歧視類型、成因、后果等差異性分別施以不同的應對策略和懲處措施,對于不同責任主體實現差異化問責。推動問責關口前移,打好“預防針”,進一步落實短視頻平臺算法責任人的具體責任,實現先立后破和破立并舉,規避后發治理模式難以規避既損利益的弊端。靈敏感知機制作為算法歧視事前預防和感應的重要抓手,能夠有效應對短視頻平臺算法歧視危機,通過提升預警和感應能力,實現監督評價問責的規范化,助推算法治理成效。

(二)事中控制化解:快速響應機制

快速響應是應對算法歧視的核心要義,政府需要以大數據、智能算法、專家智慧聯動式響應為基礎實現“獨白性話語”向“共識性話語”轉化[24],提升敏捷響應能力。

其一,提升視頻平臺大數據平臺的分析和處理能力。D短視頻平臺對于算法歧視負有不可推卸的責任,因而打通算法的堵點、痛點必先始于短視頻平臺。大數據優勢是平臺處理算法歧視的利器,一旦平臺實時監控系統捕捉到算法歧視行為,系統會第一時間阻滯活動進行,并將數據信息上傳中控臺,從而控制和處理算法歧視,避免歧視性問題的擴大。

其二,注重智能算法的開發和運用,實現政府治理節奏和技術的適度融合。通過拓展技術融入算法治理的模式,充分借助第五代移動通信技術(5G)、區塊鏈、人工智能等技術手段實現算法歧視監管的全覆蓋,從而構建智能監控、快速研判、精準決策的政務智能服務平臺。政府運用平臺優勢對平臺信息收集、轉換、跟蹤、監控,及時發現推演算法歧視漏洞,憑借制度優勢嚴格管控算法歧視,高位推動平臺算法治理,一旦發現算法歧視的苗頭應在啟動緊急預案循規應對的同時實現綜合施策和高效化解。此外,政府還需構筑靈活的組織機構,迅速整合組織資源,使用跨學科、跨部門的工作方法迅速響應和處理歧視性問題。

其三,構建敏捷響應算法歧視的利益共同體。囿于算法“黑箱”和專業性的束縛,任何治理單體都難以實現對平臺算法歧視的敏捷響應和精準應對。一方面,算法歧視具有隱蔽性和復雜性,社會成員缺乏信息優勢和專業素養,面對算法歧視往往有心無力;另一方面,相較于被歧視的用戶,其他社會成員利益暫未明顯受損因而抱有僥幸心理、持觀望態度,主動應對算法歧視的積極性不高。此外,算法是把“雙刃劍”,任由算法歧視滋生勢必會損害整個社會的利益,因而亟須提升全社會的重視度,有效實現平臺用戶、專家群體、新聞媒體、行業協會、政府部門等多元群體的協同共治,整合各方優勢資源,一旦發現算法歧視行為,社會需要迅速做出回應,通過輿論施壓、建言獻策等手段合力破解算法歧視難題,維持算法社會秩序的公平、公正??焖夙憫獧C制是貫徹事中監管進而實現算法歧視治理的邏輯基礎,在傳統單維響應的基礎上共筑聯動式響應,提升響應的速度、廣度、深度,實現算法歧視的糾偏和優化。

(三)事后總結完善:持續發展機制

持續協調能力是敏捷治理最核心的功能,在事后總結和完善的基礎上綜合運用法制、科技、教育等治理手段打造持續發展機制實現治理結果的運用,助推算法治理質效提升。

其一,法律規約。法律是敏捷治理的邏輯底線,是維護算法公平的強大武器。政府在把控平臺算法歧視的基礎上,通過立法手段對平臺算法研發、運用進行規制,規范并防范短視頻平臺侵犯用戶合法權益的行為,適時出臺具有指導性的法律法規,健全立法體系。在貫徹《互聯網信息服務算法推薦管理規定》等文件的基礎上,根據暴露出的新問題及時對法律法規進行補充,保持法條與時俱進。此外,在立法保障的基礎上加快推進司法監督,充分利用大數據、智能算法等實現對短視頻平臺后臺的虛擬身份與實體身份的有效把控,將虛擬身份的不法行為落實到個人實體責任,實現立法、司法雙管齊下。

其二,技術規制。技術的升級與應用是算法治理得以可能的技術前提[25],從監管技術、吸收技術、技術反哺三方面入手凝聚創新勢能,實現技術手段賦能短視頻平臺算法歧視治理,在加大技術投入基礎上提升信息獲取、數據分析的精準度和高效率,實現算法優化并顯化算法的“可信賴性”。為此,政府應當打造智能監管平臺,凝聚監管技術實現對短視頻平臺的數智化監管,反思事前預警和事中控制的得失,總結監管不足、完善監管流程,實現監管力度、速度、成效的全面提升。短視頻平臺應當憑借大數據優勢實現自我監控,以更加高效便捷的算法技術提升監管效能,二者通過技術手段將監管推向縱深。打造政產學研合作的算法治理格局,實現政府、平臺、社會等良性互動,不斷吸收新技術,通過借助技術創新的優勢不斷優化算法技術和敏捷治理能力,從而以技術創新反哺平臺算法治理及政府數智治理。

其三,教育歸正。算法歧視不僅是技術性問題,更是倫理性難題,因而需要通過強化教育工作,提升個人素養。政府應當通過多形式、多途徑算法教育提升人的數智能力,實現“數能素養”的教育創新,破除知識與道德教育割裂的現象,倡導虛擬社會的行為規范。D短視頻平臺作為算法歧視的責任主體亟須通過倫理反思重塑平臺價值,強化算法自律,嚴格恪守道德規范,防止算法理性僭越。此外,用戶亟須提升自身素質,敏銳察覺并合理應對算法不公,實現對平臺算法歧視的反向干預,促進算法敏捷治理的持續性。

總體而言,算法歧視的敏捷治理是在平臺、政府、用戶、社會等多元主體通力合作基礎上聚合技術、倫理、制度、法律等優勢實現的算法全過程監管和治理,是從問題導向到過程控制再到結果應用的邏輯閉環,凸顯出協同共治、動態管治、整體智治的價值理念。靈敏感知機制、快速響應機制、持續發展機制三維合一的有機配置既契合敏捷治理的核心要義,又適配過程監管的邏輯內涵,能夠有效驅動算法歧視治理進程。

五、結論與討論

算法歧視是全社會的治理難題,本文選取D視頻平臺為研究對象揭秘算法運作的邏輯機理,分析算法歧視的主要形態與肇因,探索逾越算法“算計”陷阱的實踐進路,進而得出以下結論:

其一,“黑箱代言”背后的隱形邏輯是視頻平臺算法歧視的運作機制。算法運作的依據主要來源于算法開發者、平臺管理者等“代言人”的價值邏輯,最終生成的運算結果是建立在“代言人”利益“轉譯”基礎上的“最優產品”。D短視頻平臺代言機制背后的算法“黑箱”使得算法設計逐漸偏離計算的初心淪為“算計”的工具,算法歧視由此而生。用戶偏好、社交圈層、平臺優先級等表象背后暗含的隱形邏輯一方面使得平臺能夠借助合理合法的手段持續性地從事算法設計和平臺運作,從而更加便捷地壓榨新老用戶的剩余價值,最大程度地攫取社會利益;另一方面,用戶在算法邏輯的安排下極易陷入平臺精心挖掘的算法“陷阱”,從而沉溺在自我的“舒適圈”中難以自拔,加深人的工具化程度。

其二,主客觀因素引致的歧視性推送和定價是視頻平臺算法歧視的主要形態?!坝脩舢嬒瘛薄翱慈讼虏说薄按髷祿⑹臁笔荄短視頻平臺算法歧視的突出表現,是建立在流量至上和利益優先邏輯上的算法設計,是平臺管理者與算法開發者互動博弈、合作共謀的結果。以用戶興趣圖譜和行為表現為基礎的個性化推送和差異性定價一方面是由于算法漏洞或信息誤差所導致的數據錯配,因而算法歧視是客觀局限性下的產物,但另一方面,也是大多數情況下,算法歧視主要歸因于人為的主觀設定,是相關主體刻意為之的結果。算法本身并不具備價值和屬性,算法設計唯有符合主體的客觀需要和利益訴求才有被開發、被運用的價值,因而才會滋生算法歧視問題?!扒饲妗薄扒饲Х健焙汀扒饲r”背后的算法歧視是一種“看不見的大象”,因而政府唯有厘清算法歧視的主要形態,揭示算法歧視的肇因,才能防范算法異化的風險。

其三,敏捷治理是實現短視頻平臺算法歧視監管的重要手段。算法歧視是一項技術性、倫理性難題,以傳統監管方式和治理路徑審視新問題、應對新挑戰顯得“任重”而“力微”。敏捷治理作為一種極具韌性的面向不確定未來的治理形態,具有傳統治理模式無可比擬的感知性、反應性、持續性優勢。在正確把握開放與糾偏、精準與敏捷、合作與協同關系的基礎上[26],將敏捷思維注入算法監管,以技術手段賦能算法治理,實現動態監管與敏捷治理的有機結合,構建靈敏感知、快速響應、持續發展的算法治理機制。算法歧視監管的敏捷治理的探索嘗試對于實現整體智治和協同共治,打破“貓鼠博弈”的監管亂象,破解“打地鼠式”的治理難題,逾越“算法算計”的技術陷阱提供了智慧經驗和優化路徑。

本研究為破解算法歧視,實現算法善治提供了啟示。其一,加大算法技術研發,提升科技創新能力。算法歧視是一項科技問題,從技術入手方為“破局”之策。政府、平臺應當加大技術投入,促進治理技術迭代升級,提升智治能力。其二,自律與他律相結合。算法歧視也是一項倫理問題,重塑社會價值觀才是長久之計。一方面,平臺要遵守行業規范,恪守道德底線,保障算法公正。另一方面,政府要出臺法律制度,規范引導算法開發利用,嚴格懲處算法歧視行為,實現算法治理高位推動。其三,塑造多主體共同參與的動態治理格局。算法歧視治理難以一蹴而就,為此政府需要聚合各治理主體的優勢,注重治理的敏捷、靈活、持續性,從而實現流程再造和動態監管,優化算法治理的中國方案。

本研究的不足之處在于:首先,研究對象單一,對其他同類互聯網平臺的關注度不足,缺乏案例之間的對比分析;其次,研究僅從宏觀視閾探討了算法歧視敏捷治理的理論框架,并未從微觀操作層面提出具體的實用、適用性治理之策,因而亟須鼓勵多元主體共治,從法律、道德、市場、科技等方面綜合精準施策,優化算法治理的中國方案。

猜你喜歡
用戶算法
基于MapReduce的改進Eclat算法
Travellng thg World Full—time for Rree
進位加法的兩種算法
算法初步兩點追蹤
基于增強隨機搜索的OECI-ELM算法
關注用戶
關注用戶
一種改進的整周模糊度去相關算法
關注用戶
Camera360:拍出5億用戶
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合