基于區塊鏈技術對抗深度偽造現狀研究

2021-07-10 05:49白國柱張文俊

信息安全研究 2021年7期

衛霞白國柱張文俊

1(西安明德理工學院西安 710124) 2(國家計算機網絡與信息安全管理中心陜西分中心西安 710075)

深度偽造技術(Deepfake)可以生成人類肉眼無法辨別的虛假圖像、視頻，網友將此類虛假圖像、視頻稱之為Deepfakes[1].目前，諸如Openfaceswap,Deepnude,Zao等Deepfake應用都提供了一鍵式操作，極大降低了使用門檻，增大了Deepfake濫用的可能[2].Deepfakes進入數據高度開放流動的互聯網領域后，能夠令虛假信息以高度可信的方式呈現給社會公眾，使其影響力瞬間成千上萬倍放大，進而引導社會輿論，操縱國家選舉，威脅經濟發展，影響國際關系格局，對國家、社會和個人的聲譽造成巨大威脅.

目前，涵蓋技術和政策監管2個層面的對抗Deepfake已經成為各國研究的重點和難點.在技術層面，Facebook,Twitter等通過在功能、算法和策略方面作了大量嘗試[3]，但因為培訓數據的不足，導致虛假新聞界定的困難及信息重現的成本較高，從而使得收效甚微；在政策監管層面，少數社會媒體公司及政府權威機構通過規范網絡信息流，在對抗Deepfakes方面取得了一定的效果，但是該方法改變了社交網絡的功能和信任模型，與互聯網信息流動的開放、分散屬性相悖.因此，反制技術的最大挑戰是在識別、限制Deepfakes傳播的同時保持互聯網的分散性.

區塊鏈作為目前全球最炙手可熱的前沿技術之一，具備在分散和不可信的環境中增強共識的能力.通過創建一個低成本的安全可信渠道，區塊鏈將人與人之間的傳統信任模式轉換為對機器的信任，社會治理模式也可以從傳統的基于信息技術輔助模式向基于規則的智能契約執行模式轉變，最終實現跨行業業務和社會數據的整合，在源頭和過程中遏制Deepfakes的傳播和擴散，有望成為未來對抗Deepfake的有力手段.

1 區塊鏈技術對抗Deepfake理論基礎

在預防和檢測Deepfakes等虛假信息領域，區塊鏈技術通過創建一個獨特的、不可更改的元數據塊鏈[4]，充分利用數據可追溯、信息不可篡改和分布式共識等特點，證明數字資產真實性和原創性，實現數字內容收集、傳遞過程中信息的防篡改、免偽造和可追溯.

1.1 去中心網絡與共識機制

區塊鏈由去中心網絡組成，包含的節點按照功能可分為2種類型：全節點和輕量級節點[5].全節點擁有區塊鏈存儲的詳細信息，輕量級節點只有部分數據.但運行輕量級節點客戶端也可以訪問所有數據.區塊鏈網絡中沒有中心節點和管理員，整個網絡的數據是公開透明的，每個節點都可以進行修改和維護，因此信息的流動也就無法被控制，如圖1所示.區塊鏈的每個節點都參與數據記錄，與Facebook、Twitter、微信、微博等社交媒體的中心化網絡有顯著不同，僅當通過了校驗驗證之后的節點達到一定數量時內容才認為是可信的，包含該內容的區塊才會被添加至主鏈中，并以此來辨別真偽.因此，其“共識機制”決定了各參與者相互核查，共同實現對數字內容生產、傳播、評價等的全方位監督，從而為對抗Deepfakes提供了理論依據和技術基礎.

圖1 區塊鏈去中心網絡結構

1.2 Deepfake溯源

區塊鏈技術可以同時記錄內容發布的時間和發布者身份，通過時間戳服務機制和塊與塊之間的鏈連接來實現內容溯源[4]，實現對發布Deepfakes的個體進行綁定與追蹤，從而實現對Deepfakes溯源.為了追蹤內容的傳播路徑，需要一步一步地跟蹤哪個節點維護或刪改了原創內容，并注意修改動作發生的時間戳.在區塊鏈中每個塊包含塊頭和塊體.塊頭封裝的信息包括當前塊頭哈希值、父哈希值、時間戳等；塊體封裝當前塊的事務，并通過哈希函數隨機存儲Deepfake.如圖2給出了單個塊的結構：

圖2 單個塊的結構

塊頭為數據跟蹤溯源提供了便利，每個塊的塊頭都包含父哈希值，從而形成了鏈結構.塊鏈中的塊序列可以按照時間戳進行排列，形成了時間順序的鏈結構，如圖3所示.當跟蹤某一Deepfakes時，通過封裝在當前塊頭中的時間戳和父哈希值，可以定位到該Deepfakes塊的父塊.遞歸遍歷下去，可以確定當前塊的所有區塊，從而確定該內容的傳播路徑，實現Deepfake追蹤溯源.

圖3 塊與塊之間的鏈連接

1.3 內容防篡改

內容防篡改是指不能隨意修改原創內容或者應該記錄所有的修改過程.因為區塊鏈的每一個區塊都對應著唯一的哈希值，且后者會隨著前者內容的變化而改變.由于每個塊頭包含父哈希值，一旦某個塊的信息發生變化，其后的塊也會相應變化.隨著時間推移，區塊鏈上的區塊越來越多，區塊鏈數據也會變得越來越穩定.理論上對所有變化區塊的哈希值進行計算是不可能的，所以更改的區塊會自動脫離區塊鏈[4].基于此，區塊鏈能夠極大地提高原創圖像、音視頻傳播過程的安全性和防篡改性.

2 區塊鏈技術對抗Deepfake研究現狀

區塊鏈的技術特點，使其在對抗Deepfake有很大的優勢，很多機構在積極探索區塊鏈技術對抗Deepfake的算法、模型和平臺，并且取得了一定的成果，目前主要集中在構建可信網絡、Deepfakes溯源和內容防篡改這3個領域.

2.1 構建可信網絡

Saad等人[6]提出了一種基于區塊鏈的安全高效系統，用來檢測和抵制社交網絡上的虛假新聞傳播.該系統雖然專門為社交網絡量身定做，但也可以擴展到其他的信息媒介，具有一般性特征.Torky等人[7]提出了一種稱為可信度證明(proof of credibility,PoC)的新區塊鏈共識，用于檢測社交媒體平臺上的虛假內容.通過對Twitter上的2個熱門話題仿真，結果表明PoC對虛假新聞的檢測準確率約為89%，漏報率約為10%，誤報率約為9%.有了基于PoC的社交網絡系統，同行可以基于PoC區塊鏈系統來驗證共享信息和識別謠言.Ochoa等人[8]提出了基于數據挖掘算法的區塊鏈共識的FakeChain，用于跨社交網絡驗證共享信息和檢測假新聞.FakeChain利用以太網區塊鏈結合廣度優先搜索(breadth first search,BFS)算法的功能，實現對虛假內容的檢測.Song等人[9]提出了一種采用區塊鏈技術對社交媒體內容進行公證的新方法.該方法將區塊鏈作為公證服務的基礎設施，在社交媒體上真實地歸檔內容，其關鍵思想是讓官方社交媒體服務提供商使用私鑰對真實數據簽名，用戶使用公鑰基礎設施協議驗證文檔是否偽造.在這種制度下用戶無法逃避其發布內容的責任，從而減少社交媒體上的虛假內容.Shae等人[3]提供了一個人工智能區塊鏈平臺，為社交媒體時代的記者提供更廉價、可靠的信息來源.該平臺收集區塊鏈追蹤數據和人工智能工具，進而提供指向數據源的指針、有意義的主題統計以及針對給定主題咨詢的專家列表.Civil公司[10]建立了一個區塊鏈平臺，作為基于透明度和信任的社區新聞網絡.采取的方法是讓讀者購買“投票權”，裁定新聞編輯室是否代表公平、高質量新聞.由于此過程使用的貨幣是基于以太坊區塊鏈的民用加密貨幣，該項目受限于經費問題已經終止.采用區塊鏈技術，Userfeeds[11]公司開發了一個新聞內容排名平臺，排名由“評估證明”(proof-of-evaluation,PoE)的共識過程決定，結果公開透明，且能被公眾審查，一個內容生產者的“評估證明”越多，說明他生產的內容越可靠.而另一個基于區塊鏈技術的新聞平臺Steemit[12]則通過內容激勵機制處罰造謠者.

2.2 Deepfakes溯源

Shang等人[13]結合傳統的數據溯源技術和新聞傳播過程，通過分析區塊鏈技術在新聞溯源中的應用，提出了一種基于區塊鏈的新聞跟蹤模型.該模型覆蓋了新聞發布、傳播和溯源全流程，采用協商一致算法和智能契約技術對新聞進行跟蹤，進而實現對虛假消息的打擊.文獻[14]提到了通過區塊鏈技術檢測深度偽造視頻的方法：每個視頻關聯一個智能契約，關聯的契約又與其父視頻鏈接，每個父視頻在層次結構中又都對應一個到其子視頻的鏈接，以此實現對原始視頻的追溯.Chauhan等人[15]以完全分散的方式建立對原始視頻創建者或發布源的安全可靠的追蹤能力.方案中，以太坊錢包為視頻部署智能合約，星際文件系統(inter planetary file system,IPFS)用于存儲視頻的元數據，并生成視頻的唯一哈希值來定位IPFS上的文件.著名的廣告屏蔽插件Adblock Plus公司[16]通過添加采用區塊鏈技術的信任標簽到瀏覽器擴展程序中，來標識新聞的信任級別，從而提示用戶發現虛假內容，減少虛假新聞傳播.《紐約時報》推出了“新聞出處溯源”的區塊鏈項目[17]，通過分析圖片或視頻的“元數據”是否存在編輯、調整等造假行為，來實現新聞信源追溯.

2.3 內容防篡改

Fraga-Lamas等人[18]提出了一個基于以太坊的框架，用于驗證原創內容真實性和來源的標準化元數據，但是系統查找篡改內容的能力有限.Hasan等人[19]提出了一種基于區塊鏈的數字視頻真實性證明(proof of authenticity,PoA)系統，該系統以能否追蹤到視頻內容的可信的來源(創作者、發布者或其他提供者)為標準，證明視頻內容是否被篡改.該解決方案雖然側重于視頻，但也可應用于其他任何類型的數字內容，如音頻、圖像和手稿等，具有通用性.Gipp等人[20]提出使用區塊鏈來保護視頻內容的完整性.該方法對視頻進行哈希計算，并保存不可變區塊鏈上的哈希值，所以對視頻進行的任何操作都會導致哈希值不匹配.Bhowmik等人[21]提出了一種基于水印的多媒體區塊鏈框架，以解決原創數字內容經常被篡改問題.水印中包含事務歷史記錄的密碼哈希值和原始媒體內容的圖像哈希值，提取水印后，密碼哈希值被傳遞給分布式賬本以檢索歷史交易記錄，圖像哈希值被用來識別被編輯或篡改的區域.美國初創公司Truepic[22]開發了一套包含移動應用程序的系統，使用區塊鏈來永久存儲圖像的元數據，提供給普通用戶和自由職業者用來捕捉圖像，任何的偽造嘗試都可以通過與服務器的原圖像比對來發現，以此來證明完整性.英國初創公司Serelay[23]使用一種類似于Truepic的技術，用來消除Deepfake視頻和圖像的傳播.用戶在拍攝圖像和視頻時使用Serelay發布的應用程序，與Truepic保存整個圖像不同，Serelay會計算圖像或視頻的一個特殊且唯一指紋，并將該指紋保存在服務器中，用于防篡改驗證.基于在線區塊鏈的初創公司Prover[24]專門致力于驗證用戶創建的視頻的真實性，其原理是在用戶捕獲視頻時創建并記住一個唯一的哈希值，用戶可以以此驗證視頻的詳細信息，從而達到防篡改的目的.

2.4 技術局限性及啟示

利用區塊鏈技術對抗深度偽造技術時也會存在多方面的局限性，主要有3點：

1)“真實”與“虛假”數據同時被永久留存.因為區塊鏈的不可篡改性，使區塊鏈多媒體平臺上的所有數據都在邏輯上無法刪除.如Steemit網站[25]便聲明“Steemit平臺上的內容不可刪除”.所以即使被確認為虛假的內容也不會被刪除，而是在平臺上被打上虛假標記.所以，一旦出現涉及政治及國家安全、宗教極端思想等Deepfakes，會給整個區塊鏈媒介生態帶來惡劣影響.當前，由于法律或監管的缺失，加之市場份額的誘惑，很少有區塊鏈內容平臺嘗試阻止用戶上傳未經認證的內容，一旦發現影響嚴重的有害內容，解決辦法只能是丟棄整個鏈條，這樣又會對區塊鏈平臺造成巨大損失.

2)區塊鏈技術對抗Deepfake的拓展性具有局限性.一方面，基于區塊鏈平臺的設計必須針對特定的用例進行優化，如優先考慮所需的分散程度和一致算法，因為它們會影響吞吐量等核心性能.因技術架構限制，特別是哈希算法的復雜度與鏈條長度相關，運行速度會隨著鏈條長度的增加而顯著降低，成為區塊鏈發展的一個顯著瓶頸.所以底層設計時，比特幣限制了每秒7筆交易[4]，Steemit平臺規定同一用戶發帖間隔不小于5 min，而且包括格式在內，貼文大小被限制為約64 000字符[25]，這與2019年支付寶“雙十一”創造的每秒6 100萬筆[26]的交易記錄存在巨大差距.另一方面，無論是比特幣的PoW還是文獻[7] 的PoC或文獻[11]的PoE記賬模式，都是以大部分認可作為判斷依據，但是多數并不代表正確，存在誤差.區塊鏈以最長鏈為權威，現有“少數服從多數”判定鏈條是否增長的機制會帶來諸多問題.例如，區塊鏈會帶來形式上平等，但實際卻并不平等的問題.如果區塊鏈數字內容平臺中出現虛擬機器人程序或者是被占有多數算力的機構干預，導致發布內容看起來真實，便會與對抗Deepfake的初衷背道而馳.

3)基于區塊鏈技術的數字內容平臺面臨未知的網絡安全風險.區塊鏈是一門新興技術，在數據層、網絡層以及業務層都存在著網絡安全風險.例如，在數據層，區塊鏈技術依賴大量的密碼學研究成果，為區塊鏈的信息完整性、認證性和不可抵賴性提供了關鍵保障.但目前區塊鏈技術使用的大部分密碼學算法都容易被量子計算攻破，因此必須進一步研究后量子計算時代的區塊鏈密碼學解決方案.在網絡層，區塊鏈的區塊增長機制令其容易受到“51%攻擊”.如果攻擊者控制全網一半以上的算力，則替代歷史攻擊有100%的概率成功，即攻擊者可以比網絡的其他部分更快地生成區塊，可以通過堅持自己的私有分支，直到比真實節點網絡建立的分支更長，直至代替主鏈.

網絡信息傳播路徑是全局連接且分布式的，全世界的用戶都可以成為區塊鏈媒體供應鏈網絡的潛在用戶.因此，利用區塊鏈技術對抗Deepfakes需要一個高性能的區塊鏈網絡，還需要一個可擴展的智能合同，其管理的信任檢查機制對平臺上創建和編輯的內容進行嚴格的評估和排名[3].為了建立高標準高質量的內容，所有區塊鏈平臺參與者都必須遵守平臺信息內容管理規定，這是一種自我管理的行為準則.此外，系統需要加強網絡安全，建立安全可控的數據進入和存儲機制，以抵御數據偽造攻擊，保護平臺上的賬號密碼安全和分享內容的隱私.

3 結語

目前，應用區塊鏈技術對抗Deepfake的研究正處于發展階段.研究人員主要從可信網絡、源頭追溯和內容核實3個維度發現、識別Deepfakes.盡管區塊鏈技術在對抗Deepfake的過程中存在技術和實踐上的局限，但它所提供的信任機制與其他技術相比，能充分確保數字內容的真實性和可追溯性.然而，對抗Deepfake是一個比較復雜的問題，沒有一種萬能的解決方案，需要多學科、跨領域協同施策才能取得較好的成果，未來整合人工智能和區塊鏈技術，打造一個值得信賴的內容生態系統會是一種可行的研究思路.