?

《互聯網信息服務深度合成管理規定》視域下的公共圖書館深度合成技術發展探討

2024-03-12 03:16吳夢菲陳銘

圖書館研究與工作 2024年2期

關鍵詞：應用場景公共圖書館人工智能

吳夢菲?陳銘

摘要：隨著《互聯網信息服務深度合成管理規定》的正式頒布和實施，成果應用廣泛、形式豐富多樣、內容良莠不齊的深度合成發展迎來明確的管理辦法。文章對深度合成的概念、應用和研究現狀進行了梳理，從管理規定劃定的生成或編輯文本、語音、非語音等六個領域展望了圖書館的應用場景，并根據管理規定的要求，從內生型和外生型兩個方向探討在圖書館應用深度合成技術時的可能風險點，并給出了預防以及治理路徑，以期助力圖書館在《互聯網信息服務深度合成管理規定》的框架內更合理、合規地開展更多基于深度合成的數字應用。

關鍵詞：深度合成技術；人工智能；公共圖書館；應用場景

中圖分類號：G258.2文獻標識碼：A

Exploring the Development of Deep Synthesis Technology in Public Libraries within the Scope of the Regulations on the Deep Integration Management of Internet Information Services

Abstract With the official promulgation and implementation of the Regulations on the Deep Integration Management of Internet Information Services， the development of deep synthesis has gained clear management methods， with wide-ranging applications， diverse forms， and varying content quality. This article reviews the concept， application， and research status of deep synthesis， and explores the potential application scenarios in libraries across six domains defined by the management regulations： text， speech， non-speech， and others. Based on the management requirements outlined in the regulations， the article discusses potential risk points in the application of deep synthesis technology in libraries from the perspectives of endogenous and exogenous factors， and provides preventive and governance measures. The aim is to enable libraries to carry out more rational and compliant applications of deep synthesis technology within the framework of the Regulations on the Deep Integration Management of Internet Information Services to further enhance digital applications supported by deep synthesis.

Key words deep synthesis technology; artificial intelligence; public library; application scenarios

1 引言

2022年12月11日，國家互聯網信息辦公室、工業和信息化部、公安部三部委聯合發布了《互聯網信息服務深度合成管理規定》（以下簡稱《規定》），并自2023年1月10日起施行[1]?！兑幎ā穼ヂ摼W信息服務深度合成技術進行了明確、有效的管理和規范，對推進深度合成技術合理化發展、維護互聯網健康生態起著至關重要的作用。

“元宇宙”“人工智能”近兩年在圖書館行業炙手可熱，在圖書館不斷智慧化、信息化甚至“元宇宙”化的過程中，從理論概念研究到技術發展探索，都需要依靠深度合成技術進行實現。作為我國出臺的首部對深度合成服務治理的專門性部門規章，《規定》為圖書館利用安全可靠的深度合成技術進行互聯網信息服務，提供了指向性明確、整體性突出的發展方向、行為依據和法律保障。

2 深度合成的概念及其相關研究

2.1 深度合成概念

隨著電子信息技術的不斷發展，人工智能已經朝著產業化、泛在化方向邁進，其智慧化水平在短時間內迎來了數個代際躍升。隨著數字基礎設施建設趨于完善，人工智能所應用的場景愈發廣泛和多元，呈現更為生動、豐富的發展景象。深度合成就是基于現階段人工智能發展而逐漸形成的重要應用領域。

《規定》明確深度合成技術就是“利用深度學習、虛擬現實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網絡信息的技術”[2]?！吧疃群铣伞痹谟嬎銠C學科中是“機器學習”的一個關鍵組成部分，其核心技術是機器學習模型“生成式對抗網絡”（Generative Adversarial Networks， GAN）和自編碼器網絡（Auto Encoder， AE）[3]。模型通過“深度學習”和“合成”的綜合處理，把海量的文字、圖片、音頻、視頻等相關數據通過神經網絡技術進行學習，并在源材料上產生新內容。

2017年，在美國Reddit社交網站上，一個名為“deepfakes”的用戶上傳視頻，通過深度合成技術將知名女星的面部合成到色情視頻的表演者身上[4]，從而引發巨大的輿論震蕩，這也被視為“深度合成”技術廣泛進入公眾視線的開始。2018年，受該事件影響，美國出臺了《惡意偽造禁令法案》[5]，將“深度合成”技術與“深入偽造”打上了“等號”。在這個“負面”的應用場景被廣為熟知后，深度合成制造的真實感知力和臨場感也確實引發了惡意使用和技術濫用的問題，從通過聲音、面部合成進行的電信詐騙，到合成動態人臉信息進行的偽造金融注冊、銀行借貸，再到合成政客、親友、明星的個人特征進行的各類謠言散布、色情欺詐等都似乎成為“深度合成”的原罪。

技術本身只是手段，無關于道德，中性、中立的技術所帶來的利與弊從來不是技術本身，其益與害往往就是人性中善惡的對稱。在互聯網發展的大潮中，各類良性信息生成、媒介傳播和互動交流都出現了深度合成的技術身影，影視制作、廣告營銷、電子商務、社交娛樂等都成了深度合成技術的正向應用舞臺。根據國家工業信息安全發展研究中心與清華大學人工智能研究院共同發布的《深度合成十大趨勢報告（2022）》顯示，在內容產生上，2021年新發布的深度合成視頻的數量較2017年增長10倍以上；在關注數量上，2021年新發布的深度合成視頻的點贊數已超過3億[6]。2020年韓國VR公司通過深入合成技術進行拍攝測量、虛擬實際和動作捕捉，幫助一位母親合成還原逝去孩子；2022年，第24屆冬季奧林匹克運動會在北京舉辦時，中央電視臺的AI主播“小聰”就通過深度合成技術完成了手語模型數據庫的搭建和應用，并對各類比賽項目成功進行了全程手語播報[7]；2021年9月，第八批在韓中國人民志愿軍烈士遺骸回國，《人民日報》通過深度合成技術為老照片進行修復、還原、上色，重現照片場景[8]，等等?？梢?，深度合成技術帶來的，除了成本更低、效率更高的內容產出，還有體驗更真實更臨場的感官交互，以及更欣欣向榮的數字產業經濟環境和人文感受。

2.2 深度合成的相關研究

由于深度合成技術是2017年才開始出現并發展的前沿技術，所以我國相關研究相對較少。近兩年，隨著深度合成技術的迅猛發展以及《規定》的發布，相關研究數量呈現出一定程度的增長。國內深度合成研究主要圍繞法制完善、規范治理、技術提升以及新領域賦能四個方面展開。

在法制完善方面，萬志前、陳晨強調要以《中華人民共和國民法典》相關條款為基礎，明確深度合成技術使用邊界、使用程序以及濫用后果等[9]；李偉明確了法律語境下“深度合成”和“深度偽造”的區別[10]；李明魯則認為需要對應用深度合成技術進行“深度偽造”的技術幫助犯罪行為，通過刑法采取獨立罪名認定的制裁思路[11]。

在規范治理方面，王榕主要研究了深度合成技術應用普遍存在的主體責任不明確、監管不到位、算法黑箱等問題[12]；眭占菱等人提出了遏制源頭違規、重塑專家鑒定、加強環境經驗支撐等辨識機制[13]。

在技術提升方面，藺琛皓等人實現了對虛假數字人臉內容的檢測和判定[14]；魏玲應用Nuke這一數碼影視后期合成軟件時發現，深度合成技術可在不受光照、陰影和色度影響下直接反映圖像中物體表面的三維特征[15]；賀明明構建了一個基于GPU（Graphics Processing Unit，圖形處理器）的深度圖像后期繪制與合成系統，成功集成了與深度圖像相關的后期合成技術與繪制算法[16]。

最后在賦能新領域方面，任婧和生奇志重點探究了深度合成技術在新媒體領域智能化、虛擬化、沉浸式的應用方向[17]；畢韋達等人對比了在影視渲染領域傳統的合成流程與深度合成流程的異同，并對深度合成在影視產品制作、渲染、后期、特效等方面的應用進行了展望[18]；劉順堃研究發現，在影像醫學方面，在深度合成技術的支持下，CT圖像的精度和細節表達能力有明顯提升[19]。

在國外，有關深度合成的研究的起始時間早于國內，首先是“深度合成”概念的形成，2014年，伊恩·古德費洛開創構建了生成式對抗網絡技術（GAN），即通過生成模型和判別模型的對抗性博弈最終形成新內容，這是深度合成的雛形，他參與編寫的《深度學習》更是深度合成研究的基礎[20]。2015年，詹姆斯·馬克斯等人提出要通過深度合成技術實現數據科學工作的自動化，正式肯定了深度合成的科學效用[21]。其后的國外深度合成研究就呈現出較之國內更為發散的發展方向，除了技術提升、規范治理外，還關注到了隱私、政治等多個問題。

在隱私研究方面，S.A.奧西亞等人基于深度合成建立了一種基于信息理論約束進行訓練和評估的深度模型，模型能夠有效防止用戶的某些敏感信息與服務提供商共享[22]；賈亞斯里·森古普塔等人提出了一種可擴展、隱私保護和可協作的SPRITE算法，算法采用閾值秘密共享來保證工業物聯網的隱私保護[23]；A·薩爾馬迪等人利用共享特征提取器（Shared Specific Feature， SFE）進行特征提取，以保護協作機器學習中的隱私信息獲取[24]。

在政治研究方面，羅伯特·切斯尼等人認為深度合成技術是對隱私、民主和國家安全的迫在眉睫的挑戰[25]；B·馬修等人認為深度合成關鍵人物、政府首腦的相關內容可能會引發軍事、政治等多方面的不安定[26]；B·布萊恩通過分層視角對深度合成的應用是民主技術化還是技術民主化進行了探討[27]。

3 深度合成在圖書館的應用場景

《規定》中明確了深度合成技術的具體應用方式，包括生成或編輯文本內容的技術，生成或者編輯語音內容的技術，生成或者編輯非語音內容的技術，生成或者編輯圖像、視頻內容中生物特征的技術，生成或者編輯圖像、視頻內容中非生物特征的技術，生成或者編輯數字人物、虛擬場景的技術”[2]六項，這也是圖書館可參考、可應用的深度合成技術場景。

3.1 生成或編輯文本內容的技術

生成或編輯文本內容的技術是通過深度合成進行的篇章生成、文本風格轉換以及問答對話等，現階段最典型也是最為大眾所熟知的，能夠進行較好文本生成和編輯技術的應用就是ChatGPT（Chat Generative Pretrained Transformer），一種生成型預訓練聊天機器人。2022年11月，美國人工智能研究室OpenAI開發了人工智能聊天機器人應用ChatGPT[28]。作為以語言模型為基礎的人工智能，ChatGPT具備對文本的識別、理解和生成能力，可以通過對話指令進行創作，能獨立完成各類主體文本撰寫、代碼編輯等文本任務。與之前已有的Siri、微軟小冰等人工智能聊天機器人不同，ChatGPT通過互聯網數據和人類反饋進行深度合成和強化學習，不僅可以生成文本信息，還可以對所生成的信息進行評價和判別，并通過不斷地修正和迭代合成符合人類基本常識、普遍認知和道德觀的文本體系[29]。

在圖書館領域，ChatGPT類的文本內容深入合成技術帶來的發展機遇無疑是巨大的。首先就是在ChatGPT類應用現階段較為廣泛的領域——智能咨詢。從讀者服務的角度看，日常咨詢、參考咨詢是圖書館對讀者進行知識服務的關鍵。多年來，智慧圖書館的一個顯性判定依據就是參考咨詢工作的智能化程度。為此，清華大學圖書館、南京大學圖書館等高校圖書館都有自己的虛擬館員咨詢系統[30]，上海圖書館、江西省圖書館等公共圖書館也配置了和大型商場類似的咨詢機器人[31]，但咨詢的智能化程度和效果還遠不及ChatGPT類應用。ChatGPT類應用可以進一步提升各類咨詢反饋速度和質量，給讀者帶來新的咨詢體驗和更豐富、全面的知識信息。其次是圖書館運行效率的提升，ChatGPT類應用可以大量學習圖書館的新聞報道、活動預告、制度條例、匯報材料、文稿報告等文本內容，通過深度合成技術，快速、準確地生成新的相關文本，甚至進行完整的定題寫作和PPT制作，雖然不能完全替代現實圖書館員，但也切實有助于提升圖書館運行效率。

3.2 生成或者編輯語音內容的技術

深度合成中的生成或者編輯語音內容技術主要指的是文本轉語音、語音轉換、語音屬性編輯等。文本轉語音技術早期是以單向文本轉語聲形式出現[32]，辦公軟件中內置的朗讀功能，地圖軟件導航、機場火車站等交通樞紐的通知、報站等都是基于此。單向文本轉語聲只能簡單讀字，不能辨析詞義和語境，所以對多音字、語氣不能判定。經過深度合成加強后產生的單向文本轉語音技術能進行文本辨析，對內容、情感進行學習和判定，從而形成具有語音語調、能識別多音字的更為“仿生”的文本轉語音系統。語音轉換、語音屬性編輯技術最初依靠把矢量量化（Vector Quantization， VQ）碼本基于語音編碼生成的方法進行語音屬性編輯，實現不同人之間語音的轉換，現在隨著深入合成技術的發展，相繼有學者提出了把GAN模型應用于語音的生成和鑒別，通過海量的訓練、調整、合成，使合成語音生成效果更趨向于目標語音[33]。

在圖書館領域，語音內容的深度合成應用場景主要包括有聲閱讀、無障礙服務、場館運行管理等方面。有聲閱讀是數字化閱讀的一種表現形式，公共圖書館現階段主要通過購買如庫克數字音樂圖書館、云圖數字有聲圖書館、天方有聲圖書館等有聲閱讀平臺的方式獲得有聲閱讀資源，再為讀者提供相關閱讀服務[34]。在深度合成相關語音技術的幫助下，圖書館可以充分發揮自身的館藏優勢，把館藏特色文獻、古籍善本、家譜方志、日記書信都通過文字轉語音形式形成更具特色的館藏語音庫，使讀者可以聽到近代歷史名人用他們自己的聲音朗讀信件、日記，也可以聽到用上古音、中古音朗讀的古籍善本中的歷史記錄和詩歌文學。其次，可以建立方言、口述史的語音庫，通過深度合成技術，一方面將方言、口述史轉換成文字，進行文字語音的雙形式保存，另一方面可以利用語音轉換技術建設方言和普通話的轉換程序，這樣既能有效完善、健全本地方言語言系統，更能幫助讀者快速了解、學習、掌握本地方言，起到傳承、傳播本土文化的作用。在無障礙服務以及場館運行管理方面，深度合成的語音技術可以為視覺受限人士、老人、兒童等提供更完整、準確和生動的語音輔助服務。其在瀏覽圖書館網站、APP以及新媒體界面時，語音技術可以通過不同類型的語音語調用于閱讀界面不同內容的朗讀，以及不同級菜單的導航和指引等；在圖書館的場館利用時，語音可以實現對圖書館閱覽室、各類設施的方向引導，館藏圖書的架位引導，各類展覽、標識牌、閱覽室說明的提示和閱讀以及與圖書館燈組、門禁、各類開關設施聯動的語音指令執行等。

3.3 生成或者編輯非語音內容的技術

深度合成技術在音樂領域的探索主要圍繞音樂和場景聲生成或編輯兩大類。在前期，音樂和場景聲的生成主要依靠計算機系統對已有的音樂作品進行內容拆解、關鍵要素提取、系統分析和規律總結，然后通過算力進行創作模型的搭建，最后將音樂要素重新填充形成音樂創作，微軟公司研發的小冰、騰訊的艾靈等都可以達到音樂創作的需求[35]。在有了深度合成技術的加持后，人工智能通過廣泛學習音樂中的情感的喚起、波動和影響，以樂段、樂匯、節奏、調高等為載體，模擬出更符合人腦聽覺習慣、結構認知和旋律識別的共情音樂系統[36]。2021年，中國音樂學院就和中國人工智能學會聯合主辦了世界音樂人工智能大會，來研究、展望人工智能在音樂領域的建設發展[37]。同年，騰訊也建立了天琴實驗室，重點關注深度合成技術下的音樂歌曲識別、音質優化提升、歌唱評價賦分和翻唱假唱識別等[38]。

在圖書館領域，非語音內容的深度合成技術可以在音樂推廣活動和沉浸式閱讀空間的打造上進行應用。在音樂推廣活動方面，很多圖書館都設置有相對隔音的視聽閱覽室，為讀者提供音樂欣賞空間，在深入合成技術應用后，圖書館可以在原有的音樂資源基礎上，根據讀者的喜好、年齡分布甚至職業為其提供更細分的音樂推薦和人工智能音樂作品，還可以鼓勵讀者在圖書館視聽場館內，以及在社交網絡、數字平臺上通過深度合成手段自行創作音樂，構建虛擬圖書館音樂廳，召開由讀者共創共建的虛擬音樂會。在沉浸式閱讀空間的打造方面，深度合成技術可以有效掌握、理解文學作品中的場景，并與場景聲素材進行結合，利用圖書館現有的隔音亭、朗讀亭等設備形成緊扣閱讀細節的場景聲打造，例如當讀者在亭中閱讀推理犯罪小說的特定章節段落時，隔音亭內的智能設備就能被觸發并播放相關場景的場景聲如由遠及近的警笛聲、急促的喘息聲、開門聲等，為讀者提供身臨其境的閱讀體驗。

3.4 生成或者編輯圖像、視頻內容中生物特征的技術

在深入合成技術中，較為人熟知的就是生成或者編輯圖像、視頻內容中生物特征技術，其中包括的人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態操控等在某些涉嫌違法犯罪領域的應用也成為《規定》出臺的主要因素之一。由于人臉面部五官結構的特殊性及其動作表情所傳遞情緒、情感的復雜性，傳統的算法合成效果不佳，人臉替換或表情操控會具有一定的不真實性和違和感，但基于深度合成機制的層次化殘差網絡掩膜優化和雙域生成對抗網絡可以自然地學習從粗到細多級粒度的尺度特征，從而得到內容更豐富、特征更突出的面部信息輸出，提升面部五官的動態排布和細節控制，保持、提升面部圖像生成、調換和調整的信度和實感[39]。

在圖書館領域，文獻檔案研究方面，此類型技術能在老照片、老檔案以及僅有少量資料的近代歷史人物的有關人臉的修復和再現中起到重要的作用；閱讀推廣方面，文學作品中的人物可以通過描述生成面部，擁有表情，加之語音技術，讀者可以與文學作品中的人物對話，童話中的動植物也可以擁有更加活潑生動的表現形式；圖書館虛擬空間建設方面，人臉生成、人物屬性編輯可以為讀者在虛擬圖書館空間中進行個性身份標識，讓讀者以自己生成的面部及整體形態體驗虛擬圖書館。

3.5 生成或者編輯圖像、視頻內容中非生物特征的技術

生成或者編輯圖像、視頻內容中非生物特征的合成技術主要指的是圖像生成、圖像增強、圖像修復，是深度合成技術在計算機視覺領域的重點發力方向。GAN可以通過無監督或者有監督的方式訓練所生成的對抗網絡，當真實數據中的圖像和生成器合成的圖像反復對抗后，就訓練形成了高質量的與真實數據相似的圖像。而圖像的增強和修復也是利用這一機制，由帕塔克等人提出的圖像修復網絡Context Encoder，就是利用像素預測驅動無監督特征學習，進行缺失圖像周圍像素信息感知、推測修復內容，從而補全缺失像素，減少橫紋、邊緣鋸齒等圖像問題的產生[40]。

在圖書館領域中，非生物特征的深度合成技術是古籍善本、老照片、檔案等館藏資源修復的重要工具。在對古籍善本等珍貴館藏資源進行數字化掃描建立數據庫后，可以將塊匹配機制嵌入圖像特征空間，以特征匹配的方法進行缺損補全，通過大量數據樣本生成對抗網絡從而生成最優補全效果，以達到對于內容缺損的古籍文獻的數字修復；其次是對于一些因年代久遠或保存不當造成的字跡辨認不清，字體形狀、輪廓模糊的情況，深度合成的圖像增強技術可以在已有數據庫的基礎上，結合多個輸入幀信息，通過超分辨率算法在提升像素的同時減少圖像噪點和顆粒，進一步提升文字、圖片的清晰度[41]。

3.6 生成或者編輯數字人物、虛擬場景的技術

生成或者編輯數字人物、虛擬場景可以說是深度合成在生成或編輯文本、語音、非語音、生物特征、非生物特征幾方面的綜合產物，是集幾個領域為一身的數字凝合，其內容包括了三維重建、數字仿真等。數字仿真包括仿真植物、動物、數字人等。數字人[42]需要具備人類的外貌特色、人類的表達行為以及思考能力三個方面。外貌特色涉及圖像領域的深度合成技術，表達行為涉及生成或編輯語音內容、生物特征等幾個領域的深度合成技術，而思考則需要內容生成的過程中產生的創造性思維，所以涉及ChatGPT類生成或編輯文本內容的深度合成技術。而虛擬場景構建中，更多的是從圖像合成領域中形成的虛擬場景、非語音領域形成的場景音、加之生物特征技術中形成的數字仿真生物構建起來的虛擬環境，最終的發展方向也就是“元宇宙”。

在圖書館領域，基于深度合成技術下的“元宇宙”圖書館可以在虛擬場景中進行三維重建，在數字世界打造虛擬圖書館空間。在虛擬圖書館中，讀者可以以書為媒在此進入每一本圖書館館藏圖書的虛擬空間，置身于名著、童話等文學作品中，與虛擬數字主人公對話或與其共同經歷人生體驗新世界。讀者也可以與數字圖書館員交流，獲取最專業快速的知識服務、信息參考，通過具象化的沉浸式的體驗進行學習提升。

4 深度合成技術在圖書館內的應用風險及其預防、管理路徑

根據《規定》的劃分，深入合成技術的主要參與方分為服務應用方、技術提供方[2]。服務應用方在圖書館領域指的就是通過深度合成技術進行讀者服務或者圖書館業務服務的圖書館；技術提供方指的就是為圖書館提供深度合成技術的第三方。

深度合成技術的圖書館應用風險可以分為基于算法和技術本身的內生型風險以及由于應用深度合成技術而產生社會影響的外生型風險。

4.1 深度合成技術內生型風險點及其預防

內生型風險點主要指的是技術提供方在進行數據處理、編輯合成和產品服務應用三個合成技術流程上可能產生的風險。圖書館在應用技術方提供的各項深度合成技術之前，需要以內生型風險點為重點，對技術提供方的合成技術流程進行預判和審查。

首先在數據處理方面，無論是ChatGPT類的文本還是語音等的生成、編輯都需要大量的數據進行訓練、對抗以達到合成目的，圖書館需要對技術提供方在數據的來源獲取手段、數據存儲安全、數據查用權限三個維度進行嚴格的判定。在數據的來源獲取維度上，主要是審查獲取手段是否合法、合規，數據被獲取的讀者、用戶是否對數據獲取過程、獲取內容知曉，讀者、用戶對數據后期的用途是否知情等；在數據存儲上，圖書館需要整體掌握技術提供方的全數據安全鏈條，審查其是否具備安全的存儲介質、容災備份、回收機制和日志審計等；在數據查用權限上，主要是審查技術提供方在數據查看、修改、上傳、刪除過程中權限的劃分、賦予和監督是否合理。

其次，在編輯合成階段，圖書館需要審查的是技術提供方的合成的技術性質和技術成熟度。在性質方面，需要審查深度合成算法和模型本身是否具備準確性、可信性、可靠性，進行生成、編輯的過程是否有漏洞，是否可控制，其產生的結果是否達到預期；在成熟度方面，需要審查技術提供方在數據特征提取、計算、合成、檢測、學習和操作上的技術是否成熟。

最后在場景應用上面，圖書館需要審查的是技術提供方的算法應用是否合法、合規，在算法應用中是否存在算法濫用導致的信息欺詐、存儲破解、信息泄露的隱患等。

4.2 深度合成技術外生型風險點及其預防與管理

外生型風險點主要指的是在技術層面之外，也就是圖書館充分肯定相關合成技術邏輯后，在準備引進或已經進行應用的過程中，技術提供方和圖書館可能產生的社會性風險[43]。

首先，圖書館需要審查技術提供方企業本身是否嚴格遵守國家、人工智能相關行業領域制定的相關法律法規、行業規章、規范等，企業內部是否訂立了涉及安全、隱私等的嚴格的工作制度、工作規范和流程，是否設有相關風險控制管理部門，有沒有主動的安全風險控制機制和處理手段等。圖書館還可以對技術提供方之前承接的項目進行調研，審查其在項目運行過程中是否合規，成效是否顯著，后續的數據管理和利用是否符合風險信息公開性和用戶數據隱私性的要求。

此外，圖書館在應用深度合成技術的時候也需要對深度合成技術的原理和算法邏輯有深入的了解，對其可能產生的風險的來源和形式有準確的預判，能夠充分明確圖書館在包括方向責任、制度責任、管理責任、安全責任等方面的主體責任。

方向責任主要指的是圖書館應用深度合成技術的目的和初衷必須是向善的，是合乎法律法規、社會公德和人倫的，是在堅持正確政治方向、輿論導向、價值取向基礎上，出于促進先進文化發展、建設公共文化服務體系和提升公共圖書館服務的目的。

制度責任，即圖書館有責任建立健全深度合成技術管理制度，其內容充分涵蓋應用深度合成技術的所有關鍵環節，包括算法相關機制的審核制度、科技倫理審查制度、技術提供方的資質審查制度、合成數據及內容管理審核制度等。尤其是內容管理審核機制方面，圖書館應建立嚴格的內容管理審核機制，確保數據采集處理、特征庫建立的過程以及深度合成結果的產生、使用過程合法合規。

管理責任包括參與對象管理、標識管理兩個方面。參與對象管理主要針對技術提供方和使用或享受圖書館深度合成技術服務的讀者。圖書館需要對技術提供方行業資質、算法模型、安全管理等方面進行審查，需要與使用相關服務的讀者制定并公開管理規定和使用公約，對所有使用讀者依法進行身份信息的驗證，并對其的使用權限和行為進行明確規定，以確保在風險觸發時可以進行明確的責任劃分。標識管理方面，圖書館必須明確要求技術提供方在圖書館最終呈現的各類深度合成產品和服務上通過一定的技術手段在不影響讀者使用體驗的情況下進行標識添加。一方面，標識可以快速幫助讀者和圖書館進行深度合成相關產品和服務的辨識和溯源；另一方面，標識能幫助讀者有效分辨真實、虛擬的語音、畫面、場景、人物，減少不必要的信息混淆和輿論影響[44]。

最后，在安全責任方面，圖書館可以聯合技術提供方定期開展深度合成產品及服務的安全評估工作，預防信息安全風險。雙方應共同建立違法信息、不良信息的特征庫，建立行之有效的安全審核控制系統，對輸入數據和合成結果中的風險因素進行及時排查、精準定位、快速處置，在不斷提升技術水平的同時降低系統性安全風險。

5 結語

在人工智能與大數據技術快速發展的今天，深度合成技術是人工智能領域中的一種新型應用和實踐，不但給用戶帶來個性化、精準化、智能化的信息服務，更是得到了很多行業場景的推廣和應用，并且衍生出“元宇宙”這一種新型應用場景。但是網絡傳播的環境越來越復雜，新的合成方法不斷涌現，深度合成技術如果違法應用，還易造成對用戶合法權益的侵犯、違法信息散布、社會輿論操縱等一系列的問題，濫用危險也越來越大。圖書館應積極應對，通過建立完善法律制度保障、強化主體責任機制、健全管理等方式來防范和規避這些風險，以更好地發揮深度合成技術的社會價值與作用。圖書館深度合成前景光明，應用領域廣，是公共文化服務人工智能發展的需要。人工智能的發展也要求圖書館不斷加強自身的數據基礎設施建設，逐步健全數據安全技術人才與管理人才培養體系，進一步提高深度合成自主創新能力，增強安全保護力，持續拓展深度合成的多樣文化應用場景，對人工智能語境下的公共文化服務產生帶動效應，推動科技向上向好。

參考文獻：

[1] 梁楠.三部門發布《互聯網信息服務深度合成管理規定》[J].新聞文化建設，2022（24）：2.

[2] 互聯網信息服務深度合成管理規定[J].中華人民共和國國務院公報，2023（4）：22-25.

[3] XUE Y，GUO Y C，ZHANG H，et al.Deep image synthesis from intuitive user input：A review and perspectives[J].Computational Visual Media，2022（8）：3-31.

[4] POPOVA M.Reading out of context： pornographic deepfakes，celebrity and intimacy[J].Porn Studies，2020（7）：367-381.

[5] S.3805-Malicious Deep Fake Prohibition Act of 2018[EB/OL].[2023-03-10].https：//www.congress.gov/bill/115th-congress/senate-bill/3805.

[6] 深度合成十大趨勢報告（2022）[R].北京：清華大學人工智能研究院，2022.

[7] 吳靜.“深度偽造”技術在傳媒領域的新應用和異化風險[J].傳媒，2023（3）：51-54.

[8] 魏泳安.算法視閾下文化虛無主義新癥候及應對策略[J].毛澤東鄧小平理論研究，2022，423（12）：35-44，104.

[9] 萬志前，陳晨.深度合成技術應用的法律風險與協同規制[J].科技與法律（中英文），2021（5）：85-92.

[10] 李偉.從“深度合成”到“深度偽造”[J].檢察風云，2021（12）：11-12.

[11] 李明魯.“深度偽造”的刑法治理路徑[J].科技與法律（中英文），2021（6）：40-47，73.

[12] 王榕.深度合成技術行政監管的困境和路徑[D].蘭州：甘肅政法大學，2021.

[13] 眭占菱，何亮亮，蔣潔.深度合成待證數據的風險剖析與辨識機制[J].圖書與情報，2020（6）：59-64.

[14] 藺琛皓，沈超，鄧靜怡，等.虛假數字人臉內容生成與檢測技術[J].計算機學報，2023，46（3）：469-498.

[15] 魏玲.基于Nuke的深度圖像合成[J].電子測試，2015（1）：69-71.

[16] 賀明明.基于GPU的深度圖像后期繪制與合成系統[D].杭州：浙江大學，2014.

[17] 任婧，生奇志.智能·虛擬·沉浸：“深度合成”賦能新媒體[J].科技傳播，2022，14（6）：126-129.

[18] 畢韋達，羅江林，呂鑫.基于深度信息的圖像渲染與合成流程的研究[J].電腦知識與技術，2022，18（16）：86-88.

[19] 劉順堃.基于深度神經網絡的MR圖像合成CT圖像方法研究[D].上海：上海應用技術大學，2022.

[20] HEATON J，IAN G，YOSHUA B，et al.Deep Learning[J].Genet Program Evolvable Mach，2018（19）：305-307.

[21] KANTER J M，VEERAMACHANENI K.Deep feature synthesis： Towards automating data science endeavors[C]//2015 IEEE International Conference on Data Science and Advanced Analytics（DSAA）.New York：IEEE，2015：1-10.

[22] OSSIA S A，TAHERI A，SHAMSABADI A S，et al.Deep Private-Feature Extraction[J].IEEE Transactions on Knowledge and Data Engineering，2018（32）：54-66.

[23] SENGUPTA J，RUJ S，BIT S D.SPRITE：A Scalable Privacy-Preserving and Verifiable Collaborative Learning for Industrial IoT[C]//2022 22nd IEEE International Symposium on Cluster，Cloud and Internet Computing（CCGrid）.New York：IEEE，2022：249-258.

[24] SARMADI A，FU H，KRISHNAMURTHY P，et al.Privacy-Preserving Collaborative Learning through Feature Extraction[J/OL].IEEE Transactions on Dependable and Secure Computing，2023：1-13[2023-07-03].https：//ieeexplore.ieee.org/document/10089424.

[25] CHESNEY R M，DANIELLE K C.Deep Fakes：A Looming Challenge for Privacy，Democracy， and National Security[J].California Law Review，2018，107：1753.

[26] BOH??EK M，FARID H.Protecting world leaders against deep fakes using facial， gestural， and vocal mannerisms[J].Proceedings of the National Academy of Sciences of the United States of America，2022，119：48.

[27] FORD B.Technologizing Democracy or Democratizing Technology？ A Layered-Architecture Perspective on Potentials and Challenges[C]//Digital Technology and Democratic Theory.Chicago：University of Chicago Press，2020：274-308.

[28] GILSON A，SAFRANEK C W，HUANG T，et al.How Does ChatGPT Perform on the United States Medical Licensing Examination？ The Implications of Large Language Models for Medical Education and Knowledge Assessment[J/OL].JMIR Medical Education，2023：9[2023-07-03].https：//www.semanticscholar.org/paper/How-Does-ChatGPT-Perform-on-the-United-States-The-Gilson-Safranek/cd4d112f3f9120d0715f22a9de2ce4720822368c.

[29] DENG J，LIN Y.The Benefits and Challenges of ChatGPT：An Overview[J].Frontiers in Computing and Intelligent Systems，2023，2（2）：81-83.

[30] 李書寧，劉一鳴.ChatGPT類智能對話工具興起對圖書館行業的機遇與挑戰[J/OL].圖書館論壇：1-8[2023-03-18].http：//h-p.kns.cnki.net.i.jllib.cn/kcms/detail/44.1306.g2.20230307.0928.002.html.

[31]劉澤，邵波，王怡.數據驅動下圖書館智慧參考咨詢服務模式研究[J/OL].情報理論與實踐：1-11[2023-03-22].http：//kns.cnki.net/kcms/detail/11.1762.G3.20221107.1357.008.html.

[32] 周正宏.論人工智能語言標準化及其戰略意義[C]//中國標準化協會.中國標準化年度優秀論文（2022）論文集.北京：《中國學術期刊（光盤版）》電子雜志社有限公司，2022：8.

[33] WU D Y，CHEN Y H，LEE H Y.VQVC+： One-Shot Voice Conversion by Vector Quantization and U-Net architecture[EB/OL].[2023-07-03].https：//arxiv.org/abs/2006.04154.

[34]武玥.公共圖書館有聲閱讀推廣服務探析[J].農業圖書情報學報，2022，34（3）：61-67.

[35] DONG H W，ZHOU C，BERG-KIRKPATRICK T，et al.Deep Performer：Score-to-Audio Music Performance Synthesis[C]//ICASSP 2022-2022 IEEE International Conference on Acoustics， Speech and Signal Processing.New York：IEEE，2022：951-955.

[36] 蕭萍.具身·想象與共情：人工智能音樂生成與傳播的技術現象學研究[J].現代傳播（中國傳媒大學學報），2022，44（9）：155-161.DOI：10.19997/j.cnki.xdcb.2022.09.002.

[37] 王曉璇.未來音樂新風向：人工智能賦能音樂發展——世界音樂人工智能大會述評[J].人民音樂，2022（1）：84-87.

[38] 楊慶峰.從人工智能難題反思AI倫理原則[J].哲學分析，2020（11）：2.

[39] ELHOSENY M，SELIM M M，SHANKAR K.Optimal Deep Learning based Convolution Neural Network for digital forensics Face Sketch Synthesis in internet of things （IoT）[J].International journal of machine learning and cybernetics，2021（11）：12.

[40] PATHAK D，KR?HENB?HL P，DONAHUE J，et al.Context Encoders：Feature Learning by Inpainting[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition（CVPR）.New York：IEEE，2016：2536-2544.

[41] 陳亞芳，杜響成，鄭瑩斌.數字智能修復技術在歷史檔案領域中的應用[J].中國檔案，2022（12）：32-33.

[42] 侯文軍，卜瑤華，劉聰林.虛擬數字人：元宇宙人際交互的技術性介質[J].傳媒，2023，393（4）：25-27，29.

[43] 張超，陳莎.深度合成的外生性風險及平臺治理原則[J].中國新聞傳播研究，2022（5）：39-49.

[44] 時建中.專家解讀|規范深度合成服務營造風清氣正的網絡空間[EB/OL].[2023-03-22].http：//www.cac.gov.cn/2022-12/12/c_1672217053955777.htm.

猜你喜歡

應用場景公共圖書館人工智能

2019：人工智能

商界(2019年12期)2019-01-03

人工智能與就業

IT經理世界(2018年20期)2018-10-24

數讀人工智能

小康(2017年16期)2017-06-07

室內外布線用新型光纜技術規范應用研究

中國新通信(2016年21期)2017-01-06

MOOC時代公共圖書館服務探索研究

新世紀圖書館(2016年9期)2016-11-15

公共圖書館延伸服務的實踐與思考

科技視界(2016年21期)2016-10-17

談公共圖書館如何建立自助服務推廣長效機制

商(2016年27期)2016-10-17

下一幕，人工智能！

南風窗(2016年19期)2016-09-21

物聯網關鍵技術與應用

科技視界(2016年5期)2016-02-22

就業信息服務平臺數據隱私保護方案設計

軟件(2015年4期)2015-06-19

圖書館研究與工作2024年2期

圖書館研究與工作的其它文章: 可持續發展教育——圖書館的責任; 國際圖聯綠色圖書館獎及其評審要點; 國外信息貧困研究進展; 基于專利分析的我國圖書館領域技術發展趨勢; 公共文體空間融合治理理念與發展策略研究; 新時代城市公共文化空間的價值定位與優化路徑研究

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合