?

價值互聯網的“價值”所在

2023-09-15 00:46李曉東
人民論壇 2023年16期
關鍵詞:數字經濟價值

【關鍵詞】互聯網基礎技術 數據互操作 數據基礎設施 數字經濟

【中圖分類號】TP39 【文獻標識碼】A

當前,全球互聯網發展迎來戰略機遇疊加的特殊窗口期,以價值互聯網支撐知識交換為特征的第四次工業革命驅動全球數字經濟發展進入新階段。黨的二十大報告提出加快建設“網絡強國、數字中國”,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(簡稱“數據二十條”)、《數字中國建設整體布局規劃》等頂層戰略文件出臺,配合組建國家數據局等行政機構體制改革,旨在破除數字經濟發展的制度障礙。數字經濟發展對其互聯網底座提出了更高要求,互聯網發展新階段基礎技術攻關的核心,應圍繞支撐數字經濟發展所需的更高知識密度和更小治理粒度的可信數據展開。

互聯網發展進入價值互聯網階段

互聯網誕生于信息化進程的數字化階段,發展于網絡化階段,爆發于智能化階段。隨著網絡規模的擴大和數據的累積,其核心需求從早期的數據交換、信息共享逐步演變為支撐經濟社會發展的知識構建,推動互聯網從數據互聯網、信息互聯網發展至價值互聯網階段。

數據互聯網階段(1974—1994年),核心需求是數據交換,關鍵問題是如何在不可靠的異構網絡上實現可靠的數據傳輸。早期的阿帕網中,主機之間的連接和通信前提是同構網絡,但隨著網絡數據傳輸需求的逐漸擴大和復雜化,出現了難以定位目標主機、傳輸錯誤率高、網絡運行效率低等問題。因此,該階段需要解決的關鍵問題是,如何規范數據包格式、統一通信協議的規范,實現主機互聯,滿足全球范圍內、異構網絡間的可靠數據傳輸的迫切需求。1974年,羅伯特·卡恩和溫頓·瑟夫提出的傳輸控制技術(TCP/IP協議前身)實現了數據包的封裝,以及在不可靠的網絡中將數據包從一臺設備可靠地傳輸到另一臺設備,有效地減少了網絡連接和傳輸過程中的錯誤,提升了網絡運行效率。此階段,電子郵件、文件傳輸服務是典型應用,主機、路由器、電纜等通信物理設施是關鍵數字基礎設施。

信息互聯網階段(1994—2014年),核心需求是信息共享,關鍵問題是如何在非結構化的網絡上結構化描述數據以形成信息。隨著互聯網接入規模的擴大,人們利用互聯網完成信息交互的需求逐漸凸顯。然而,由于缺乏信息獲取入口和信息共享途徑,多方之間高效的信息交互難以實現。因此,探索新的協議和規范,促進互聯網中廣泛的信息共享,成為互聯網的新發展方向。HTTP/HTML(超文本傳輸協議/超文本標記語言)是解決信息交互問題的關鍵技術和標準,由蒂姆·伯納斯·李提出,并于1994年成立萬維網聯盟來進行標準化和推廣應用。信息用HTML進行結構化表述,遵循HTTP協議規范傳輸,實現了以結構化的信息描述方式來表述非結構化的網絡數據,使得可獨立于互聯網主機之間的差異,在不同的硬件和操作系統上以相似的形式顯示信息,促進了互聯網中的跨域信息共享。隨著網站數量的大規模增加,主要實現網站名稱和主機地址映射的域名系統(Domain Name System,DNS)的重要性逐漸增強。域名系統通過對網站地址采用有語義的名字標識命名,實現了對網站的快速尋址,進一步推動了互聯網中的信息共享。此階段,門戶網站、電子商務、社交媒體等是典型應用,域名系統是關鍵數字基礎設施。

價值互聯網階段(2014年至今),核心需求是知識構建,關鍵問題是如何在不可信的網絡上交換可信數據以形成知識。數字經濟以數字化的數據作為關鍵生產要素,用以產生信息、知識和創造價值。然而,不可信網絡中的數據交換存在以下問題:一是數據安全無法保障,數據侵權、數據泄露等現象頻發,引發相關個體、企業對數據安全的擔憂,導致數據的過度保護,阻礙數據的流通;二是數據真實性難以保證,偽造數據、劣質數據層出不窮,數據使用者難以依托互聯網數據構建有價值的知識成果,導致無效的數據挖掘,阻礙數據應用的發展;三是數據價值分配缺乏合理性,互聯網平臺利用優質創作內容吸引非創作用戶流量、實現快速變現,但用戶無法通過自身產生的內容數據獲得合法收益,導致用戶的消極情緒,阻礙數據的持續產出。因此,探索新的規范和協議,保障數據安全、真實并實現數據價值的合理分配,達成數據的可信交換,是價值互聯網階段的主要任務。區塊鏈技術是滿足可信數據交換的關鍵技術之一,也是融合加密技術、共識機制及圖靈完備的智能合約語言的可信計算平臺,將通過維護不可篡改的分布式賬本,支撐價值互聯網中可信化要求的新的基礎設施構建。同時,為解決上述數據安全、可信及價值分配等問題,區塊鏈技術還需完善并融合承載數據治理規則和數據要素利用的數據互操作技術,在彌合網絡碎片和連通數據孤島的基礎上,保障數據全生命周期的可信、可用、可管、可控。

價值互聯網需要數據互操作技術

數據價值的凸顯和數據安全的加強迫使數據與應用解耦,逐漸成為可控可信的數據自治空間,形成眾多的數據孤島(簡稱數島)。因此,實現數島互聯以完成數據互操作,成為價值互聯網階段的重要課題?;ヂ摼W發展至今,顛覆性的技術創新難以打敗兼容性的技術演進,數據互操作的技術實現必須以現有互聯網基礎技術為依托,逐步形成新的互聯網協議標準。

第一,互聯網發展新階段數據互操作至關重要?;ヂ摼W發展新階段,數據與應用解耦成為關鍵特征。信息化進程從數字化、網絡化發展到智能化階段,數據與應用的關系隨之發生變化。在數字化階段,由于互聯網技術還沒有普及,數據和應用在用戶本地,用戶對數據具有完全的控制權。隨著數據產生速率的持續提升和應用模式的不斷創新,數據交換成為基本需求,直接推動了互聯網的誕生。同時,數字化數據的傳輸容量和傳輸速度需求進一步推動了網絡技術的發展。在網絡化階段,互聯網服務的發展催生了數據和應用均在網絡云端的新模式?;ヂ摼W服務為人們生活帶來極大便利,但也導致了用戶數據完全由云服務提供者掌握,用戶逐漸失去了數據的控制權?;ヂ摼W平臺作為數據的實際控制者和數據價值的直接受益者,承擔起數據安全、可信、可控的全部責任。然而,互聯網平臺僅是數據全生命周期的一個參與者,目前數據收益分配機制不利于數據產業生態的健康可持續發展。在智能化階段,數據和應用解耦成為必然趨勢。在《數據安全法》和《個人信息保護法》等相關法律法規相繼出臺促使數據合規及治理要求越來越高的同時,終端計算能力也隨著數字技術和網絡技術的發展逐步提升,隱私數據和重要數據以相關方可選擇的方式存儲于安全、可信、可控的數據自治空間中,應用服務提供方在經過相關方許可的前提下,“按需使用”獲取數據,以進一步提供服務。同時,建立數據價值分配機制,也可以使用戶依靠生產數據獲取持續收益。

數據與應用解耦促使互聯網應用和數據之間交叉訪問需求增加,使得數據互操作成為互聯網發展新階段的重要關切?;ゲ僮魇侵覆煌嬎銠C系統、網絡、操作系統和應用程序一起工作并共享信息的過程,存在于互聯網誕生之初,并伴隨著互聯網發展而演進。數據互聯網階段,互操作技術專注于實現主機間的通信,完成異構網絡間的數據交換;信息互聯網階段,互操作技術專注于實現網站間的統一規范,完成不同網站間的信息共享;價值互聯網階段,數據與應用解耦將推動互聯網應用和數據之間交叉訪問,應用與數據的一對一關系將演變為多對多關系,從而大幅提升互操作的復雜度,解決數島間的數據互操作成為關鍵。

互聯網數據互操作是用于解決數據跨域互聯互通和交換共享的互聯網基礎技術,秉持“數據不離域,可用不可見”的基本原則,驅動數據應用從“數據中臺”到“數據中樞”模式的轉變。一方面,由TCP/IP、HTTP/ HTML、DNS等協議構成的傳統互聯網基礎技術,作為連接互聯網物理基礎設施、支撐互聯網多樣化應用的關鍵技術,因未考慮數據權屬和保護問題,造成數據訪問受控于網站,難以滿足數據與應用解耦模式下可信數據交換的要求,制約了數據要素的流動和價值釋放;另一方面,傳統以“數據中臺”為基本模式的跨域數據交換,因存在一個收集原始數據的集中平臺,導致數據需從本地可控存儲流向集中的不可控第三方平臺,同樣造成數據安全可信保障的困難。因此,數據互操作技術需從保護數據安全及權屬的角度出發,基于已有的互聯網基礎技術,構建應用與數據之間的“橋梁”;避免數據的離域,用“數據中樞”的新型模式替換“數據中臺”的傳統模式,用跨域數據索引與確權替代傳統數據中心存儲數據的方式,在歸還數據管理與授權的基礎上,實現對互聯網數據資源的定位,在保障數據權屬的前提下安全交換數據,為數據與應用解耦后的數據高效利用夯實基礎。

第二,數據互操作技術支持數據跨域互聯互通。數據互操作技術需貫穿數據采集、傳輸、存儲、計算、應用、消亡的數據全生命周期,支持發現和定位數據資源,并在保障數據權屬和促進數據可信的前提下實現數據資源安全交換。數據互操作需解決標識確權、認證授權和安全交換三大關鍵問題,并支撐數據標識體系、數據確權體系、身份認證體系、訪問授權體系、分級分類體系、算法管理體系構建。其中,統一標準的標識體系為數據建立全球唯一標識索引,形成共享和交換數據信息的紐帶,使得產生的數據能被發現、需要的數據能被找到;統一標準的確權體系,明確數據權屬,保障數據持有者、加工者、經營者等各方的合法權益;統一標準的認證體系,確保身份的唯一性和不可偽造性,為數據的跨域使用提供分布式身份認證能力,打破因無法認證操作者而拒絕數據跨域使用的現狀;統一標識的授權體系,僅允許經授權后的數據訪問,以保障數據可控,保證數據互操作流程的安全性和合法性,減輕個人、企業等對數據侵權進一步引發的數據泄露等問題的擔憂;統一標準的分類分級體系,以依據核心數據、重要數據、一般數據構成的分級框架和公共個人維度、公共管理維度、信息傳播維度、行業領域維度的分類規則,形成具體可操作、可執行的數據分類分級標準,保障數據跨域互操作過程的合規性;統一標準的算法管理體系,對可信算法統一管理和認證,以結合現有的隱私保護技術,在不離域的前提下實現科學數據的價值釋放。

數據互操作技術的“互操作”需要做到與現有技術向后兼容的數據互聯互通。因此,以標識為基礎,發揮已有互聯網基礎技術的能力和優勢進一步推動技術演進,是數據互操作技術的主要實現思路。從最初以地址標識為基礎的路由系統,到以名字標識為基礎的域名系統,支撐數據交換、信息共享的歷史要求雖已完成,但已難以適應當前知識構建和價值交換的要求,因而一種以泛在標識為基礎的數據標識系統的產生成為必然。當前,域名及域名系統是互聯網關鍵資源的核心連接點,它基于對IP地址等資源的關聯和映射,不僅將全球的網站連接在一起,更是成為全球互聯網的中樞神經系統。實現全球的數據連接,構建數字經濟的中樞神經系統,要實現從DNS(域名系統)到DIS(數據互操作系統)的演進。需要強調的是,數據互操作技術要實現向后兼容,以符合互聯網統一標準的方式發現和定位數據資源,并在保障數據權屬和促進數據可信的前提下實現數據資源的安全交換,而不是自建體系。這既是互聯網基礎技術創新的趨勢,也是數據治理落地實施的保障,更是數字經濟發展對數據基礎設施的要求。

數據互操作技術的“互操作”還需達成國際數據孤島間的互操作,推動DIP/RDF(數據互操作協議/資源描述框架)國際統一標準的形成,實現全球范圍的數據互聯互通。在不同互聯網發展階段,互聯網基礎技術始終由資源描述規范及配套的傳輸協議構成。在價值互聯網階段,一種用于描述數據資源及可信數據資源傳輸的協議,對于實現數島互聯至關重要。RDF是一種描述數據資源元數據的規范模型,以<資源,屬性,陳述>三元組為基本元素,用于描述數據資源的基本特性及關系,該技術是實現數據資源重用和數據交換的關鍵,更是互聯網數據機器可讀、進一步實現大規模數據應用的基礎。數據互操作技術將以RDF作為數據資源描述的基本規范,推動跨域數據互聯互通的數據資源傳輸協議——數據互操作協議DIP的標準化工作,在國際社區形成數據互操作共識,進一步促進數據價值流通,擴大數據應用范圍。

數據互操作技術釋放數據要素價值

數據互操作技術有助于保障數據內容可信、數據交易安全、收益分配公平,在未來,數據互操作技術將成為數據基礎設施的核心技術,而數據基礎設施的形成和發展,有助于推動在高質量數據互聯互通基礎上的應用生態蓬勃發展。

第一,數據互操作技術支撐數據基礎設施構建。2023年2月,中共中央、國務院印發《數字中國建設整體布局規劃》(以下簡稱《規劃》)明確,數字中國建設要“夯實數字基礎設施和數據資源體系‘兩大基礎”,并將數字基礎設施劃分為網絡基礎設施、算力基礎設施和應用基礎設施三類。支撐數據資源體系的數據基礎設施某種意義上屬于網絡基礎設施的范疇,并連接算力基礎設施和支撐應用基礎設施。推動數字經濟高質量可持續發展是數字基礎設施建設的最終目的,數據要素是數字經濟發展的最活躍增長要素,數字基礎設施應支撐數據全生命周期的高效流通。以暢通數據資源大循環為價值導向,必然促使數據基礎設施從網絡基礎設施中分離出來。網絡基礎設施主要完成數據的采集和傳輸,算力基礎設施主要完成數據的存儲和計算,應用基礎設施主要完成數據的分析和應用,數據基礎設施則貫穿和連接網絡基礎設施、算力基礎設施和應用基礎設施,打通數據資源體系,促進數據循環暢通,從而釋放數據要素價值。

類比于工業經濟時代圍繞資本流通建立的監管體系,數據基礎設施幫助實現對數據要素的統籌管理與宏觀調配。一方面,數據基礎設施對內保障數據本身的安全可靠,對外促進數據全生命周期各環節之間的聯動配合;另一方面,數據治理與安全保障能促使更多的高價值數據從封閉的系統平臺中釋放出來,并保障數據全生命周期的安全有序流通。

數據互操作技術是數據基礎設施構建的核心技術。在本質上,數據互操作技術是一套實現數據交換的機制設計,包含標識確權、認證授權、安全交換三個核心步驟,其中標識確權和認證授權對應了數據交換確權和行權的過程,明確了數據提供方的權利和義務,即負有保證數據內容真實可靠、安全合規的義務,同時也享有根據數據的實際價值、需求程度、數據質量獲得收益分配的權利;而安全交換則對應于數據交換過程的安全性。此外,數據互操作系統承載了基于此系統實現的每一筆數據交換的真實記錄。就技術定位而言,數據互操作實現了對從采集傳輸到應用消亡的數據全生命周期的監管。數據互操作是數據基礎設施的底層技術架構,數據基礎設施應包含的其他功能,如數據內容審核、任務資源分配等,都能夠基于這一底層機制和技術架構向上構建。在未來,數據基礎設施的內涵與功能將隨著現實數據需求與數據治理實踐的變化而不斷豐富,但圍繞每一次數據交換的實現思路與方向是基本不變的。就具體功能而言,明確數據權屬以及保障交換安全本身屬于“控制”的具體內涵,其中,明確的數據權屬配合真實的交換記錄為數據治理提供依據。數據互操作系統能夠與數據治理規則相容,從數據流通的底層架構中為數據治理留出操作窗口,對數據治理手段進行數字化賦能,使其不再獨立于技術系統與平臺之外。

第二,數據基礎設施支撐數字化發展應用生態。一方面,互聯網發展面臨的新問題、新需求會助推數據基礎設施的發展并形成相關產業;另一方面,數據基礎設施的發展成熟,也將支撐上層應用不斷取得新突破。

任何技術的推廣與普及都必然以市場化的方式運作并形成相關產業,數據基礎設施的發展將助推形成數據基礎設施產業,并在納入數字經濟核心產業的統計范疇以及數字經濟運行中發揮特定的作用、扮演固定的角色。當前,中國已建成世界規模領先的數字基礎設施,其中,網絡基礎設施規模全球最大,算力規模位居全球第二?!稊底种袊l展報告(2021年)》指出,2017年到2021年,我國數據產量從2.3ZB增長至6.6ZB,全球占比9.9%,位居世界第二。隨著中國產生的數據量呈指數級增長,數據基礎設施產業也將發展至與其他數字基礎設施相當的體量與規模,數據基礎設施產業的發展蘊含著巨大的市場機會和廣闊的想象空間。

數據基礎設施助力數字技術迭代升級。大數據、云計算、區塊鏈、物聯網、人工智能等數字技術作用于數據生命周期的部分環節甚至全流程,數字技術的迭代升級與數據互聯互通息息相關。以人工智能技術為例,機器學習中的神經網絡是大型語言類模型出現之前,人工智能技術中應用最為廣泛的門類,能夠較好地解決圖像識別、聲音識別等問題,并應用于人臉識別門禁卡、無人駕駛汽車等領域。神經網絡技術理念的提出最早可以追溯到McCulloch and Pitts(1943),上世紀六十年代曾經歷了技術理論的繁榮發展期,但是神經網絡技術直到2010年才開始大規模普及應用,算力基礎設施不健全與數據資源匱乏是其中的主要限制因素。同樣,算力基礎設施與豐富的數據資源支撐了ChatGPT等大型語言類人工智能模型的構建。一方面,ChatGPT等大型語言類模型的發展高度依賴于高知識密度數據的積累,而“數據孤島”問題的凸顯,難以有效支撐人工智能技術及其應用的發展,這就需要數據基礎設施為人工智能技術的發展提供豐富的高知識密度數據;另一方面,ChatGPT等大型語言類人工智能模型的發展隱含一定治理風險,呼喚數據基礎設施在數據資源體系大循環中扮演總體控制的角色。

數據基礎設施賦能相關產業發展壯大。從數據要素產生的邏輯來看,可將各類產業分為數據原生產業和數據次生產業,數據原生產業從產生之日起就依托于數據存在并發展,數據次生產業則指傳統產業的數字化轉型、數據基因的植入與產業數字作用機制的形成(江小涓和靳景,2022)。對于數據原生產業而言,數據基礎設施促進高價值數據釋放,直接推動了數據原生產業的發展。對于數據次生產業而言,數據基礎設施賦能傳統產業,使之向數據次生產業演進。制造業是發展實體經濟的重點,數據基礎設施支撐數據要素高效流通,幫助制造業生產直面消費市場,使生產制造方式從大規模、標準化、低成本的流水線生產向小規模、個性化、易調整的數字化生產方式轉變,使按需生產、快速響應、各生產環節之間的緊密配合成為可能,衍生出增量制造、柔性制造等新模式。

面對價值互聯網的發展浪潮,在網絡強國戰略實施過程中,引領互聯網體系結構和基礎技術方面的創新才是根本。為此,應加快搭建數據基礎制度體系、制定有關技術標準,前瞻布局“數據中樞”模式沙盒試點,以積極作為的姿態把握第四次工業革命發展機遇,以網絡強國和數字中國建設推動實現經濟和社會發展數字化轉型,以數字經濟高質量快速發展推動實現中華民族偉大復興的宏偉目標。

(作者為中國科學院計算技術研究所互聯網基礎技術實驗室主任,清華大學互聯網治理研究中心主任,伏羲智庫創始人)

【參考文獻】

①江小涓、靳景:《數字技術提升經濟效率:服務分工、產業協同和數實孿生》,《管理世界》,2022年第12期。

②McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5: 115-133.

③李曉東、劉金河、付偉:《互聯網發展新階段與基礎資源全球治理體系變革》,《汕頭大學學報(人文社會科學版)》,2021年第8期。

責編/王妍卓 美編/宋揚

猜你喜歡
數字經濟價值
踐行初心使命的價值取向
價值3.6億元的隱私
一起來認識“數字經濟”
OECD國家數字經濟戰略的經驗和啟示
一粒米的價值
從數字經濟視角解讀歐亞經濟聯盟與絲綢之路經濟帶對接
“給”的價值
數字經濟對CFC規則的沖擊探究
應對數字經濟下的BEPS現象
大數據時代我國信用評級業重構研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合