?

計算社會科學與科學決策的未來

2023-11-30 18:56唐世平
國際政治科學 2023年3期
關鍵詞:社會科學機器決策

【關鍵詞】 計算社會科學 模仿 模擬 全數據計算 復雜決策【作者簡介】 唐世平,復旦大學國際關系與公共事務學院教授,復旦大學復雜決策分析中心主任。

電子郵箱:twukong@fudan.edu.cn

自拉澤爾(David Lazer)等人在2009年《科學》雜志發表《計算社會科學》一文以來① ,計算社會科學(Computational Social Science)作為一個新興的交叉學科領域已經在整個國際社會科學界引起了廣泛關注。① 但是,對于計算社會科學到底能為我們理解人類社會帶來怎樣的價值,以及如何推進計算社會科學的進步,學界仍存在相當大的分歧。

一方面,“大數據學派”普遍認為,只要有了大數據,通過計算機的計算,特別是基于機器學習②(包括深度學習)的計算,就有可能識別出人類社會中的眾多規律或至少是某些規律性模式(regular pattern),而這將為我們理解人類社會帶來翻天覆地的革命。③ 這一路徑的計算社會科學基本沒有從既有的社會科學成果中汲取太多的理論和實證積累。甚至可以說,這一路徑的計算社會科學的隱含目標之一就是拋開既有的社會科學,主要依賴數據規模、算法和算力來理解人類社會。另一方面,大部分傳統的社會科學家認為,完全依賴大數據和計算并不能幫助人類理解某些重大經典問題,比如革命、民主化、內戰、國家重建、經濟發展等等,因為這些問題根本就沒有很多數據。④當然,諸如當代社會中的不平等的根源及其后果這一類存在大規模數據的問題領域,基于大數據的計算社會科學還是可以帶來許多新的理解。

本文持一個大致的中間立場。一方面,本文認為,通過大數據計算確實有可能識別出人類社會中的某些規律性模式。但這樣的規律性模式恐怕并不如我們想象的那么多,而且也不一定具有普遍意義,因為人類社會一直都是一個在時空中演化的體系。同樣重要的是,模式識別本身還是描述,而不是解釋,因此識別出來的模式也不一定能夠為決策,特別是為需要考慮可能的干預的決策提供太多的支持。另一方面,本文認為,盡管基于大數據的計算社會科學可能對理解絕大部分重大經典問題的因果關系幫助有限,但計算社會科學確實有可能給應用社會科學特別是決策科學(decision sciences)中的科學決策,帶來巨大變革。

簡單地說,計算社會科學與科學決策的結合,能夠讓國家和機構對不同國家和地區的發展態勢有更加“及時的”(timely)但未必“實時的”(realtime)和精準的(precise+accurate)預測和預警??梢韵胍?,如果一個國家和機構能夠對重大事件有一定的事先預測和預警,那么,這個國家和機構至少可以規避重大損失。因此,將計算社會科學與科學決策緊密結合起來,將是世界各主要經濟體在未來的重要競爭領域之一,是國家綜合國力的一個重要的、甚至是核心的組成部分。

一、 計算社會科學與科學決策

計算社會科學是基于大規模計算,通常也基于大規模數據,對我們關心的社會行為和社會事件(作為社會結果)進行推演和計算的科學。計算社會科學以數學(特別是概率論、統計學等)、計算機技術、數據技術(如知識圖譜)為核心技術平臺,基于社會科學理論和實證研究為數理模型和程序設計提供核心思想。因此,計算社會科學是將社會科學、計算機技術以及數據技術結合起來的交叉學科。而決策科學是試圖基于科學手段來幫助人類優化復雜決策的交叉學科。顯然,由于人類的復雜決策主要是針對社會中的其他行為體的,因此決策科學是一門更偏向于社會科學的學科。決策科學的最核心的目標必然是如何更加科學地決策。

總體來看,決策者都面臨兩個根本的挑戰:一是信息的缺乏;二是處理信息的能力,包括如何甄別和剔除干擾信息的能力。在相當長的時間里,這兩個挑戰幾乎是無解的。因此,傳統的復雜決策均高度依賴專家判斷。隨著自然科學和技術的發展,尤其是從數學(特別是概率論、統計等)到計算機技術的發展,決策科學也越來越多地借助這些技術手段。而計算社會科學的到來,將極大地緩解上述兩個挑戰所帶來的壓力。決策科學中的科學決策因而也就面臨前所未有的變革機遇。因為計算社會科學完全有可能讓人類的許多重大決策不僅能夠更加基于客觀數據和計算,且在數據(信息)的來源和規模上有極大提升,從而讓傳統的絕大部分依賴專家主觀意見的決策行為變得更加科學。因此,在接下來的討論中,本文將主要圍繞關乎決策的計算社會科學進行討論,并將用“決策計算社會科學”來描述這個領域。

在此,需要特別強調的是社會行為與社會結果之間存在根本性區別。①社會行為是指行為體的行為,且人們通常關注的是行為體的自主行為,而不是行為體的本能性行為。社會結果則是在一定的社會情境下,由行為體的行為相互作用以及行為體的行為與社會情境相互作用而造就的涌現性結果(emergent outcome)。顯然,行為體的選擇都受到社會和自然環境的約束。更重要的是,通常情況下,一個行為體的行為結果不完全由該行為直接決定,而是多個行為體的行為在一定的社會和自然環境下相互作用的結果。換句話說,任何社會結果都只是部分,而不是全部由行為體的行為驅動。

這個區分對于理解為何模擬要比機器學習的技術取向可能更適合預測結果非常重要。此前很多關于計算社會科學的討論因為沒有區分這兩類不同的客體,都誤以為機器學習的技術就足以解決我們關心的問題。事實上,只要我們承認社會行為與社會結果的區別,我們就不得不承認對社會結果的預測只能主要依靠模擬。而由于行為受到環境的約束且人類的自主行為都會受到其他行為體的影響,我們對行為的理解和預測可能也需要基于一定的模擬(加上機器學習),而不僅僅是機器學習。

二、 “決策計算社會科學”的技術取向

過去的20年,大數據驅動的機器學習和人工智能技術突飛猛進并得到廣泛應用。但是將計算社會科學與大數據驅動的機器學習和人工智能等同起來,認為大數據驅動的機器學習和人工智能是計算社會科學的唯一技術取向,這種看法并不全面。實際上,計算社會科學至少有兩大技術取向。更重要的是,這兩大技術取向有著根本差別,各有優勢和劣勢。如果不能相對準確地理解這兩大技術取向的差別以及它們各自的優勢、劣勢,對“決策計算社會科學”未來的把握就可能出現偏差?;诖?,有必要對不同的技術取向給出一些初步思考。①

這里將具體討論兩個問題。一是“決策計算社會科學”的技術取向是以基于“模仿”的機器學習為主,還是以基于“模擬”的技術為主但也加上機器學習? 二是“決策計算社會科學”是主要依賴大數據,還是綜合運用不同數據?

顯然,要想對可能的決策問題進行計算,就需要預測和推演。因此,本文不討論完全不以預測和推演為目標(或者中間目標)的計算社會科學。目前大部分社會科學雜志發表的屬于計算社會科學的研究,都不是以預測和推演為目標的,而仍舊是以傳統的因果推斷(causal inference)為目標的。這些研究和傳統的計量社會科學的研究沒有根本區別,只是在數據的結構、規模和運用的算法上有差別。② 它們的目標仍然是確立某些要素對某些結果的影響。這些研究也許能幫助我們預測某些行為和結果,特別是相對線性的行為和結果,但這些研究都不以預測和推演為目標,更不以支持復雜的決策為目標。而本文將主要討論以預測和推演行為或結果為目標的計算社會科學。

(一) “模仿”還是“模擬”?

本文認為,“決策計算社會科學”有兩個大的技術取向:以“模仿”為目標的機器學習和以“模擬”為目標的計算模擬。① 基于決策問題的特殊需求,未來的“決策計算社會科學”應該以模擬技術為主要技術取向,但又融合模仿技術。

1. 作為模仿的機器學習

傳統的計量社會科學主要依賴因果推斷,而不是推演和預測。因果推斷的核心基礎之一是統計學,機器學習的核心基礎之一同樣是統計學,因此機器學習也是最早被用于計算社會科學的工具之一。

新興的深度學習和早期的機器學習密不可分。但是,學界的一個趨勢還是將(狹義的)深度學習和(狹義的)機器學習區分開來。② 今天的深度學習可以認為是自2006年杰弗里·辛頓(Geoffrey Hinton)等人推出無監督深度置信網絡訓練方法之后發展出來的機器學習。③ 在同一時期,計算機硬件快速發展,數據規模也不斷擴大,深度神經網絡開始廣受歡迎。2012年,深度學習開始大爆發,卷積神經網絡(CNN)、循環神經網絡(RNN)、進化神經網絡(ENN)等模型的優勢逐漸顯現,并且在模式識別、信息檢索、自然語言處理等多個領域的應用都取得了重大突破。

在根本意義上,機器學習都是基于模仿,然后超越人類的計算和推理能力。從經典統計到機器學習,都要經歷由訓練集到預測集的過程。訓練集主要用來訓練模型,這部分工作主要依賴歷史數據。而如果要檢驗模型的有效性,除了在訓練集內訓練之外,還需要在預測集中檢驗模型的有效性。而在預測集中,既可以是基于已知的歷史數據“預測”歷史上已經發生的行為和事件,也可以是基于推定的(projected)未來數據預測未來的行為和事件。

在基于模仿然后超越人類的計算和推理能力方面,計算社會科學在多個領域都取得了顯著進展。比如,深度學習技術在自然語言處理方面的應用取得了很大的進步。而知識圖譜則將復雜的領域知識通過信息處理、數據挖掘、知識計量和圖形繪制,試圖發掘人腦無法發現的關聯甚至規律性模式。此外,圖像識別也是一個重要的深度學習的應用領域。

對戰略行為的預測,傳統社會科學的一個主要工具是博弈論,具有代表性的是布魯斯·布爾諾·德·梅斯奎塔(Bruce Bueno de Mesquita)所做的工作。① 梅斯奎塔的模型是基于期望效用(expected utility)的相對簡單的模型。盡管他的模型有多個行為體,但是在求解的時候,他還是不得不將多個行為體的博弈簡化成為兩個行為體的博弈,因為一旦多于兩個行為體,整個模型的均衡在數學處理方面將非常難解。不僅如此,其模型還包含非常多的主觀賦值。因此,該模型到底有多少實用價值并不確定。從這方面的文獻追蹤來看,繼承這個技術路徑的學者并不多,而學界對基于博弈論來預測行為的批評也一直都沒有停止過。②

從某種意義上說,深度強化學習似乎天生就是為智能決策服務的。深度強化學習通過結合深度學習和強化學習,讓智能體在訓練中試錯,通過獎勵和懲罰反饋神經網絡,從而得到更好的策略模型,然后根據當前狀態判斷應該采取的行為。因此,有學者認為,計算社會科學就是基于大量數據,通過技術獲得關于人類的更加精細的行為模式(pattern),并且基于此構建相關理論的科學。① 應當說,機器學習技術在分布相對穩定、跨時可比性高的行為方面的努力已經卓有成效。但在復雜且不穩定的戰略性行為的預測方面,機器學習技術的成功應用案例還是罕見的。事實上,目前深度強化學習的主要應用都是針對個體水平的行為決策,如基于用戶畫像和模式識別的購物廣告投放、社交媒體內容推薦等等。

基于機器學習技術對社會結果進行預測的比較典型的努力是基于歷史事件數據以及新聞數據來預測政治不穩定,如政變、革命、內戰等。② 在數據上,除了歷史事件數據以及新聞數據,還包括結構因素以及外部沖擊事件,比如石油危機、金融危機的數據等。在算法和模型上,這些努力均注重多種算法和模型的混合。由奧斯陸和平研究所(PRIO)的赫瓦德· 赫格里(H?vard Hegre)等人主持開發的政治暴力早期預警系統(Political ViolenceEarly Warning System,ViEWS)是這一類努力的最雄心勃勃的項目之一。③類似的項目還包括杰克·A.戈德斯通(Jack A.Goldstone)等人的“政治不穩定”(Political Instability Task Force,PITF)項目,以及《和平研究雜志》2017年的特刊文章。① 總體來說,學界認為這些對社會結果進行預測的努力,其效果并不好。②

造成這一結果的核心原因至少有3個。首先,目前的研究通常主要基于結構性因素。結構性因素的變化相對緩慢,因此這些因素構成的模型最多只能告訴我們某個國家和地區的穩定性如何,卻并不能給出及時和精確的預測或預警。③ 其次,社會系統是一個演化的系統④,而基于機器學習的預測的核心假定之一是社會系統是相對線性的。另外,基于深度學習技術的預測社會結果的努力,其過程中的黑箱成分更多,也即它沒有太多的社會科學理論和實證基礎作為支撐。① 而這對于以預測戰略行為和結果為目標的努力來說,還是有很大缺陷。最后是一個純技術性問題,因為基于深度學習技術的預測社會結果的努力通常都基于歷史數據,特別是新聞數據。而基于自動字段提取技術得到的數據集往往有不少數據質量問題,同樣會加劇這方面的技術問題,盡管最近火爆的語言大模型肯定會有所幫助。②

2. 計算模擬(computational simulation)

模擬是計算社會科學的另一個技術取向。模擬的目標是模擬兩個及以上不同行為體的行為以及這些行為的相互作用而導致的涌現性結果。最早的模擬大致包括格斗模擬和軍事演習。格斗模擬主要用于提升單兵的戰斗力(與戰斗機飛行員的格斗訓練類似),而軍事演習(沙盤、兵棋推演,直到實兵實彈的演練)則主要用于提升整體的戰斗力和優化戰術部署。因此,從模擬的目標可以反推,模擬方能夠以改變自身和對手的行為來改變結果。

計算機到來后,就有了計算(機)模擬。計算模擬技術本身也有很多種。因為社會結果都是由行為體的行為以及這些行為的相互作用在一定的環境下造就的,因此,本文認為,ABM 可能是最適合模擬基于戰略行為的涌現性社會結果的一個技術路徑。③

首先,模擬更關心社會結果,或者說是由行為與行為的相互作用在一定的環境下達成的結果。相比來說,博弈論模型中通常只能推演兩個或至多3個行為體的行為,而ABM 則可以容納多個行為體,并能夠推演這些行為體的復雜行為選擇。

其次,也是最為關鍵的,ABM 是一種由下至上的模擬技術。ABM 試圖捕捉在一定的環境下,由行為體的行為以及它們的相互作用而造就的涌現性的、更高層次的社會結果。① 因此,ABM 特別適合以通過模擬來預測結果為目標的研究。

再次,基于ABM 的模擬,不僅可以模擬對比不同情境,而且可以回溯結果的成因(類似于圍棋的復盤),從而大大降低黑箱的成分。因此,ABM 特別適合基于對結果的推演來反推行為體的多種行為。

這里還需要特別指出,ABM 與傳統的沙盤推演及兵棋推演也有很大的不同。傳統的沙盤推演、兵棋推演都是基于相對固定的場景(從行為體到規則、到環境),而且轉換情境的成本相對高昂。ABM 則具有高度的可適應性,可以非常方便地遷移到不同的情境,而且成本相對低。更重要的是,ABM 中的行為體完全可以有獨立面對特定狀況的行為決定權,而沙盤、兵棋通常都是一方的指揮官指揮所有的下級單位行為體。

ABM 有3個核心要素:行為體、環境、行為規則。ABM 中的行為體可以是個人、社會群體(企業或其他群體)、政黨、政府或者其他任何研究者感興趣的行為體,只要這些行為體是基于某些規則做出決定的就可以。換句話說,這些行為體的行為不是完全隨機的。系統內的行為體可以有各種特質,包括人口學特征(性別、年齡、族群等)、社會經濟特質(比如婚姻狀態、收入水平、從事的行業等)、政治傾向(比如黨派)。這些特征都有可能影響行為體的行為?;谶@些特質和其他數據,研究人員可以通過社會科學的研究或機器學習來提取行為體的某些行為規則。之后,行為體在系統中的行為以及它們的相互作用將造就出涌現性和更高層次的社會結果。通過多次且每一次模擬運算進程都不同的模擬,加入隨機事件和沖擊以及不同的非線性干擾,ABM 將能夠看到這些行為體的行為的相互作用造就的社會結果是否具有一定的穩定性。如此,ABM 就能讓研究者去考察社會結果的生成過程及其背后的因素和機制,而且這個過程可操縱和回溯。而這一能力是其他許多技術都不具備的。

最早的ABM 系統可以追溯到托馬斯·C.謝林(Thomas C.Schelling)著名的關于居住的種族隔離的研究。① 但在相當長的時間里,ABM 都只能用來演示某些可能的結果以及檢驗某些可能的因素和機制的可靠性,而并沒有在以預測和推演為目標的社會科學中有太多應用。② 其中一個主要的限制是計算能力:如果要模擬接近真實情形的社會結果的生成,通常需要很大的計算量。因此,在2000年之后,計算能力的日益強大,特別是云計算的出現,使得ABM 終于有了可以大顯身手的機會。目前,ABM 已經被用來探索許多不同的問題領域,從恐怖主義到社會流動,到經濟社會動態,到復雜社會網絡,包括恐怖網絡和毒品網絡。③

3. 兩個技術取向區別及優劣勢比較

機器學習和ABM 這兩大技術取向有許多重要的差別。這些差別一定意義上解釋了它們面臨的不同挑戰,包括它們的應用范圍。這些差別主要表現為七個大的方面。

第一,核心基礎。機器學習的核心基礎是統計學習。ABM 的基礎則更為多元,統計學習只是ABM 的基礎之一。

第二,方程的形式與實現成本。在機器學習中,方程的核心目的是單一的,即通過方程中的某些參數來直接捕捉結果。因此,機器學習的核心方程幾乎都是一個形式:y=f(X )+ε。其中,y 為預測結果變量,ε 為誤差項,X通常是多個解釋變量的集合。即便是針對不同的問題領域,絕大部分機器學習模型的核心差別其實也不大。因此,一旦一個機器學習的算法被發展出來,其后的技術實現就變得相對容易了。這背后的一部分原因是機器學習對社會科學理論和實證以及專家知識的依賴性較低。

相比而言,ABM 系統中不同方程的目的不同。一個ABM 系統通常包括多個方程及其參數,用于刻畫行為體、行為及行為規則、行為體與行為體之間的相互作用規則、行為體與環境的相互作用規則,以及最終如何驅動結果。很顯然,這些不同方程幾乎不可能有固定形式。因此,ABM 的技術實現比較復雜。在ABM 的建模過程中,需要參照和引入社會科學的既有理論和實證結果,包括專家知識,而不能只是讓機器去從大數據中自我學習。因此,針對不同問題的ABM 模型通常需要非常不同的設計。換句話說,ABM的技術實現沒有一個簡單的通用規則。因此,相比基于機器學習來說,ABM的技術實現會更加費時費力,特別是構建模型的過程可能需要更多輪的試錯。①

第三,機器學習的結果(y)都是數值。ABM 的結果不是某個數值,而是某個狀態,盡管該狀態可以用某些數值去刻畫。

第四,結果與方程的關系。在機器學習中,方程均試圖直接捕捉結果,即便是一組方程也如此。相比之下,ABM 的結果不能被任何一個方程,甚至被所有的方程加在一起而直接捕捉,因為結果是系統的涌現性結果。

第五,模型的改進與社會科學的關系。機器學習模型的改進主要依賴數據量和數據質量的提升來訓練模型,努力減少誤差項ε,然后依據多個解釋變量的集合X ,來預測結果變量y。因此,機器學習通常高度依賴更多和更加完善的歷史數據,并通過收集、處理文本、圖片和視頻等大規模原始資料為機器學習模型提供更多、更干凈的數據集??傊?,絕大部分機器學習的模型改進對社會科學的借鑒不多。不過,隨著業界逐漸意識到有人工介入的有監督機器學習至少對于某些領域的機器學習模型的改進不可或缺,機器學習對社會科學的理論和實證的依賴在未來可能會上升。

ABM 模擬也需要將模擬結果與歷史結果進行比對來不斷改進模型,之后再用這些模型來預測未來的某些結果。但是,對ABM 模型的改進不僅需要依賴數據的數量和質量的提升,還必須基于對社會科學理論和實證結果的更好的把握。

第六,不同層次的數據整合(integration)。一般來說,在計量社會科學中,不同層次的變量之間的整合或者相互作用可以由多層次模型(hierarchical models)中的交互項來捕捉。在機器學習的算法中,基于決策樹的模型可以被認為是一種交互項的算法。不過,決策樹給出的結果卻并不代表不同層次的數據整合,因而其結果也不容易被理解。而在其他的統計機器學習算法(如xgboost)以及神經機器學習中,交互項的使用更少。因此,總體來說,即便是在基于多層次模型的機器學習中,不同層次的數據之間的整合也相對較低。

相比之下,ABM 從一開始就建立在整合不同層次數據的理念之上。ABM 的核心理念就是通過讓多個行為體在中觀和宏觀環境下選擇行為,然后讓這些行為相互作用,并與環境相互作用,然后來驅動最終的涌現性結果。因此,ABM 能夠更好地整合不同層次的數據。

第七,社會系統是否演化? 機器學習的技術實現基于一個通用的原則,即基于訓練集數據(包含結果變量和解釋變量),不斷優化模型,之后用優化的模型來預測未來的某些結果變量。因此,盡管機器學習本身允許模型的不斷優化,但機器學習的基本假定是社會系統大體是線性的。也就是說,機器學習不太容納社會系統的演化。

相比來說,從一開始ABM 就明確承認社會系統本身會演化,而且明確試圖去捕捉系統的演化。從技術上,ABM 也可以非常容易地容納非線性、非單向的行為和環境的變化;而且不僅行為體以及他們的行為和行為規則可以演化(包括基于自主學習的演化),整個系統的環境也同樣可以演化。事實上,最早的幾個ABM 應用案例,從謝林的“自動隔離”模型,到羅伯特·??怂沽_德(Robert Axelrod)的“合作的演化”,都是以模擬演化結果的研究。①

4. 未來的發展方向: 整合了機器學習的計算模擬

如上所述,ABM 的3個核心要素是行為體、環境、行為規則。確立行為體、環境、行為規則的基礎是統計和歷史描述性知識。而機器學習在大規模數據提取和處理上,擁有傳統社會科學所完全不能擁有的能力。因此,整合了機器學習的計算模擬是未來的發展方向之一,而ABM 則具有幾乎無限的整合機器學習能力。具體來說,機器學習對于描述ABM 系統中的行為體的特征、環境以及行為規則都有重要幫助。① 另外,早期的ABM 中的行為體不能自我學習、自我演化,隨著機器學習特別是深度學習技術的到來,ABM中的行為體的特征和行為規則完全可以自我演化。深思公司(Deepmind)發展的基于強化學習的“奪旗游戲”就是這樣一種嘗試性的努力。②

不過,盡管將機器學習和ABM 結合起來的思想很早就有(大致的技術實現路徑見圖1)③,但進展并不明顯,特別是真正將兩者結合起來并用于解決真實世界中的問題的嘗試還不多見??梢哉J為,這樣的整合可能有三個層次,或者說是分三步走。

第一個層次,主要是利用機器學習,幫助ABM 系統中的行為體、環境、行為規則進行調參和優化。目前已經發表的研究成果主要集中在這一個層次,但尚未應用于解決真實世界中的問題。

第二個層次,以第一個層次為基礎,基于機器學習,讓ABM 中的行為體特征和行為規則都可以自我學習、自我演化。目前的研究離該層次還有相當的距離。

第三個層次,在第一和第二個層次的基礎上,讓ABM 對環境的刻畫都能夠自我學習、自我演化,進而從深度和廣度上讓ABM 能夠更好地捕捉真實的世界。目前的研究離這個層次還有非常大的距離。

(二) “全數據計算”,而不僅僅是“大數據計算”

如前所述,在絕大部分人的理解中,計算社會科學就是基于大數據的社會科學。事實上,拉澤爾等人在2009年的《計算社會科學》一文中幾乎把“大數據(科學)”等同于“計算社會科學”。① 對于這樣的一個立場,許多傳統的社會科學家并不認可。① 本文亦對這樣的立場持保留意見。

本文認為,基于“全數據計算”才是“決策計算社會科學”的正確方向。因為決策計算需要的是“全數據”思維,而不僅僅是“大數據”思維。也就是說,大數據只是一部分的數據,而不是全部的數據。全數據包含了大數據。

“全數據”思維是指首先要確立大致需要什么樣的數據,然后才能夠用相關數據解決一個復雜決策問題的思維方式。因此,“全數據”思維首先強調的是數據對解決一個決策問題的必要性和大致充分性,而不是一味強調數據的多少,或者說是數據維度越多越好,數據規模越大越好。換句話說,“全數據”思維是從需要解決的問題出發,而不是從數據本身出發。從這個意義上說,“全數據”思維也可以說是“充分數據”思維。

因此,“全數據”思維首先要回答的是“解決某一問題需要什么數據”的問題。② 很多時候,要解決一個復雜決策問題,僅僅依靠大數據是不夠的,還需要和其他基礎的人口、經濟、政治等數據集合起來。僅靠大數據可能只能解決一些小的決策問題。事實上,如果不從需要解決的問題出發,研究者可能都不會去收集某些數據,甚至不知道某些數據是存在和可收集的。當然,研究者還需要對運用大數據輔助重要決策保持一定的警惕,因為大數據很容易被假數據和假信息污染。

“全數據”思維其次要回答的是“不同的數據有哪些不同的用處”的問題。比如,我們通常會認為,宏觀和中觀的數據對大格局的把握更加有幫助。而像社交媒體信息、酒店信息和電話號碼等微觀數據,如果準確,則有助于我們對某些特定的個體和群體行為作出更加準確的預判。也就是說,不同數據有不同作用,要恰當地綜合運用以解決不同問題。

總之,面對具體的復雜決策問題,研究者需要不同的數據組合、不同的基礎數據和不同的大數據。因此,“全數據”思維不是事先給定要解決一個具體復雜決策問題的數據范圍,而是需要研究者根據具體的研究問題來探索不同的數據來源組合。面對具體的復雜決策問題,研究者既要以既有的社會科學的理論、實證研究和數據積累為基礎,又要了解新大數據的來源以及處理技術,只有這樣才能充分利用這些不同的資源。

三、 模擬決策: 問題與示例

要想達成“以計算為基礎的科學的復雜決策”這一目標,研究者必須用社會科學的思維特別是社會科學的問題意識來規制計算社會科學。那么,計算社會科學到底能夠幫助我們解決哪些決策者經常面臨的問題? 本文認為,計算社會科學在以下幾類問題的決策上將大有用武之地。一是對國家來說,計算社會科學能夠對其他國家的基本政治走向特別是該國的國內政治穩定等問題做出預測;二是對企業特別是大型跨國企業來說,計算社會科學能夠對投資對象國的基本政治經濟走向作出預測,并就如何確定競爭戰略、如何進行選址等問題的決策提供參考;三是對個人來說,計算社會科學能夠協助個人就旅游、買房等試錯成本相對高的問題做出決策。所有這些決策都不僅僅需要數據的支持,還需要社會科學的思維以及理論和實證積累。以下就國家層面提供兩個具體案例,以說明計算社會科學如何為科學決策提供新的思路。

(一) 選舉預測

預測選舉結果并基于這些預測調整策略,是每一個政黨、候選人以及利益相關國家需要面對的最重要的決策問題之一。傳統的選舉預測主要依賴民意調查或者是在綜合不同民意調查的基礎上進行相關數據處理,而基于社交媒體的大數據,原理上也是民意調查。但是,民意調查(以及社交媒體的大數據)有4個無法解決的偏誤:抽樣偏誤(特別是在需要分層抽樣的情形下),被調查者中的回答者的自我選擇偏誤,回答者的有意誤導回答,個人的支持偏好不一定會變成真正的選票(如投票率問題以及自然災害或恐怖襲擊等突發事件)。①

為此,復旦大學復雜決策分析中心的研究團隊發展了一個完全不依賴于選舉前民意調查,而是基于ABM 計算機模擬的選舉預測平臺。同樣重要的是,該預測平臺也不依賴于社交媒體的大數據。在“劍橋分析”(CambridgeAnalytica) 爆出丑聞之前②,研究團隊就已經對運用大數據特別是社交媒體的大數據來預測選舉結果保持了警惕。因為大數據很容易被假數據和假信息污染,正如特朗普當選和英國“脫歐”兩個事件告訴我們的那樣。換句話說,互聯網上相當多的信息是假消息或者是故意誤導的信息。雖然針對如何處理假消息已經發展出一些識別和稀釋其影響的算法,但數據的真實可靠始終是影響大數據預測準確性的重要因素。

具體而言,基于社會科學家的研究和某些特定數據,研究團隊構建出了一個能夠模擬選舉結果的ABM 模擬平臺?;贏BM 模擬的選舉預測的實現分為六大步驟。

第一,基于公開平臺收集歷史數據。主要包括人口普查數據(人口的年齡分布、性別、教育程度、收入水平、從事行業、宗教信仰等),選舉前一年和選舉年的經濟社會基本情況數據(經濟增長率、通貨膨脹率、犯罪率等),歷史上選舉實際參選人的特質,以及實際選舉結果數據。最終的數據集包括近50個指標?;谡螌W對選舉的既有研究,研究團隊認為這些數據應該基本可以滿足預測選舉結果的需求,因此達到了全數據。

第二,構建行為體,即選民。主要基于人口普查數據,在計算機模擬系統里隨機生成實際人數的選民。隨機生成的每一個選民都擁有一些特定的特征組合(比如男性、41~60歲、高中教育、從事制造業等等),但是整體的選民群體仍舊滿足宏觀統計分布(比如,男性為49.8%,女性為50.2%)。

第三,基于歷史選舉結果數據,通過簡單的回歸分析,獲得不同特征的選民可能的投票傾向(比如,男性顯著傾向于支持某個黨派),并給出粗糙的投票傾向區間。特別需要強調的是,這些粗糙的投票傾向區間并不需要特別準確,因為后續的ABM 模擬運算能夠篩選出能較好地重復出歷史投票結果的模型。

第四,讓這些選民基于他們的投票傾向在系統中投票。投票規則由3組方程描述。每一次模擬都會隨機生成不同的選民群體,但是整體的選民群體仍然滿足宏觀統計分布。

第五,通過模擬多次投票(100次至300次不等),基于歷史的選舉結果數據,篩掉不能得到歷史選舉結果(在一定的誤差范圍內)的模型。其間會經過至少兩輪篩選。第一輪的篩選閾值為10%的絕對誤差,第二輪為5%,第三輪為2.5%~3%。其中會加入選舉周期、政治丑聞沖擊、候選人特征等。最終剩下的模型和歷史選舉結果的誤差在2.5%~3%。通常來說,第一輪的模型在幾千萬到一億多之間(選民的特征組合,而為了計算的可行性,用1∶10的比例來進行實際模擬)。經過兩到三輪篩選,最終剩下的模型數量僅為幾十個到幾百個不等。顯然,這些模型能夠在比較小的誤差范圍內重現歷史上的多次選舉結果,一定是確實捕捉到了促成這些歷史選舉的最終結果的某些投票規則。

第六,用經過了篩選的模型(幾十個到幾百個不等),基于下一輪選舉的推導數據(比如可預測的人口變化數據、經濟增長數據等等),讓選民在系統內進行模擬投票,預測下一輪選舉結果。研究團隊提前公布的預測結果是這些模型給出的結果的平均值。

從2016年起,中心已經連續5次比較精準地預測了中國臺灣地區的地方領導人選舉(2016年、2020年)、中國臺灣地區的縣市選舉(2018年)、美國參議院選舉(2018年)以及2020年的美國總統選舉(6個州)。團隊公布的是相對得票率,而不僅僅是誰輸誰贏。在迄今為止的6次預測中,團隊的預測得票結果和實際的選舉得票結果的差別(誤差)最低為不到1%,最高也僅為6%。① 不僅如此,基于ABM 的選舉預測還能夠提前幾個月就給出這樣的預測。而這樣的預測是基于民意調查或者社交媒體的預測完全不可能實現的。最后,基于ABM 的選舉模擬預測還能夠大致給出某些突發事件對最終選舉結果的沖擊的范圍。

在最新的一次預測中,研究團隊于北京時間2020年11月1日12點(美國東部時間10月31日零點)發布了對美國總統大選在6個州的獲得票數比例的預測。② 最終的選舉結果表明,該預測是成功的。經過多次選舉預測的檢驗,我們有理由相信,基于基礎數據建模和大規模計算模擬的選舉預測的技術不僅是可行的,而且是一個更為有效的技術路徑。除此之外,ABM 模擬結果還能夠幫助我們更加精準地理解選舉行為和選舉政治的隱藏動力學,即反饋增進社會科學研究。

(二) 打擊毒品網絡

對南美毒品網絡和美國毒品販運的計算模擬是學術界最近的一個非常有益的研究。③ 自從美國總統尼克松在1971年宣布“向毒品宣戰”之后,美國一直試圖阻斷或者大幅削弱南美洲原產地和美國市場之間的販運網絡。但是經過幾十年的努力,“向毒品宣戰”的效果卻非常不理想。事實上,盡管美國投入了大量的人力、物力、財力用于打擊毒品走私,但是美國的毒品零售價一直在下降(意味著毒品供應一直在穩定增長),且整個西半球的毒品走私的地理區域從1996年的200多萬平方英里擴展到了2017年的700多萬平方英里。①

為找到“向毒品宣戰”未達理想效果的原因,美國多所高校的研究團隊共同開發了一個基于地理信息系統、整合了復雜社會網絡的ABM 模擬平臺,即“毒販邏輯”(NarcoLogic)模擬平臺,用來模擬毒販在時空中應對阻斷攻擊的決策,并以這些決策與美國的打擊措施之間的互動,探究阻斷無效的根本原因。

該模擬平臺整合了多個理論觀點、實證研究、媒體報道,以及學者們在該地區多年的實地調查研究。參數和驗證過程以現有最完整和權威的可卡因非法流動數據為基礎。該模擬再現了毒販與阻斷力量之間的“貓和老鼠”游戲在時空下的動態變化?;谀M可視化,該模擬平臺還直觀地呈現了毒品販運網絡的結構和功能,刻畫了販毒者和執法機關之間“斗智斗勇”所產生的涌現性結果。

該模擬平臺包含3類行為體:販毒網絡(更具體地說是南美的“毒品卡特爾”)、轉運網絡(或者說是毒品批發和零售行為體,這些行為體本身顯然也是小型的網絡,但是他們可以和不同的“毒品卡特爾”合作)以及攔截者(特別是美國緝毒署)。每一個行為體都有一些特定的特征或屬性,而這些屬性可以用數據加以刻畫。具體來說,販毒網絡有8個屬性,轉運網絡有15個屬性,攔截行為體有4個屬性。這個模擬平臺的環境則有9個不同的屬性。系統中每一個行為體的行為都會視其他行為體的行為及環境因素來進行決策。而這些不同的決策由4個簡潔的方程刻畫。

該平臺模擬了兩個不同的大場景。一個場景是不同的販毒網絡和轉運網絡相互監測、相互滲透,甚至相互通氣。換句話說,整個美洲的販毒網絡和轉運網絡都在一個更大的網絡中決策與行動。另一個大場景則是不同的販毒網絡和轉運網絡各自為戰。通過比較,研究人員發現,基于網絡行為體的模型表現更好。這表明,不僅每一個相對獨立的毒品走私團伙是一個社會網絡,而且整個美洲的毒品販運體系是一個大型網絡。這背后的邏輯不僅體現了販毒集團自上向下尋求平衡風險和收益,同時體現了販毒集團和轉運網絡有全局觀:他們不僅僅是從局部來考慮行動。這個模擬的另一個重要發現是:為躲避打擊,在一定時間內,毒品走私集團的走私地域會變得更加彌散,走私方式更趨靈活和暴力。

基于ABM 模擬,NarcoLogic能夠幫助美國緝毒部門對不同的毒品政策情境及其對販運者行為的可能影響,以及與反毒品戰爭的軍事化有關的許多附帶損害進行更加系統的評估,從而能夠幫助美國的緝毒部門制定更加有效的反毒品措施。不僅如此,該研究還通過模擬發現,不同販毒集團并不是完全獨立的行為體,而是在一個大型網絡中既有競爭又有協同的行為體。因此,美國的緝毒行為也必須從局部和全局這兩個層面出發,才能有效地進行攔截。

四、 基于計算社會科學,建設有中國特色的科學決策支持體系

以上的討論表明,計算社會科學確實有可能給決策科學中的科學決策帶來一些嶄新的解決辦法,從而為傳統上主要依賴專家意見的科學決策帶來巨大的變革。

主要依賴專家解讀和判斷的傳統的決策咨詢是前信息革命時代的產物。由于眾多數據的缺失和缺乏足夠的計算能力,決策咨詢在很多時候只能依賴于專家的判斷。這種傳統的決策咨詢幾乎不可能有效地幫助現代國家和企業應對高度復雜且變化快速的環境。因此,隨著數據收集能力和處理能力的大幅提升,世界主要國家都在投入大量的資源來建設基于數據和計算或者說是基于計算社會科學的決策咨詢體系,以能夠有效應對高度復雜且變化快速的環境。

在基于計算社會科學的戰略咨詢體系這一領域,美國居于領先地位。在計算社會科學到來之前,美國的核心決策支持體系以及一些重要部門就已經進入了計算時代。比如,最開始由美國空軍支持的著名的蘭德公司(RAND Corporation)一直都在開發基于計算的決策支持系統。事實上,世界上第一個人工智能項目“邏輯理論家”(The Logic Theorist)就是由蘭德公司支持研發的。① 類似機構還有隸屬于美國海軍的海軍分析中心(Centerfor Naval Analysis,CNA)。

更為重要的是,自20世紀六七十年代起,美國軍方就通過其隸屬于國防部的國防高級研究計劃署(Defense Advanced Research Projects Agency,DARPA)一直在支持這類研究開發。經過幾十年的積累和探索,2000年之后,美國國防部推出了新一代基于計算社會科學的整合危機早期預警系統(Integrated Crisis Early Warning System,ICEWS)。除了美國的情報系統之外,參與該系統研發的大學包括哈佛大學、賓州州立大學、馬里蘭大學、喬治·梅森大學等。盡管整合危機早期預警系統還有待改進,但它已經在美國應對不同地區和國家可能出現的危機、反恐以及支持阿富汗和伊拉克的軍事行動中都發揮了重要作用。美國軍方還支持了提出計算社會科學的拉澤爾的很多研究。② 顯然,美國軍方對這方面的發展一直都非常關注。③

美國政府支持的另一項研發是美國國務院下屬的重建與穩定聯合辦公室(Office of the Coordinator for Reconstruction and Stabilization,S/CRS)的“國家重建和穩定”(Project of State Reconstruction and Stabilization,PSRS)項目。2011年,該辦公室變成了美國國務院的沖突與穩定行動署(Bureau ofConflict and Stabilization Operations,BCSO)。沖突與穩定行動署支持的“國家重建和穩定”項目主要是針對美國的某些盟國或者美國侵略過的國家有可能出現動亂之后的重建和穩定。參與該項目研發的機構包括斯坦福大學、加州大學圣地亞哥分校、布魯金斯學會等。該項目的研究為美國在伊拉克和阿富汗以及一些非洲國家的重建和穩定行動提供了重要的戰略戰術咨詢。除美國之外,另一些發達國家也都在從事類似的研發工作。

總之,信息收集功能以及信息處理能力是任何一個決策支持體系的基本能力。就中國而言,目前的決策支持體系只具備基本的信息收集能力和相對初級的信息處理能力,總體缺乏嚴格意義上的計算支持,更談不上復雜的計算模擬。因此,我國迫切需要建設一個基于計算社會科學的戰略咨詢體系,即構建一個集社會科學、數據技術、計算機模擬、機器學習及人工智能為一體的技術平臺。與其他的關鍵技術一樣,這樣的技術平臺亦將成為國家核心能力的重要組成部分。該技術平臺最終應具備以下基礎技術能力。

第一,能夠整合數據、算法和算力。只有能夠整合這3個要素的技術平臺才可能是真正有用的技術平臺。當然,針對不同類型的復雜決策問題,平臺肯定會有所不同。第二,能夠整合專家知識和判斷,并能推演他們不同的理解和判斷是否正確?;谟嬎闵鐣茖W的戰略咨詢體系,不是拋棄國別與問題專家的判斷,而是使他們的知識的效用最大化,減少重大決策對專家判斷的依賴程度,甚至幫助專家提升他們的理解和判斷能力,從而可以更好地支持決策。

基于以上兩項基礎性能力,在應用層面,這些技術平臺還需要具備以下3個特征。第一,廣適性。一旦這樣的技術平臺被開發出來,研究者只需擁有某些特定國家的有關數據(包括情報數據),就能對這個國家有可能面臨的高烈度戰略風險進行評估預測,并且推演國家不同應對措施的效果。第二,即時性。平臺最終應該能夠自動抓取最新數據,并據此進行計算(包括模擬),從而能夠讓國家盡早掌握重大跡象和動向,規避風險。第三,一定時空內的精確性和實時性。人類社會的高度復雜性和人類的意識意味著人類不大可能在人類社會中實現分秒不差的預測,但是,我們發展的這些技術平臺最終應能夠實現對某些高烈度風險的行為和事件在一定時空內的預測,并且能夠模擬防范手段,從而為提升國家的應對能力提供一定的知識保障。

要發展這樣的體系,當然離不開國家和社會的投入和支持,具體措施至少應該包括以下六個方面。第一,國家必須從長治久安的戰略高度深刻認識到計算社會科學對戰略決策造成的廣泛和深遠的沖擊。和高性能芯片一樣,“決策計算社會科學”是國家硬實力的關鍵維度之一,國家必須高度重視。第二,逐漸提高國家對決策咨詢的科學化要求,從需求側提升對基于計算社會科學的決策咨詢的需求,逐步提高以計算社會科學為基礎進行推演和判定的咨詢報告的占比。第三,基于高度的戰略重視,加大國家對計算社會科學的研究投入,特別是加大對以預測和推演為目標的研究與開發的支持力度。第四,在相關人才的培養和學術團隊建設上,應更加鼓勵跨學科的學術培養體系和協作平臺,盡快將計算社會科學確立為與學位掛鉤的交叉學科或者專業。第五,計算社會科學的發展離不開大規模數據,更離不開數據及算法的共享。目前大規模數據的持有者主要是企業和政府,國家應該盡快要求企業共享那些不涉及用戶隱私的數據(比如隱去了用戶個人信息的出行數據、消費數據等),并鼓勵不同政府機構和研究機構建立數據、算法和模型的共享資源平臺。第六,鼓勵相關民營企業加大研發投入,加強校企聯合。

中國的計算社會科學還有很長的路要走,但中國是少數擁有足夠人力、物力(特別是科技能力)、財力來大力發展基于計算社會科學的戰略咨詢體系的經濟體之一。當然,要達成這樣的目標,既需要數據技術和計算能力,也需要從既有的社會科學中汲取必要的理論和實證成果。換句話說,我們需要真正地將社會科學與計算機技術和數據技術結合起來。因此,計算社會科學與決策科學的結合并不是要取代專家知識,相反,社會科學家頭腦里的知識對于計算社會科學的進步是不可或缺的基礎。① 社會科學家應該和計算機科學家、數據科學家一起,與政府以及企業攜起手來,為中國的科學決策乃至整個中國的決策科學的進一步科學化而共同努力。

五、 結語

可以想象,在未來的國際競爭中,完全不依賴數據和技術的傳統預判決策模式將會面臨巨大的劣勢。

孫子曰:“故上兵伐謀,其次伐交,其次伐兵,其下攻城?!庇衷唬骸拔糁茟鹫?,先為不可勝。以待敵之可勝。不可勝在己,可勝在敵。故善戰者,能為不可勝,不能使敵必可勝。故曰:勝可知,而不可為?!噬茟鹫?,立于不敗之地,而不失敵之敗也。是故勝兵先勝而后求戰,敗兵先戰而后求勝?!雹僭谙喈旈L的時間里,這樣的境界只能是理想,且基本只能是依靠主帥和軍師的天賦。而在計算社會科學已經蓬勃興起的今天,盡管“主帥”和“軍師”的判斷依舊重要,但許多不確定性已經可以通過計算社會科學來大大降低。

基于此,中國的決策支持體系需要轉變思想,更加堅定地擁抱技術,不能只依賴主要基于專家判斷的傳統的決策咨詢模式。國家需要從戰略技術的角度支持基于計算社會科學的決策科學的發展,而發展基于計算社會科學的決策科學也必將推動中國社會科學自身的進步。

猜你喜歡
社會科學機器決策
機器狗
《云南社會科學》征稿征訂啟事
機器狗
《河北農業大學(社會科學版)》2021年喜報
為可持續決策提供依據
決策為什么失誤了
未來機器城
數學在社會科學中的應用
無敵機器蛛
社會科學總論
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合