?

社會引力定律追根溯源*

2020-04-27 08:19閆小勇
物理學報 2020年8期
關鍵詞:效用引力巴士

閆小勇

1)(北京交通大學,交通系統科學與工程研究院,北京 100044)

2)(電子科技大學,復雜性實驗室,成都 611731)

在交通出行、人口遷移、商品貿易、信息流通、社會交往、科研合作等大量人、物、信息的空間流動現象中,都存在類似萬有引力定律的規律,即兩地之間的某種流動量與兩地活力的乘積成正比、與兩地距離的冪成反比.類比萬有引力定律建立的引力模型也在交通出行分布預測、人口遷移量預測、地區間貿易量預測等諸多方面獲得了廣泛應用.但復雜的社會系統中為何會有這樣簡單的引力定律存在? 這是個非常有趣也有價值的問題.本文對從統計物理學、微觀經濟學和博弈論等不同視角探索社會引力定律根源的研究進行了綜述.

1 引 言

預測地點間人、物、信息的流動是社會學、經濟學、人口學、交通科學、網絡科學等諸多學科長期以來的一個重要研究主題[1,2].一百多年來,研究者們陸續提出了多種預測地點間流動量的模型(在經濟學中被稱為空間交互模型[3]),其中最有影響力的是引力模型[4](gravity model,也譯為“重力模型”).引力模型在許多方面都獲得了廣泛應用.例如在人口學中,引力模型被用來預測地區間的人口遷移量[5];在經濟學中,引力模型被用來預測國家間的商品貿易量[6];在交通科學中,引力模型被用來預測地點間的交通出行量[7];在網絡科學中,引力模型被用來評估網絡節點的相似性[8]、影響力[9,10]等.引力模型之所以受到如此青睞,是由于在許多空間流動現象中都存在類似萬有引力定律[11]的規律,即兩地之間的某種流動量正比于兩地“活力”(多用地點人口數量、經濟發展水平、進出流動量等表示)的乘積,反比于兩地之間空間距離的冪函數.這種規律被稱為社會引力定律[12].

早在1846年,Desart[13]就在比利時鐵路客運數據中發現,兩個車站間的客運量正比于兩個車站所在地的人口數乘積,反比于兩車站間距離的2.25次冪.這可能是關于發現社會引力定律的最早記載[14],其發現時間比Carey[15]在人口遷移現象中發現社會引力定律的時間(1858年)還要早12年.后來,Ravenstein[16]從19世紀70—80年代英國人口普查數據中也發現兩地人口遷移量與兩地人口乘積成正比、與兩地距離成反比的現象.而Reilly[17]在1929年的著作中研究零售市場問題時也發現,零售中心從其周圍某個城鎮吸引到的顧客數量與該零售中心的規模成正比,與兩地間的距離平方成反比.此后的幾十年中,研究者在交通[18]、人口[19]、經濟[20]等領域又陸續發現了許多服從社會引力定律的現象.

近年來,隨著現代電子與信息技術的不斷發展,有越來越多的手段(如IC卡、GPS、手機、社交網站等)可長期記錄人、物、信息在空間中的流動數據[21,22].通過對這些大數據進行統計分析,統計物理與復雜系統領域的學者在很多復雜系統中都發現了符合社會引力定律的現象.例如,Viboud等[23]通過分析美國人口普查數據,發現兩郡之間的通勤出行量與郡人口、郡間距離的關系符合社會引力定律;Jung等[24]通過分析韓國高速公路收費數據,發現兩城市間的高速公路交通量與城市人口、城市間距離的關系符合社會引力定律;Krings等[25]分析了比利時250萬名匿名手機用戶在571個城鎮之間的手機通訊數據,發現城鎮間通訊量與城鎮人口、城鎮間距離的關系符合社會引力定律;Balcan等[26]通過分析國際航空運輸協會的航空客運數據,發現全球29個國家主要機場之間的航空運輸量與機場服務區域人口、機場間距離的關系符合社會引力定律;Kaluza等[27]分析了全球船舶港口自動識別系統數據,發現全球951個港口間的海運量與港口進出量、港口間距離的關系符合社會引力定律;Pan等[28]通過分析美國科學信息研究所 2003—2010年的論文數據,發現全球18199個城市之間的科研合作強度與城市整體科研水平、城市間距離的關系符合社會引力定律;Goh等[29,30]分析了韓國首爾市地鐵網絡和常規公交網絡中的刷卡數據,發現車站間客流與車站上下車客流、車站間距離的關系符合社會引力定律;Levy和Goldenberg[31]分析了Facebook等四類社交網絡數據,發現兩人交往概率與兩人距離之間的關系符合社會引力定律.諸如此類的研究還有很多.可以預見,社會引力定律還會在更多的復雜系統中被發現.

從以上研究回顧中可以看出,交通出行、人口遷移、商品貿易、信息流通、社會交往、科研合作等大量空間交互現象都符合社會引力定律.但在諸多復雜的社會系統中為何會有如此簡單的社會引力定律存在? 這是一個困擾人類上百年的問題,也吸引了很多不同領域的學者對其追根溯源[32,33].從20世紀60年代起,統計物理領域的學者用最大熵原理[34]、經濟學領域的學者用效用理論[35,36]相繼對社會引力定律進行了解釋.最近,復雜系統領域的研究人員又從博弈論角度探索了社會引力定律的根源[37].本文將對這些從不同視角探索社會引力定律根源的研究進行綜述.

2 社會引力定律的統計物理解釋

2.1 最大熵原理導出引力模型

Wilson[34]以交通系統中地點間的出行分布問題為背景,用統計物理學中的最大熵原理[38]對社會引力定律給出了最早的理論解釋.在交通系統的出行需求預測工作中,常采用的模型框架是“四階段法”,即依次進行出行生成預測、出行分布預測、交通方式劃分和交通分配[7].其中,在出行生成預測階段可得到地點i的出行發生量 Oi和出行吸引量Di.而在出行分布預測階段,則要求預測出的地點間出行分布量 Tij既滿足發生量約束又滿足吸引量約束Wilson用最大熵原理導出了滿足以上兩類約束的引力模型: 在交通系統總出行量為T的情況下,系統的宏觀狀態是任意兩個地點i,j之間的出行量為 Tij,則系統的微觀狀態數為

Wilson為地點間出行量 Tij又增加了一個出行成本約束

其中 cij為從地點i到j的出行成本,C為系統可支配的總成本.那么,系統最可能出現的出行分布就是以下最大熵模型的解:

用拉格朗日乘子法可求得該模型的解為

2.2 成本與距離的對數關系

經典引力模型中的距離函數是冪律函數[4].但(4)式中用最大熵原理導出的引力模型,其成本函數是負指數函數e-γcij,這與經典引力模型中使用的距離冪函數不同.簡單地看,直接將γcij=βlndij這種成本與距離之間的對數關系代入(4)式,即可得到經典的雙約束引力模型但為什么成本與距離之間具有這種對數關系,之前并未得到很好的解答[39].

Yan等[40]為社會引力定律中距離的冪函數形式提供了一種解釋.他們認為,交通系統中的出行成本c主要由出行時間t和貨幣費用m兩部分組成,可以表示為二者的加權和形式 c ≈ ηt+μm[41].其中,貨幣費用通常與出行距離d具有近似線性關系 m ≈νd[41].他們通過分析出行日志數據[42]中出行時間與距離的關系,發現出行時間與距離也具有近似對數關系 t ≈φlnd+ψ[43].這種對數關系源于人們在不同出行距離所采用交通方式的速度差異[44],例如人們在進行幾百米的出行時往往是步行或騎自行車,而幾十千米時就要使用公交、小汽車等交通方式,當幾百千米時就要乘坐更快速的火車或飛機了,這使得出行時間和距離之間呈現非線性關系.綜上,可得到出行成本與距離之間的關系為c=ηφlnd+ηψ+μνd.進而結合最大熵原理,還可導出群體出行距離的截尾冪律分布P(d)~d-βe-d/κ.這一研究不僅能解釋社會引力定律中距離函數的冪律形式,還解釋了一大批出行距離分布的實證統計結果[45-50].

3 社會引力定律的微觀經濟學解釋

Wilson用最大熵原理為社會引力定律提供了一個非常合理的宏觀解釋.但是,最大熵原理僅能給出系統最可能的宏觀分布狀態,并不考慮系統中個體選擇出行目的地的微觀決策過程.從出行目的地選擇決策行為的角度來看,社會引力定律的微觀底層機制仍未得到滿意解答[32,33].而經濟學家則很早就開始用效用理論來研究個體選擇出行目的地的微觀決策行為[35,36].早期的研究使用確定效用理論來解釋社會引力定律[35],而影響更為廣泛的研究則是基于隨機效用理論的離散選擇模型[36].離散選擇模型是微觀經濟學中非常重要的描述個體選擇行為的方法,在交通系統出行選擇問題上已獲得了非常廣泛的應用[51,52].本節將介紹用離散選擇模型對個體出行目的地選擇行為進行建模以及導出引力模型的方法.

3.1 目的地離散選擇模型

離散選擇模型被用來描述、解釋和預測決策者對多個離散的選項進行選擇的行為.一次離散選擇行為通常包含以下要素[51].

1)決策者,即做出選擇行為的主體.在出行目的地選擇行為中,決策者就是指位于某起點選擇目的地的一個出行者.

2)選項,即供決策者選擇的多項事物.在出行目的地選擇行為中,選項是指供出行者選擇的目的地.

3)選項屬性.決策者選擇選項時會考慮諸如價格、質量等因素,每一種因素稱為一個屬性.在出行目的地選擇行為中,選項屬性一般包括各地點的活力、到各地點的距離或出行成本等.

4)決策準則,即決策者在做出選擇時的行為準則.最常用的是效用最大化準則[53],即決策者在所有選項中選擇效用最高的選項.此處的效用是指決策者選擇某個選項所能獲得的滿意程度.在出行目的地選擇問題中,可用下式來表達這一準則:

其中 Uij是位于地點i的出行者所選擇的目的地j的效用,Uik則是其他任一目的地的效用,K是所有目的地的集合.

(5)式的效用值 Uik本質上是指目的地k所具有的真實效用.根據效用最大化準則,決策者會選擇所有選項中真實效用最大的一個選項.但實際選擇問題中,決策者有可能并不是總選擇一個固定的選項,而是以不同的概率選擇不同的選項.這可能是決策者受到一些內部或外部因素的影響,對選項效用的認知發生了變化.但研究者并不能直接觀測真實效用變化,只能觀測選項的確定效用值[54].在離散選擇模型中,這種概率選擇的情況是用隨機效用理論來處理的.此時目的地k的真實效用表示為

其中 Vik是研究者直接觀測到的選項k的確定效用,εik是 描述 Vik與 真實效用 Uik偏差程度的隨機項.

3.2 離散選擇模型導出引力模型

根據(5)式和(6)式可知,在出行目的地選擇問題中,所處i地點的決策者選擇目的地j能獲得的效用是 Uij=Vij+εij,則目的地j被i點決策者選擇的概率是

其中K是所有備選目的地集合(不包括起點i).

如果(7)式中所有隨機項 ε 都服從相互獨立同分布的標準Gumbel分布 F(ε)=e-e-ε,那么決策者選擇目的地j的概率就是

這就是Logit模型[54],是微觀經濟學中應用非常廣泛的離散選擇模型.

由Logit模型可以很容易地導出引力模型: 假設目的地j對i點出行者的確定效用主要受目的地活力 Aj和地點 i到 j的距離 dij影響,即

如果所有出行者之間的選擇決策行為無差異,那么從點i到j的出行量 Tij就是從i出發的總出行量Oi乘以出行者們選擇j點的概率,即

這就是經典的單約束引力模型[7].

3.3 收益與活力的對數關系

從(9)式中可以看出,目的地的效用 Vij實際上是目的地活力為出行者帶來的收益 l nAj與出行者到目的地的成本 β lndij的差值.2.2節已對出行成本與距離的對數關系進行了解釋,本節將解釋為何使用地點活力的對數來表達地點會帶給出行者收益.

根據心理物理學中著名的Weber-Fechner定律[55],人的直觀感覺差異 dp 正比于某種物理刺激強度W的相對變化量 d W/W,即 d p=κdW/W,其中 κ 是個常數.據此可導出人的直觀感覺程度p與物理刺激強度之間的對數關系 p=κln(W/W0),其中 W0可以解釋為刺激閾值.Weber-Fechner定律在行為經濟學中被廣泛應用于收益函數[55],即認為選項帶給決策者的收益是決策者對選項屬性的實際度量指標(如商品的價格、反映地點活力的人口數等)的直觀感覺.在本文即將介紹的目的地選擇博弈研究工作中,Weber-Fechner定律導出的收益活力對數關系也會被再次使用.

4 社會引力定律的博弈論解釋

基于隨機效用理論的離散選擇模型從個體選擇決策角度為社會引力定律提供了新的解釋,但這類模型并未考慮實際出行目的地選擇過程中個體之間的相互作用.在包括交通系統在內的社會經濟復雜系統中,個體間的相互作用是一個非常普遍的現象,而博弈論則是社會學、經濟學以至軍事、政治等社會科學學科研究個體相互作用的一個重要科學工具[56].最近,Yan和Zhou[37]從博弈論的角度解釋了社會引力定律的可能根源.他們將出行者選擇目的地的過程刻畫為一種擁擠博弈[57,58],體現了出行者個體之間的相互作用.本節將介紹這種目的地選擇博弈模型的基本框架及其導出引力模型的方法.

4.1 目的地選擇博弈模型

出行目的地選擇問題可以看作是多個參與者進行的博弈.每個參與者在面對多個可供選擇的目的地時,總會選擇帶給自己收益(或稱效用)最大的目的地.位于地點i的個體選擇目的地j獲得的收益 Uij由兩部分組成.

1)出行成本 Cij+g(Tij),即負收益,與i到j的固定出行成本 Cij直接相關,并且隨兩地間出行量 Tij的 增加而增加.其中 g(Tij)是一個增函數,體現了路途上的擁擠效應.

2)目的地帶給選擇者的收益 h(Aj)-f(Dj),取決于目的地的活力 Aj和選擇該目的地的人數是一個增函數,體現了目的地的擁擠效應,即目的地的收益會隨著選擇人數的增加而下降.這種擁擠效應具有現實依據: 例如在城市出行中,對于非通勤出行(例如購物、娛樂等)來說,選擇某一目的地的人數增加后可能導致環境不舒適或可獲取資源的減少,從而降低選擇者的收益.

綜上,i地點的出行者選擇目的地j的收益可表示為

這種模型被命名為目的地選擇博弈(destination choice game,DCG)模型[37].在DCG模型中,當個體信息完備并總是選擇使自己收益最大化的目的地時,相同起點出行的所有個體都具有相等的收益,沒有人能通過單方面改變選擇而增加自己的收益.

實際應用中,需要先把(11)式中的各項成本和收益函數具體化.根據出行成本與距離之間的對數關系(見2.2節),可令 Cij∝lndij.根據Weber-Fechner定律[55](見3.3節),則可將目的地活力收益函數 h(Aj)、 目的地擁擠成本函數 f(Dj)和路途擁擠函數 g(Tij)均表示為對數函數.此時(11)式可寫為

其中 α,β和γ 是三個非負參數.通過使用多種真實人類移動數據進行的模型測試結果[37]顯示,DCG模型相對于傳統的引力模型[4]、介入機會模型[59]和新型輻射模型[60]、人口權重機會模型[61,62],具有更高的預測精度.

4.2 擁擠博弈模型導出引力模型

若忽略DCG模型收益函數中的目的地擁擠成本,則可得到一個簡化的目的地選擇博弈(degenerated destination choice game,DDCG)模型,其收益函數如下:

這是一個典型的擁擠博弈模型[57,58].擁擠博弈可表示為一個四元組:(N,R,(Ψk)k∈N,(wj)j∈R)[58,63],其中 N={1,2,···,n} 是所有 參 與 博弈的個體(在DDCG中就是某個出發地點i上數量為 Oi的所有出行者),R={1,2,···,m} 是備選資源集合(在DDCG中就是備選目的地),(Ψk)? 2R是參與者k的策略空間,wj是備選資源j的收益函數(在DDCG中就是目的地j對i起點出行者的收益函數 Uij).所有參與者的策略集合 S=S1,···,Sn就是擁擠博弈的一個狀態,其中參與者k的策略Sk∈Ψk.資源j的擁擠程度 nj(S)(在DDCG中就是目的地j的路途擁擠程度)則表示在狀態S下選擇該資源的參與者數量(在DDCG中就是從起點i到目的地j的出行量 Tij).據此可知,DDCG中每個出行者獲取的收益不僅取決于其所選擇的目的地的活力與距離,還受選擇同樣目的地的其他出行者數量的影響,即個體之間的相互作用.根據擁擠博弈理論中的勢函數[58,63]定義,可知DDCG的勢函數為

最大化此勢函數的策略集合,就是擁擠博弈的納什均衡解[57,63].

為求解DDCG的納什均衡解,可將 Tij視為一個連續變量,并令勢函數最大化,即可得到一個最優化模型

用拉格朗日乘子法可求得該模型的解為

是一個雙參數的單約束引力模型.若令參數 α=1,則可轉換為標準的單約束引力模型,見(10)式.

4.3 DDCG模型與Logit模型的對比

DDCG模型與3.2節中介紹的離散選擇Logit模型都體現了個體選擇目的地的微觀決策行為,且都假設個體總是追求效用最大.二者導出的引力模型在形式上也沒有本質區別,見(10)式和(16)式.但二者的底層機制并不相同: Logit模型假設個體對效用的認知具有隨機性,但并未考慮復雜系統中廣泛存在的個體相互作用[56];而DDCG模型則考慮了群體中個體間的相互作用.

著名的紅藍巴士問題[64]可以用來說明這兩個模型的機制差異.在紅藍巴士問題中,出行者可選擇的交通方式有小汽車與藍巴士兩種.簡單起見,假設這兩種交通方式的確定效用是相等的,根據Logit模型可知二者的被選概率為 Pcar=Pblue=1/2 .現在把一半藍巴士的顏色改為紅色,并把紅藍巴士看成是兩種交通方式,那么兩者的確定效用也必然相等.按照Logit模型的結果,此時出行者選擇這三種交通方式的概率為 Pcar=Pblue=Pred=1/3 .然而,從常識推斷,將半數巴士涂紅僅會影響原先選擇藍巴士的人,而小汽車的被選概率仍為Pcar=1/2,紅、藍巴士則各為 Pred=Pblue=1/4 .但Logit模型卻高估了巴士被選擇的概率,低估了小汽車被選擇的概率,形成了典型的悖論[64].

在考慮了個體相互作用的DDCG模型中則不存在這種悖論: 假設總共有b輛巴士,每輛巴士的固定收益值為 Abus,擁擠成本(體現了個體之間相互作用的結果)為 l n(ax),其中x代表乘坐這輛巴士的人數.那么當把所有巴士看成同一交通方式時,其收益值為 Ubus=Abus-ln(ax/b);而把紅藍巴士看作兩種交通方式時,二者的收益值則均為Ured=Ublue=Abus-ln(2ax/b).根據 DDCG模型的均衡條件,如果在m個人中選擇巴士和小汽車的比例各為1/2,說明Ucar(m/2)=Ubus(m/2)=Abus-ln[am/(2b)].那么把紅藍巴士看作兩種方式時,一定有 Ucar(m/2)=Ured(m/4)=Ublue(m/4),即選擇紅藍巴士的比例各為1/4,與實際相符.

當然,實際中的出行者對目的地效用(即收益)的感知可能會有一定的隨機性.此時可對DDCG模型進行進一步的擴展: 假設出行者對目的地收益的理解與可觀測的目的地固定收益之間存在服從獨立同Gumbel分布的隨機性偏差,根據Fisk[65]的證明,此時的均衡解等價于如下最優化模型的解

其解為

式中的參數 θ 體現了隨機性程度對目的地選擇結果的影響: 當 θ →∞ 時該模型退化為DDCG模型,均衡結果與(16)式一致;當 θ=0 時,個體將完全隨機地選擇目的地,各目的地被選擇的概率相等.這一結果說明,DDCG模型可以擴展到個體對目的地收益感知有隨機性的情形.但是,基于隨機效用理論的離散選擇模型卻無法退化到目的地收益固定的情形: 如果離散選擇模型不假設個體對收益感知具有隨機性,那么所有個體都會選擇固定收益最高的同一目的地.這是因為離散選擇模型并未考慮實際社會系統中普遍存在的個體相互作用,即群體擁擠問題.

5 結 論

社會引力定律是諸多社會復雜系統中廣泛存在的普適規律,受到社會學、經濟學、地理學、交通科學、統計物理與復雜系統等學科學者持久的關注[1,4,6,7,32,33,39].本文綜述了解釋社會引力定律存在根源的三類主要理論,既包括傳統的最大熵原理和效用理論,也包括最近提出的目的地選擇擁擠博弈.其中,最大熵原理為社會引力定律建立了一個統計物理的理論基礎,但其僅能給出系統最可能的宏觀分布狀態,卻無法反映系統中個體的微觀決策行為.從個體決策行為角度建立的隨機效用離散選擇模型為社會引力定律提供了微觀經濟學解釋,但其并未考慮在實際社會系統中普遍存在的個體相互作用.而目的地選擇博弈則為社會引力定律建立了一個更簡潔的理論框架: 它不需像最大熵模型一樣事先指定出行總成本作為額外的約束條件,也不需像隨機效用理論一樣作出個體對效用感知具有隨機性的假設,除“個體追求收益最大化”這條經濟學公理之外,目的地選擇博弈的核心假設就只有“群體擁擠影響收益”這一體現個體相互作用的基本事實.與現有對社會引力定律的其他理論解釋相比,從博弈論角度給出的解釋更符合“奧卡姆剃刀”原理[66],有助于我們理解很多復雜社會系統中由個體相互作用而涌現出的群體空間交互模式.

本文介紹的這些對社會引力定律的理論解釋都是以交通出行問題為背景的,離散選擇模型和目的地選擇博弈模型分析的核心都是出行者如何選擇目的地.但這種個體選擇交互對象的行為并不僅僅存在于交通系統中,在空間交互模式符合社會引力定律的系統中幾乎都存在.例如,人口遷移是選地點做居住地,社會交往是選人做交流對象,科研合作則是選研究者做合作伙伴等.在這些系統中,個體多會傾向于選擇活力相對高、距離相對近的對象.但往往選擇同一對象的人越多,該對象能帶來的收益就會越低: 在交通系統中擁擠會導致出行成本上升,在商品貿易中競爭對手增加會導致商品價格下降,在科研合作中選擇某人的合作者增多會導致雙方的合作強度降低,等等.而這些不同系統中的空間交互對象選擇行為,都能被本文所介紹的目的地選擇博弈等模型來刻畫.總之,對社會引力定律追根溯源,不僅有助于深入理解交通出行、人口遷移、商品貿易、信息流通、社會交往、科研合作等空間交互現象的底層機制,對于更好地預測、引導甚至控制各種復雜社會系統中人、物、信息的流動,都具有廣闊的應用前景.

感謝合作者周濤、汪秉宏、韓筱璞對本文中相關研究成果所做出的貢獻.

猜你喜歡
效用引力巴士
永不堵車的巴士
植物巴士
希望巴士
呼和浩特市中心城區低效用地潛力分析
中醫特色護理技術在老年高血壓患者中的應用效用觀察
延安新引力
寒夜巴士上,兩本并排的書
高等院校對我國殘疾人冰雪運動發展的效用研究
感受引力
A dew drop
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合