?

基于空間廣義有序Probit 模型的高速公路事故嚴重程度分析

2023-03-15 07:10胡郁蔥韋湖曾強
關鍵詞:傷亡事故廣義交通事故

胡郁蔥 韋湖 曾強

(華南理工大學 土木與交通學院,廣東 廣州 510640)

隨著我國社會經濟的高速發展,機動車保有量和公路通車里程持續增長,交通安全問題日益突出。作為道路交通運輸網絡的主骨架,高速公路具有行車速度快、貨車等大型車比例高等特點,且為相對封閉的系統,一旦發生事故,容易導致嚴重的人員傷亡和巨大的財產損失。據統計[1],我國高速公路交通事故的致死率約為35%,遠高于其他類型道路。如何降低高速公路事故的嚴重程度,是交通管理部門和安全研究人員面臨的重要課題。為此,有必要深入探究高速公路事故嚴重程度的影響因素及其效應,為制定經濟、有效的安全改善對策奠定基礎。

近年來,國內外學者運用統計回歸模型和機器學習方法對高速公路事故嚴重程度進行了大量研究[2-12]。例如,Yu等[2]采用二項隨機參數Logit模型和支持向量機分析了實時交通參數(平均速度、速度標準差)和天氣指標(溫度、能見度、降水量)對美國科羅拉多州I-70 高速公路事故傷亡程度的影響?;诿绹鴳讯砻髦軮-80 高速公路10 年間的交通事故數據,Haq等[3]采用貝葉斯層級二項Logit模型對各類型卡車事故(卡車單車事故、卡車與小汽車碰撞事故、卡車與SUV或皮卡車碰撞事故、卡車與卡車碰撞事故)的傷亡程度影響因素進行了計量分析研究,并通過貝葉斯二項Logit 模型分析了因爆胎導致的交通事故嚴重程度的影響因素[4]。這些研究均將事故嚴重程度劃分為兩個等級,例如無傷亡和傷亡事故、嚴重和非嚴重事故。當劃分的嚴重等級超過兩個時,則通常采用多項Logit/Probit、有序Logit/Probit及其改進模型對事故嚴重程度進行統計回歸分析[5]。王磊等[6]分別采用多項Logit和有序Logit 模型分析了國內3 條高速公路上發生的227 起交通事故的嚴重程度。鑒于事故數據中未被觀測的異質性,陳昭明等[7]采用混合Logit 模型(又稱多項隨機參數Logit 模型)分析了黑龍江省3 條高速公路的事故嚴重性,Hou等[8]則采用混合Logit模型對黑龍江省3條高速公路上發生的單車事故嚴重程度進行了回歸分析?;趶V東省開陽高速公路2014 年的交通事故嚴重性分析,Zeng等[9]構建了貝葉斯空間廣義有序Logit模型,在表征事故嚴重等級間的有序關系的同時,避免了傳統有序Logit模型對觀測因素影響效應的限制,并解析了相鄰路段上事故嚴重等級間的空間關聯;Zhang等[10]則在多項Logit模型的基礎上考慮事故間的空間關聯,建立了貝葉斯空間多項Logit模型。在機器學習方面,Huang等[11]利用滬昆高速公路湖南段的交通事故數據,采用分類回歸樹識別了事故嚴重程度的重要影響因素及其交互作用;呂璞等[12]則采用深度卷積神經網絡對廣西境內的某山區高速公路嚴重程度進行了預測。

上述研究雖然分析了人、車、路、環境和路政救援等因素對高速公路事故嚴重程度的影響,但由于事故等級劃分、分析方法和人文地理環境等方面的差異,研究結論并不完全統一。相對于兩類嚴重等級劃分,多類(不少于3類)嚴重等級劃分通常能夠更全面地反映真實的事故傷亡程度,同時也能更深入地揭示各類因素的影響。在分析方法上,統計回歸模型相對機器學習方法的應用更為普遍。這主要是因為統計回歸模型不僅能夠對事故嚴重等級進行預測,而且能夠清楚地解析其受到觀測因素的影響效應及各類數據特征。異質性和空間關聯是事故嚴重程度統計建模時考慮的兩個重要問題[13],其中異質性體現了未被觀測但與被觀測因素相關的因素對事故嚴重程度的影響,空間關聯則體現了未被觀測的因素對空間相鄰事故嚴重程度的共同影響??臻g關聯是異質性的重要來源之一。有研究表明[14],解析事故數據中的空間關聯將顯著降低甚至消除其異質性效應。盡管文獻[9-10]中構建的貝葉斯空間模型展現了良好的擬合預測性能,但其考慮的是路段層面的空間關聯,僅反映了未被觀測的道路因素對相鄰路段上發生事故的嚴重程度的共同影響。由于劃分的路段長度不一,路段空間關聯并不能完全準確地揭示事故間的空間關聯程度,且未考慮單個事故的空間影響范圍。

為此,文中采集了廣深沿江高速公路東莞段2014—2019年的交通事故數據,將事故嚴重程度劃分為3 類(無傷亡事故、輕傷事故和重傷亡事故),考慮事故間的空間相關性和單個事故的空間影響范圍,建立基于不同距離閾值的貝葉斯空間廣義有序Probit模型,分析涉事車輛、天氣狀況、道路條件、發生地點和時間、事故類型等因素對事故嚴重程度的影響?;谌舾蓚€空間關聯距離閾值,構建事故空間關聯矩陣,并根據模型的擬合性能確定事故間的空間影響范圍。最后,根據模型參數估計結果識別事故嚴重程度的顯著影響因素,計算顯著因素的邊際效應,量化其對不同嚴重等級事故發生概率的影響,以期為制定降低高速公路事故嚴重程度的改善方案及其經濟性評價提供技術支持。

1 數據準備

廣深沿江高速東莞段全長46.257 km,共設橋梁42.853 km,橋梁長度占路線總長的92.64%,設計速度為100 km/h,路段采用全封閉、全立交、控制出入的雙向八車道高速公路標準。

課題組收集了廣深沿江高速東莞段2014—2019年的事故數據,剔除含遺漏或異常數據的事故數據后,剩余的1 490 條事故數據用于研究。這些交通事故數據包含1 273 起無傷亡事故(占85%)、188 起輕傷事故(占13%)、14 起重傷事故(占1%)和15 起死亡事故(占1%)。由于重傷事故和死亡事故的比例過低,因此將這兩類事故合并為重傷亡事故,據此將高速公路交通事故嚴重程度分為3 類:無傷亡事故、輕傷事故和重傷亡事故。這些事故按照其地點樁號排序后的嚴重程度分布如圖1所示。

圖1 事故嚴重程度的空間分布Fig.1 Spatial distribution of crash severity

為了衡量相鄰事故間嚴重程度的相似程度,構造評價指標——平均嚴重程度絕對偏差MA,計算公式如下:

式中,yi為地點樁號從小到大排列的第i起事故的傷亡嚴重程度。經計算,這些事故的平均嚴重程度絕對偏差僅為0.29,接近于0,說明相鄰事故間的嚴重程度相似度很高。

除了事故嚴重等級信息外,事故數據中還包含事故類型、涉事車輛信息、事故發生時間、天氣情況、事故發生地點。參考以往相關研究[9-10],從道路、車輛、環境3個維度選取10個因素構建事故嚴重程度預測的解釋變量集。表1給出了各變量的具體含義及描述性統計量。對于包含3 類或3 類以上的分類變量,若其中一類被選為參考項,則其他類別轉化為0-1變量[15]。

2 模型建立與評價

鑒于事故嚴重程度間的有序關系以及相鄰事故間的空間相關性,建立事故嚴重程度分析的空間廣義有序Probit模型,并將其與傳統多項Logit模型和廣義有序Probit 模型進行對比。這些模型的基本結構、貝葉斯估計方法、評價指標和邊際效應估計方法分別如下。

2.1 模型結構

2.1.1 多項Logit模型

多項Logit 模型基于效用理論擬合自變量與包含多個類別的分類變量間的內在關系。對于任一交通事故i,其嚴重程度的效用函數為

式中:Xi為事故i對應的影響因素觀測值組成的向量;βk為這些因素對應事故嚴重程度k的回歸系數組成的向量(包括常數項);嚴重程度k的取值1、2、3 分別表示無傷亡、輕傷和重傷亡事故;εi,k為隨機項,并假定相互獨立,且服從Gumbel分布(Ⅰ類廣義極值分布)。

事故i嚴重程度為k的概率為

2.1.2 廣義有序Probit模型

上述事故數據中劃分的無傷亡、輕傷和重傷亡事故嚴重等級存在明顯的有序關系,使得相鄰事故嚴重等級間存在一定的相關性。廣義有序Probit 模型是解析事故嚴重程度間有序關系的重要方法之一。對于任一交通事故i,構造潛變量zi,以表征事故的潛在傷亡傾向:

式中,β為影響因素集Xi對應的回歸系數向量(包括常數項),隨機項εi假定服從標準正態分布。

事故i的嚴重等級yi與其潛在傷亡傾向zi的映射關系為

式中,μi,0和μi,1為定義各事故等級邊界的閾值,且滿足如下關系:

Zi為μi,1的影響因素集,α為對應的回歸系數向量(包括常數項)。不失一般性[16],令μi,0=0。

事故i嚴重程度為k(k= 1,2,3)的累積發生概率為

由此可以計算,事故i嚴重程度為k(k=1,2,3)的概率分別為

2.1.3 空間廣義有序Probit模型

發生地點相鄰的交通事故可能受到某些未被觀測到的因素的共同影響,從而形成事故嚴重程度間的空間相關性。參考以往研究[9-10],在潛在傷亡傾向zi的鏈接函數中加入具有條件自回歸先驗的隨機項?i以解釋事故間的空間關聯,從而構建空間廣義有序Probit模型,即

式中:wi,j為事故i和事故j的空間鄰接權重,令事故的空間關聯距離閾值為ds,若事故j與事故i的距離di,j≤ds,則wi,j= 1,否則wi,j= 0;σ?為空間關聯項的方差參數。

對應地,事故i嚴重程度為k(k=1,2,3)的概率的計算公式分別如下:

2.2 貝葉斯參數估計

由于空間廣義有序Probit 模型結構復雜,因此采用貝葉斯方法對上述模型進行參數估計。WinBUGS 是進行貝葉斯估計的主流軟件之一,它根據參數的先驗分布和整理的數據集,采用吉布斯抽樣算法和馬爾科夫鏈蒙特卡洛(Markov Chain Monte Carlo,MCMC)仿真,推斷出參數的后驗分布[17]。

由于缺少有效的先驗信息,因此將均值為0、方差很大的正態分布N(0,104)作為模型中所有的回歸系數(β和α中的元素)的先驗分布,將γ分布γ(0.01,0.01)作為空間精度(方差的倒數)參數1/σ?的先驗分布。條件自回歸正態分布由WinBUGS 中的Car.normal函數來表示。設定一條鏈進行150 000次MCMC 仿真迭代,并舍棄前100 000 次迭代,根據WinBUGS 中的Gelman-Rubin 統計量,判斷MCMC仿真的收斂情況。

2.3 模型評價指標

采用偏差信息準則(Deviance Information Crite?rion,DIC,記為CDI)和各事故嚴重等級及全體數據的分類準確度(Classification Accuracy,CA,記為AC)比較各個模型的優劣。DIC綜合考慮了模型擬合度和復雜度[18],其值越小代表模型的整體性能越好;當兩個模型的DIC差值超過10時,可判定模型間具有顯著的差異。DIC可以在WinBUGS軟件中直接獲取,其計算公式為

式中:為后驗平均偏差,反映了模型的擬合程度;npD為有效參數的數量,體現了模型的復雜程度。

各事故嚴重等級的分類準確度衡量了模型對各嚴重等級的事故實現準確估計的比例,計算公式如下:

式中,為事故i的模型估計嚴重等級,yi為事故i的實際嚴重等級。

全體數據的分類準確度則衡量了模型對所有事故數據實現準確估計的比例,計算公式如下:

2.4 邊際效應

雖然可以通過各因素對潛在嚴重傾向和閾值的系數估計量判別該因素是否對事故嚴重程度具有顯著影響,但是并不能直接通過相應系數確定顯著因素對各事故嚴重程度發生概率的影響。為此,需根據參數估計結果,進一步計算顯著因素的邊際效應。

以空間廣義有序Probit 模型為例,連續變量x對嚴重等級k(k=1,2,3)的邊際效應計算公式分別如下:

式中,βx和αx分別為變量x在潛變量zi和閾值μi,1擬合中的系數。

0-1 變量x對嚴重等級k(k=1,2,3)的邊際效應計算公式如下:

3 結果分析

3.1 模型最優空間關聯距離閾值的確定

為了探索事故間的空間影響范圍,令其關聯距離閾值分別為200、250 和300 m。根據前述貝葉斯方法獲得的廣義有序Probit 模型及各空間廣義有序Probit 模型的評價指標結果及空間方差參數的估計量如表2所示。

由表2可知,基于各關聯距離閾值的空間廣義有序Probit模型的Dˉ值均明顯小于多項Logit模型和廣義有序Probit 模型,說明解釋事故間的空間關聯能夠顯著提高事故嚴重性分析模型的擬合性能[9-10]。盡管npD值表明空間廣義有序Probit 模型更加復雜,但其更小的CDI值(與多項Logit模型和廣義有序Pro?bit 模型的差值均超過了130)反映了空間模型更佳的綜合性能。分類準確性結果進一步證實了空間廣義有序Probit 模型的優越性。具體而言,除了在無傷亡事故等級上達到了100%的分類準確度外,空間廣義有序Probit 模型在其他事故嚴重等級和全體事故上也都具有更高的分類準確度。尤其是針對重傷亡事故,多項Logit模型和廣義有序Probit模型的分類準確度均為零,而空間廣義有序Probit 模型最高達到了55.17%。重傷亡事故因造成了嚴重的人員傷亡,一直是社會大眾和交通安全部門關注的重點,準確地估計和預測該類事故的發生概率對高速公路交通安全狀況的改善具有重要的實踐價值。此外,3 個空間模型中的空間方差參數估計量均明顯大于0,充分說明了事故間高強度的空間關聯性,進一步體現了空間廣義有序Probit模型的合理性。

表2 模型結果對比Table 2 Comparison of model results

對比各空間廣義有序Probit 模型可以發現:基于250 m 關聯距離閾值的空間廣義Probit 模型的CDI值最?。ㄅc其他空間模型的差值均超過了200),且分類準確度(尤其是對輕傷和重傷亡事故)最高,這些指標均體現了該模型的優異性能。而且,該模型中的空間方差參數估計量最大,說明以250 m 作為關聯距離閾值能夠最大程度地挖掘相鄰事故間的空間相關性,用以解釋未被觀測到的因素對相鄰事故嚴重程度的共同影響。綜合以上結果,可以認為250 m是最佳的事故空間關聯距離閾值。

3.2 事故嚴重程度影響因素分析

由3.1 節可知,基于250 m 關聯距離閾值的空間廣義有序Probit 模型綜合性能最佳,因此根據該模型的參數估計結果識別對事故嚴重程度具有顯著影響的因素(如表3所示),并以此估計其邊際效應(如表4所示),量化顯著因素對各事故嚴重程度發生概率的影響。

由表3 可知,單車事故、本省車、客車、貨車、周末和曲率6個變量對潛在傷亡傾向具有顯著影響,其他類型車輛和夏天這2個變量對輕傷與重傷亡間的閾值具有顯著影響,而橋梁則對兩者有顯著影響。表3 中的9 個變量都是高速公路交通事故嚴重程度的顯著影響因素。

表3 基于250 m關聯距離閾值的空間廣義Probit模型的參數估計結果1)Table 3 Results of parameter estimation in the spatial generalized ordered Probit model with 250 m correlation distance threshold

由表4可知,單車事故比多車事故的嚴重程度低。具體而言,相對于多車事故,單車事故造成無傷亡的概率高7.58%,造成人員輕傷的概率低5.94%,造成人員重傷或死亡的概率低1.64%。這可能是因為多車事故涉及的人員和車輛更多,在事故發生時,駕駛員為了降低本車人員傷亡而采取的避險措施有可能對其他車輛的駕駛員和乘客造成更大的傷害;而單車事故涉及的人員和車輛較少,在事故發生時,駕駛員能夠相對從容地采取有效措施來降低人員傷亡程度[9]。

表4 顯著影響因素的邊際效用Table 4 Marginal effects of significant influential factors

相對于涉及外省車的交通事故,僅涉及本省車的交通事故導致無傷亡的概率高4.56%,導致人員輕傷的概率低3.54%,導致重傷或死亡的概率低1.02%。這可能是因為本省車駕駛員對道路交通環境更加熟悉,能夠更快地感知道路上的行車危險源,并及時做出反應,從而降低了事故傷亡程度[19]。

在車輛類型方面,相對于小汽車間的交通事故,涉及客車、貨車和其他類型車輛(例如,拖掛車、油罐車等)的交通事故都更容易導致人員傷亡,重傷亡的概率分別提高3.27%、1.53%和4.11%。根據文獻[9,20]的研究結論,客車、貨車和其他類型車輛相比于小汽車的體積和質量都更大,在事故發生時,會對其他車輛和人員造成更嚴重的傷害。

相對于工作日,周末發生的交通事故造成無傷亡的概率高4.18%,造成人員輕傷的概率低3.31%,造成人員重傷或死亡的概率低0.87%。Christoforou 等[21]也有類似的研究發現。對于本研究,這可能是因為周末往返廣州、深圳及沿線的東莞等城市進行休閑娛樂、探親訪友的人員及車輛眾多,車流量比工作日更大,車速相對較低,使得事故發生時的車輛間(或車輛與固定物體間)碰撞較輕,傷亡程度較低。

相比于春季,夏季發生的交通事故導致重傷或死亡的概率高2.38%。廣深沿江高速公路位于北回歸線以南并靠近南海,夏季頻降暴雨且多伴隨強風甚至臺風,這些惡劣天氣會顯著惡化高速公路的安全行車環境。

道路平面曲率每增加1 km-1,無傷亡事故的概率增加6.99%,輕傷事故和重傷亡事故的概率分別降低5.45%和1.54%。道路曲率越大,曲線半徑就越小,車輛通過該路段時的速度相對也就越低;而且,曲線段的設置將緩解因道路線形的單調性導致的駕駛疲勞,從而減少因駕駛員反應不及時導致的重大傷亡事故。

相比于非橋梁路段,橋梁上發生的交通事故導致人員輕傷的概率增加8.85%,重傷亡的概率降低0.08%。橋梁占廣深沿江高速公路東莞段90%以上的路段長度,它能夠有效減少高低起伏的地形地勢條件對道路線形的不利影響,保持線路的整體平順性,在保障高速公路交通運輸效率的同時,提高其安全性水平,從而顯著降低重傷亡事故發生的概率。

4 結語

基于事故間的空間關聯,文中建立了貝葉斯空間廣義有序Probit模型,分析了車輛類型與歸屬地、天氣狀況、發生時間和季節、道路曲率與坡度、事故類型等因素對高速公路事故嚴重程度的影響。DIC 和分類準確度等指標結果表明,空間廣義有序Probit 模型優于多項Logit 模型和廣義有序Probit 模型,且250 m 為最佳的空間關聯距離閾值。研究發現:涉及客車、貨車和其他類型車輛以及夏天發生的交通事故的嚴重程度相對較高;本省車、周末和曲率高的路段上發生的交通事故的嚴重程度相對較低,單車事故比多車事故的嚴重程度低。

本研究的不足之處在于:分析的高速公路范圍較窄,采集的交通事故數據相對有限,且未能獲取肇事駕駛人的相關屬性;模型分析結果的可移植性仍有待檢驗。后續研究中,將對此進行改進,進一步提高模型的準確性。

猜你喜歡
傷亡事故廣義交通事故
Rn中的廣義逆Bonnesen型不等式
不同尋常的交通事故
清管收球作業傷亡事故模型及安全等級模糊綜合評價
預防交通事故
從廣義心腎不交論治慢性心力衰竭
王夫之《說文廣義》考訂《說文》析論
廣義RAMS解讀與啟迪
一起高速交通事故院前急救工作實踐與探討
淺談危險化學品的管理
工程施工活動中人身傷亡事故案例解析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合