?

5G移動大數據在新冠流調中的創新應用

2022-06-08 07:09王建斌蘇效東劉東升
移動通信 2022年5期
關鍵詞:定位用戶信息

王建斌,蘇效東,劉東升

(1.浙江大學,浙江 杭州 310027;2.中國電信股份有限公司浙江分公司,浙江 杭州 310014;3.華信咨詢設計研究院有限公司,浙江 杭州 310052)

0 引言

目前新冠病毒仍在世界各地傳播,全世界感染患者已經過億,且不斷出現新的變異,疫情防控不能松懈。流調作為疫情防控工作中的一項基本、重要的工作,能夠讓密切接觸者盡快得到排查,讓患者盡快得到救治,是防止疫情擴散的重要保障。

“流調”的全稱是流行病學調查,和我們平??床〔煌?,它是研究人群的疾病和健康狀況,制定新冠肺炎的預防措施和防治策略。了解新冠肺炎的病因和危險因素:如樣本采集、通過現場調查、面對面與患者交流,詢問患者發病前后的暴露情況、接觸情況、活動軌跡、就醫情況,尋找與傳染源和傳播途徑有關可能性,進而描繪清晰的傳播鏈,為判定密切接觸者、采取隔離措施、劃定消毒范圍提供依據等。

但在實際流調過程中存在種種困難。被調查者由于記憶原因,無法描述行程細節,排查密接人員復雜,甚至部分被調查人員出于種種原因,隱瞞行程、病情,不僅不利于自身的治療,對疫情防控工作還會造成不利影響。

由于新冠肺炎病毒強大的傳染性及長潛伏期,采用大數據和最新的信息技術對新冠肺炎的傳播軌跡、擴散速度、接觸人群等重要信息進行建模和數據分析,對政策制定、防范措施設計和應對措施及建議具有重要意義。

如今運營商的5G 網絡已經基本完成主體框架的搭建。由于5G 網絡的頻率特性和速率、時延等方面的更高要求,其蜂窩半徑較4G 網絡更為密集,在定位精度上有明顯的優勢。借助5G 移動網絡大數據,通過追溯患者移動軌跡、建立個體關系圖譜等方式可以更為精確客觀地鎖定時間、地點及周邊密集接觸人群,是常規疫情流調方式的有力補充。

1 5G移動大數據用于“流調”的可行性分析

1.1 5G移動大數據介紹

運營商的無線側數據有MR(Measurement Report,測量報告)數據、CDR(Call Detail Record,呼叫詳細記錄)數據和信令數據。

運營商的無線網絡中有MR 測量報告,主要來自終端和基站的物理層、RLC(Radio Link Control,無線鏈路控制層)層以及在無線資源管理過程中計算產生的測量報告,包含基站小區ID、AOA(Angle of Arrival,天線到達角)、Tadv(Timing Advance,時間提前量,可用于折算用戶到基站的距離)和接收到的相鄰小區信息以及網絡信號質量信息等。

CDR 用于記錄一個呼叫或者上網業務的關鍵歷史信息,包括該呼叫的終端特征信息、呼叫建立特征信息、QoS(Quality of Service,服務質量)相關信息、呼叫過程行為信息、呼叫釋放相關信息等。在用戶RRC(Radio Resource Control,無線資源控制)建立及切換入新的基站時,系統各自生成一張呼叫詳細記錄。一條CDR 記錄應記錄用戶一次完整的RRC 連接過程,包括從RRC 連接請求到RRC 連接釋放的所有對應的呼叫基本信息、呼叫建立、釋放、切換、承載、UE(User Equipment,用戶設備)能力、RLF(Radio Link Failure,無線鏈路連接失?。┑认嚓P信息。

核心網提供對應時間IMSI(International Mobile Subscriber Identity,國際移動用戶識別碼)/MSISDN(Mobile Subscriber Integrated Services Digital Network Number,手機號碼)與AMFUENGAPID(Access and Mobility Management Function User Equipment Next Generation Access Point Identifier,AMF給用戶分配的接入點標識)的關聯關系表,從而將MR、CDR 中的用戶IMSI/MSISDN 關聯出來,便于篩選單用戶連續話單和信令。

其他信令流程數據:終端在空閑態的情況下,有跨LAC/TAC(Location Area Code/Tracking Area Code,位置區/ 跟蹤區域碼)和周期性位置更新等信令流程,信令消息包括終端登記的時間、小區信息等。

1.2 移動大數據應用于流調的可行性分析

(1)移動大數據的多維度關聯分析

地理化定位是基于移動通信網絡測量的無線信號來確定UE 地理位置信息以及呼叫行為屬性信息(室內或室外呼叫、移動速度)的技術。移動大數據包含時間、地點、內容等多個維度,如周期性網絡測量報告MRO(Measurement Report Originality,周期性測量報告)的上報,期間還會有A2、A3、A4、B1、B2 等切換事件 的MRE(Measurement Report Event,周期性測量報告)。這些報告里面包含了可關聯用戶IMSI 信息的AMFUENGAPID 以及可以用于定位的相關字段信息。

除以上MR、CDR 數據,運營商在各核心網絡接口部署的DPI(Deep Packet Inspection,基于數據包的深度報文檢測技術)解析的xDR(x Detail Record,用戶面和信令面詳單)數據,記錄了用戶終端使用各類APP 與網絡交互的KQI 信息,可用于新冠流調的信息包括接入的無線網元和OTT(Over-The-Top Application,OTT 應用)定位數據。

因此用戶在網絡側留下的數字痕跡將包括持續的時間、大概位置等記錄,從而使活動軌跡追溯成為可能。相比通過視頻監控、人臉識別技術等多部門聯合關聯的方式追溯活動軌跡,移動大數據在這方面具備明顯的優勢。

移動大數據可從用戶維度、時間維度、地理區域維度等多個維度來關聯分析用戶在網情況、室內外情況、移動靜止情況、停留時長等,這在新冠流調時用于追溯追蹤感染者或者密切接觸者移動軌跡、建立個體關系圖譜中有重要的意義。

(2)MR 定位算法

MR 定位技術如圖1 所示,運營商將MR 數據用于網絡評估和優化、規劃與建設方面,目前已經有大范圍的成熟應用。近幾年隨著數據中臺的建立,通過挖掘XDR 大數據中的MR 數據(含最小化路測數據)和OTT 數據,結合經緯度和MR 特征測量項建立指紋庫,顯著提升了MR 定位精度,密集城區定位精度可達20 m。加之利用MR 電平特征、鄰區關系、切換關系、小區屬性、用戶移動特征以及地圖地物特征建立的室內外特征庫,實現了多維度判定用戶MR 室內外屬性與建筑物歸屬。利用國內多種特征生長算法核心專利,通過大數據挖掘的機器學習特征訓練和狀態區分算法,已經在3D 覆蓋評估與規劃優化方面有了成熟的應用。

圖1 MR定位技術

目前,業界基于MR 應用的定位方法大致可以分為四類:

1)GPS/AGPS(MDT)定位:利用終端自帶的GPS/AGPS 模塊,經過測量、計算后上報位置信息,該方式精度較高,R10 以上版本的終端可以上報MDT 的測量報告。MDT 是3GPP 提出的一種通過網絡配置對普通用戶/商用終端進行測量數據采集、上報的自動化路測技術,只要用戶終端開啟GPS 并支持MDT 功能,終端就能向基站自動上報包含用戶位置信息的MDT 數據。MDT 和MR 類似,包含RSRP(Reference Signal Received Power,參考信號接收功率)、RSRQ(Reference Signal Received Quality,參考信號接收質量)等字段,并含有GPS 經緯度信息,可用于大數據分析。由于終端在室內接收不到衛星信號或者用戶關閉GPS 定位開關導致該定位方法無法使用,因此不適合大范圍采用純MDT 方法做定位,這些數據可用于校準特征庫/指紋庫,輔助提示精度。

2)特征匹配定位:業界也叫DCM(Database Correlation Method)或指紋(Fingerprint)技術,通過構建網絡覆蓋范圍內每個地理點上各小區電平或者信噪比的信息特征庫,比較手機上報信息與已有數據庫信息的異同,根據匹配程度確定手機相應的位置柵格點來進行定位。該定位方式的特征庫越準,定位精度較高,且適合于各種制式、大部分場景,實用性強。特征庫的特征信息可以通過仿真得到,也可以進一步融合路測數據、AGPS 數據、Wi-Fi 等來構建或校正。

3)基于測距的幾何定位:通過測量終端到基站的距離,再根據一定的算法,計算出它的位置坐標。位置數據可以在網絡側進行計算,UE 只提供測量數據(即UEassisted,UE 輔助);也可以在UE 側進行計算(即UEbased,基于UE)。根據計算方式可以細分為三類:

◆根據路徑損耗模型定位:根據信號強度計算路徑損耗(已知導頻功率以及UE 測量導頻接收功率,兩者之差便是路徑損耗),當UE 測量到多個小區時,根據傳播模型求解UE 到多個小區的距離,并基于三邊或多邊幾何求解定位。受建筑物阻擋、反射、衍射等傳播環境的復雜性影響,用路徑損耗折算距離的誤差較大,因此這種方法的定位結果精度不高。

◆根據傳播時延定位:由于無線信號以恒定的速率傳播,可以根據傳播延遲的時長來計算距離,然后通過終端鄰區信息的多個小區反饋的時延或者相對時延信息計算的距離作為半徑畫圓,以多個圓相交或多雙曲線相交求解的幾何計算方式來確定用戶的位置。該定位方法需要由多個不同位置的基站小區信號來進行幾何位置相交確定,對于終端接收信號比較單一的情況,還需要借助用戶行為模擬等方法擬合短時間內多條MR 信息,因此通常只作為輔助定位手段。

◆基于角度AOA 的定位:該方法不需要基站間同步,但需要基站裝有可測量入射角的智能天線,通過計算UE信號到達基站天線的角度信息,再通過三角測量法計算出UE 的位置。

4)基于CELLID 的拓撲質心幾何定位(WCCL,Weighted Centroid Correction Location):基于MR 中的CELLID 的站址得到一個多邊形拓撲,通過計算該多邊形的質心位置得到UE 呼叫的大體位置。該方法通過融入CELLID 的方位角、信號強度作為加權因子,演進為一種基于加權的拓撲質心定位,能進一步提升定位精度。其中,MR 測量上報的小區結合小區室內外屬性,基于室分站的理論覆蓋范圍相對宏站更小的特點,通過增加室分站的權重,結合室分站的工參經緯度,收縮定位誤差。

5)OTT 定位:該方法是依托互聯網應用向海量用戶提供的定位服務,基于APP 軟件提取有效的用戶位置信息,并利用用戶標識關聯到用戶此時此刻的MR 數據中。由于APP 上報的經緯度存在坐標系不同和干擾數據等問題,通常需要先進行坐標系轉換糾偏和數據清洗后才能得到有效的OTT 經緯度。由于一般APP 應用都會使用GPS/AGPS、Wi-Fi 和基站等進行定位,大部分最終得到的OTT 經緯度精度都比較高。另外,由于用戶可能會在應用側關閉位置訪問共享、關閉終端GPS 等,且隨著國家對各APP 獲取用戶終端關鍵信息權限的嚴格審查,OTT 獲取的數據有限,不適合純采用OTT 做定位,因此建議用于輔助關聯MR 來建立特征指紋庫。

綜上所述,在進行MR 位置定位時,根據數據源輸入滿足的條件分別按AGPS(MDT)定位、室分小區定位、RTT(RTT 時延,Round-Trip Time)定位、特征匹配定位、WCCL 定位的順序自動降級進行混合定位,并分別計算對應的置信度,選擇較高置信度的定位結果。其中,AGPS 和RTT 外部依賴較多,只能作為輔助定位手段。

構建室內外呼叫環境的特征模型,結合網絡無線環境特征、用戶行為特征和用戶地理位置識別室內外呼叫,并估算呼叫過程中的用戶移動速度?;谝陨戏治鼋Y果,結合電子地圖的地理信息對定位結果進一步校正,可以將終端在室內上報的MR 匹配到附近的建筑物上,將識別為室外上報的MR 匹配到附近的道路上。利用快速定位技術,移動網絡在城區MR 定位精度可達80~120 m。而實際基于密集城區的5G 網絡,由于站間距更小,精度可達50 m。再利用以上根據數據源滿足條件的混合定位技術,可大幅提升定位準確性。相比LTE 小區,覆蓋范圍廣且無任何波束指向性,NR SSB 波束帶有方向性且波束覆蓋范圍窄,基于波束級的用戶到達角估計和高精度TA測量結果,可以更精準地計算UE 位置。典型場景下各種定位算法定位精度如表1 所示:

表1 典型場景下各種定位算法定位精度

(3)3D 覆蓋可視化評估應用

通過MR 數據解析,采用3D MR 地理化呈現網絡情況,能快速了解用戶分布和所處位置網絡狀況、用戶流量狀況,有針對性地進行優化調整、規劃站址和市場營銷,節省了大量的時間以及人力、物力。同時3D MR 地理化呈現方法能夠展現高樓小區的用戶分布、流量使用等信息,為前端業務發展提供了用戶模型。

通過3D MR 呈現的樓宇覆蓋、流量和用戶分布情況對樓宇進行優先級排序,點對點制定最優的網絡規劃、網絡設計,識別高優先級樓宇進行優先規劃,達到精準規劃、價值設計的目的。

3D 網絡覆蓋評估模型如圖2 所示:

圖2 3D網絡覆蓋評估模型

3D 覆蓋評估效果如圖3 所示:

圖3 3D覆蓋評估效果

通過3D MR 評估后對現場進行測試驗證,準確度達到85%,較為準確地反映網絡情況。

2 5G移動大數據流調建模

通過關聯基站的經緯度、MR/CDR 中的AOA,、Tadv、鄰區等關鍵信息,結合地理化算法,可以實現單用戶活動軌跡的追溯。通過時間維度和地理位置維度的匯聚關聯,可以繪制出密切接觸關系圖譜等關鍵信息。

建模流程架構如圖4 所示:

圖4 移動大數據建模流程圖

建模步驟:

(1)第一步:數據采集。包括基站工程參數、地圖、MR/CHR、配置文件、信令、核心網xDR、應用側SDK 等。

(2)第二步:數據關聯和預處理。通過核心網提供的對應時間IMSI/MSISDN 與AMFUENGAPID 的關聯關系表,將MR、CDR 中的用戶IMSI/MSISDN 關聯出來。提取簡化用于流調的字段,從而減小數據量的存儲。

(3)第三步:地理化經緯度回填。對于包含MDT的MR 數據,經緯度已經有精準值。對于非MDT 的MR數據,則利用三點定位、MDT 數據特征庫指紋庫以及其他輔助定位技術將每條MR 上報的位置經緯度計算回填。

(4)第四步:MR 和XDR 關聯數據交換。DPI 平臺探針側的XDR 數據,部分已關聯了終端SDK 應用側OTT 業務的位置信息,可以用于關聯此期間沒有MDT 位置數據的MR,回填MR 上報的經緯度位置。對于沒有OTT 位置數據的XDR,則通過關聯用戶當前時刻的MR 位置結果定位。當原始MR 和XDR 都沒有經緯度則通過MR 定位計算算法回填,有利于進一步提升定位的準確性和完整性。

(5)第五步:軌跡回溯。通過以上步驟,每一條MR/CDR/XDR 都已經回填了位置信息。因此,通過運營商4A 管理授權模塊,將不同時間段的授權位置數據進行縱向串聯,能夠有效繪制出手機持有者的移動軌跡,在哪些區域停留了多久等情況,并地理化顯示在GIS(地理信息系統,Geographic Information System)地圖上。

(4) 因反傾層面約束、突發滑坡后水壓力的迅速消散自動止滑,斜坡不致迅速滑移、翻轉發生破壞,而是沿有利于其活動的砂泥巖接觸面向南蠕滑(間歇式滑動)變形(圖17),此時,后緣裂隙的性質轉變為張剪(參見圖5、6)?;顒拥氖噶糠较驗檫\動合成后的方向——S205°W,如圖16(b)。

(6)第六步:密切接觸者圖譜。將同一時間點不同個體的位置數據與感染者出現過的位置進行橫向整合,過濾出多個時間和位置都與感染者軌跡吻合的人群,繪制出一級密切接觸者圖譜,并據此監測人群動向,便于關聯密切接觸者的下一級密接關系。

(7)第七步:區域疫情發展態勢評估。通過拉取感染者以及密切接觸者圖譜人群的活動軌跡,對比顯示活動區域的人口遷徙流入流出情況,從而評估當前區域的疫情防控態勢,適時升級防控等級。

3 實際應用及效益評估

3.1 活動軌跡回放

利用上述流調模型,在取得合法授權的情況下,采集部分用戶無線大數據進行仿真應用,設定查詢的指定時間,即可回溯用戶的相關活動軌跡。地圖上單擊事件點,能顯示用戶當前位置的上報時間、網絡質量等信息。

在傳播鏈排查時,疊加病患的活動軌跡,對照MR中的時間和位置,將疑似密切接觸者圈選出來,必要時可以進行定向發送疫情防控短信,提醒主動自檢或者前往疾控中心檢測,防止在不知情的情況下發生再次傳播。

圖5 為基于用戶CDR 與MR 定位結果示意圖:

圖5 基于用戶CDR與MR定位結果示意圖

3.2 重點場所用戶行為分析

在關鍵重點場所如醫院、機場、火車站、汽車站等設置獨立位置區,進出指定場所的用戶將在網絡側自動進行登記。在合法合規的情況下,網絡側將此類用戶的相關無線信令數據進行額外安全加密保存,留存時間至少14 天。

由于移動網絡信令數據是海量的,需要對于重點場所用戶的數據進行單獨存放,一方面利于對疑似病患進行快速軌跡回放,無需從全網海量數據中去查找;另一方面,對進出特定位置區的用戶根據不同時間段廣播疫情防控短消息,提醒疫情防控措施,提升流動人口的防范意識。

3.3 隱私保護

由于移動大數據記錄了大量的用戶信息,如用戶屬性、行蹤軌跡、上網瀏覽偏好、頻率等內容,運營商在進行數據挖掘和分析的過程中,面臨著數據保密、用戶隱私等一系列問題,需要有相應的安全管控框架,從網絡、設備、應用三個層面規范與保護數據安全。

在現行的運營商大數據平臺應用中,已經對用戶隱私信息進行了數據加密脫敏處理,針對數據匯集和使用中的個人隱私保護問題,建立了完善的數據開放訪問機制。建立、健全帳號口令管理、安全配置管理等安全管理制度,定期進行安全檢查和風險評估,對發現的安全漏洞及時進行加固。建立終端接入的審批流程,部署終端接入管理系統(如4A 堡壘機等),確保維護人員所有操作可審計、可追溯等。

在用戶信息隱私方面,目前各運營商都嚴格遵守《中華人民共和國網絡安全法》關于“電信和互聯網用戶個人信息保護規定”。但是大多靠企業自身管理,針對相關網管進行區分帳號區分數據權限,落實到部門和個人來進行管理。對于查詢用戶級日志的事務,需要通過申請,審批通過之后才能進行相關查詢。

值得注意的是,在國家倡導的用戶攜號轉網政策推出之后,中國移動、中國聯通和中國電信已經合作啟動了一項計劃,三大運營商將在區塊鏈上共享客戶的KYC 數據。通過分配加密Token 或者唯一哈希給對應客戶,可以實現KYC數據在三大運營商之間共享,將來可以通過基于區塊鏈的身份識別系統來進行用戶隱私相關方面的保護。

基于區塊鏈的KYC 解決方案及客戶信息共享和保護是屬于電子信息安全審批技術領域和區塊鏈數字身份信息安全領域,用于解決目前區塊鏈應用場景中用戶數字身份認證和保護,及不同商業場景的數據共享過程中用戶隱私安全的技術問題,主要使用了區塊鏈中的非對稱加密技術、分布式賬本及信息加密狀態審批等技術方案。

因此,對于疫情防控流調,在保證當事人的隱私權和知情權情況下,可通過監管部門統一的基于區塊鏈的身份識別系統來進行涉及特定用戶信息的訪問。

4 結束語

國內在此次疫情防控工作中展現出了更高的醫療救治水平、更快的防疫反應速度、更透明的信息披露機制、更迅速的數據報送體系,同時將大數據等新一代創新科技廣泛應用于疫情追蹤溯源、路徑傳播、發展模型預測、資源調配等領域。

在疫情防控常態化的大背景下,除了航空、鐵路、公路、輪渡等交通部門統計的出行數據外,電信運營商在用戶授權的前提下基于手機信令上報信息能夠有效定位用戶的手機位置,結合互聯網企業通過APP 授權調用用戶手機位置數據(OTT 數據)作為輔助定位特征指紋庫,可以精準定位疫情傳播路徑,從而為疫情防控所需的移動軌跡追蹤、關系圖譜建立等提供更為高效的手段。

現今移動互聯網應用滲透到了社會生活的方方面面,產生的數據是海量的。面對突如其來的緊急公共危機事件,在有完備的法律授權條件下,利用移動大數據可以快速查清確診或疑似病例的活動軌跡、社會關系、傳播鏈條等。同時個人數字信息隱私需要做到更全面,更安全的保護,需要在個人隱私信息收集、處理、存儲、使用和披露的各個環節,引入隱私AI,結合區塊鏈技術逐步的重構現有的流調云計算與大數據模式。在嚴格的數據隱私保護條件下,利用“最小必要”原則規范流調過程,設置流調公布內容,在獲得顯著社會效益的同時最大程度地保護公民的個人數字基本權益。

猜你喜歡
定位用戶信息
《導航定位與授時》征稿簡則
Smartrail4.0定位和控制
找準定位 砥礪前行
訂閱信息
關注用戶
關注用戶
關注用戶
青年擇業要有準確定位
如何獲取一億海外用戶
展會信息
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合