?

從基礎信息載體建設談大數據產業發展
——基于第七次人口普查的大數據發展研究

2020-03-01 05:01陳宗智
經濟師 2020年12期
關鍵詞:人口普查結構化老齡化

●陳宗智 孔 環

實事求是、改革創新、科學設計、精心組織、周密部署、依法實施,以確保第七次全國人口普查數據真實準確,更加全面客觀地反映我國人口發展狀況。這項工作涉及面廣、工作量大、時間緊、任務重,其具體實施離不開統計技術和統計手段的部署,更離不開大數據的應用。若基礎數據載體建設完善、更新及時、輸出便捷,不僅使人口普查這項工作節省人力、物力、財力,更有利于地方政府管理機能、政策決策,也有利于大數據產業的發展。

一、基礎數據和數據載體的現狀

目前,部分數據信息的取得較為廉價,大多數人和機構也都沒有意識數據信息是一項有價值的資產。即便是覺得某些數據信息有一定價值,也因為沒有這些信息數據的存儲載體而流失或不被重視。大數據在大數據企業已經是一項不折不扣的資產,那么,資產的“外購”或“自制”均應會支付或者耗費一定的貨幣或者經濟利益。

例如:幾十元、上百元人民幣就能夠從非正規渠道取得數以萬計的姓名、性別、地址、電話等信息,甚至是企業名稱、開戶銀行、工商登記等信息。與其對應的是個人和一些組織無意識或者無奈地對外泄露這些信息,例如:各式各樣的注冊、驗證、登錄時信息填報;戶口本、身份證、營業執照復印件滿天飛。

二、從大量數字到數據信息的積累

數字不是數據,數據也不是大量數字,大量數據也尚不能界定為大數據。例如:2010 年我國老齡化人口占比12%,約1.5 億老齡化人口,到2030 年我國老齡化人口程度將超出日本成為全球最高。這句話告訴我們一條完整的我國老齡化人口信息。12%的比例是一個社區、一個城市、一個省份到整個國家一個一個數字統計而來,1.5 億的龐大數字如果不能放在整句話中,也就沒有意義,僅僅是一個數值。即使是上面一整句話也只能是一條信息。那么,如果我們把構成1.5 億數字的每一條信息積累下來,輸入不同行政級別和不同大小的數據處理載體,便是很好的大數據“原材料”。然而,我們在普查這些數據信息過程中,特別是前幾次人口普查我們的基層組織并沒有系統地留存。第一,我們沒有留存的意識;第二,我們沒有留存的“倉庫”;第三,即便是留存了,也因為散亂而沒有價值。

三、從數據信息到結構化數據的整理

數據信息本身是散亂的、扁平化的、非結構性的,例如:我們在人口普查時,從派出所戶籍中心導出的區域內戶口信息,本身數字龐大,又包含了姓名、性別、年齡、身份證號碼、住址等輔助信息,可以稱之為數據,甚至在某種程度上可以稱之為大數據。但是這些數據信息如果用于人口年齡層次;流動情況,亦或就業率計算;是否需要放開二胎、三胎;理解居民收入等,其利用價值仍然有限。其原因是戶籍資料是非結構性的數據信息。要么不包括調查的內容;要么沒有進行結構化數據處理。如果將非結構化數據依據不同的統計目標,鏈接相關聯的數據信息,從多維度進行整合分析處理,使其達到結構化。再借助互聯網嫁接到人工智能終端,便是我們傳統意義上的大數據。

四、信息載體建設與大數據產業發展

若實現基礎數據共享,所有的基礎數據信息要有各自的載體,也就是數據儲存設備,哪怕僅僅是一份調查報告,使基礎數據信息成果化。然后就具備了將成果化的數據信息推向商業化通道的條件,進而初步形成大數據產業鏈。

就第七次人口普查來說,我們需要普查的信息如果能夠將不同級政府、部門、機構、組織已經掌握的基礎信息“拿來主義”,完全能夠滿足普查需要,可能就不需要全國范圍“入戶”這一項繁重、復雜、的工作,僅需要部分住戶核查即可。

每一位個人、每一個單位都將其掌握的基礎數據信息進行載體存儲,載體形式可以是一份調查報告、一張EXSLE 表格、一套數據集成,亦或數據處理系統。然后依托當地的大數據企業或者大數據產業局室,讓這些載體內的成果“產品化”。輔助以大數據資產評估、定價、監管,在交易平臺上以規范的交易流程進行大數據資產商品化流通。那么,整個社會就對數據化信息從意識形態上發生改變;盡管基礎數據信息的取得不再廉價,但是取得的數據更加規范、更有可利用價值,勢必推動整個大數據產業的發展。

猜你喜歡
人口普查結構化老齡化
健康老齡化十年,聚焦骨質疏松癥
人口普查學問多
促進知識結構化的主題式復習初探
結構化面試方法在研究生復試中的應用
人口普查由誰首創
基于圖模型的通用半結構化數據檢索
健康老齡化與養醫結合
應對老齡化 中法共同課題
基于軟信息的結構化轉換
歷次人口普查中低年齡組人口漏報研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合