?

訊庫:互聯網時代要“知己知彼”

2015-06-01 15:37鮑燁童
中關村 2015年4期
關鍵詞:資訊結構化輿情

鮑燁童

依靠非結構化大數據做支撐,通過自主研發的語義分析技術,訊庫在數據挖掘和分析的全面性、可靠性和實時性上已經先于同行邁出一大步。

隨著大數據和移動互聯網興起,社會進入了“原子”傳播時代。在這個時代里,過去由媒體壟斷的傳播資源,今天被數以億計的個體所分享;不同的傳播媒介在不斷融合與分化的狀態中推動了輿情的發展。由此衍生的情形是,政府和企業的形象在互聯網上以碎片化方式不斷地呈現出來。

有媒體報道,近年來輿情監測和危機公關在企業管理成本中所占比重越來越大。尤其是商業力量引發的負面輿情,使效益好、知名度高的企業不斷陷入輿情風波,付出了短期和長期的代價。

不久前轟轟烈烈的“阿里巴巴假貨門”事件,就體現了企業身處輿論風暴的無奈。

由此來看,如何幫助企業建立輿論對沖機制,與風險共舞,成為輿情管理要解決的命題。

隨著大數據技術的發展,將輿情事件中的人、環境、社會關系等多個因素聯系起來進行多維度的考察,對于提升輿情研究和服務的決策參考具有重要價值。利用大數據進行分析和解讀,成為管理輿情和維護聲譽的必要手段。

“北京麥克斯泰科技有限公司(以下簡稱“麥克斯泰”)存在的意義在于,讓政府、企業及其他機構可以快速了解自媒體、社會化媒體上的人民意愿。比如,對于民眾在微博上發布的關于某工廠排污的資訊,環境保護部門就可以快速了解,進行處置?!?/p>

麥克斯泰是中關村海淀園的一家公司,創始人初曉光是北京“海聚工程”入選者。這家公司擁有全中國數據量最龐大、更新速度最實時的資訊監測預警平臺——訊庫。無論在反貪反腐還是廣納民智層面,訊庫都是幫助政府高效執政的工具。

“正是輿情產業的發展,在自媒體、社會化媒體興起之后,推動政府變得更加主動、開放和透明?!背鯐怨鈴娬{。

創新才能生存

面對輿情產品的同質化傾向,輿情監測機構一直在謀求品牌競爭的差異化、細分化,更加注重對輿情研判方法和技術的投入力度,在早期單一的輿情報告產品的基礎上,開發出輿情監測平臺、咨詢和培訓服務、主題活動和展覽等多種業務模式。

有人指出,輿情產業方興未艾,擁有巨大的發展潛力,可能成為廣告模式衰微之后,媒體向信息服務業轉型的重要方向。而在移動互聯網、大數據技術迅猛發展背景下,產業洗牌將不可避免,只有創新才能生存。

在輿情監測領域,訊庫因為三個優勢位列第一梯隊。

首先,“訊庫”實時監測著全球數千個中文報紙、期刊、門戶網站、論壇、博客,每天更新數百萬條資訊,并擁有自1998年以來的數十億條資訊數據庫?!爸恍鑾追昼?,我們就可以把客戶所需求的信息進行選取分析之后精準地推送到達?!背鯐怨庹f。

其次, 訊庫互聯網資訊傳播評測體系,為用戶的市場和公關活動提供全程的量化評測,讓用戶可以隨時掌控各項活動的情況和效果。

第三,訊庫在云計算、自然語言處理、人工智能等領域擁有多項自主知識產權。通過持續的技術研發和合作,訊庫陸續推出了新的產品和服務。

從技術上來看,訊庫采用了SaaS軟件運營模式,它將應用軟件統一部署在公司的服務器上。用初曉光的話說,“訊庫3.0實時搜索云Saas服務系統,一切盡在云端,無需下載軟件,無需更新系統,只要一臺可以上網的電腦就可實現云辦公?!?/p>

瞄準非結構化大數據

在信息社會,信息都可以被分為兩類,一類信息能夠用數據或統一的結構加以表示,如數字、符號等,被稱為結構化大數據;另一類信息無法用數字或統一的結構表示,如文本、圖像、聲音乃至網頁等,被稱為非結構化大數據。

大數據在物理學、生物學、環境生態學等領域存在已有時日,卻因為互聯網和信息行業的發展而引起人們關注。不同于結構化大數據內容,非結構化大數據廣泛存在于互聯網上,表現為碎片化、非規范化的特征。

訊庫就是基于數據的某種特性,把散布在互聯網上的各種信息和碎片化的內容進行整合分析,找出其中的各種關聯性和趨勢。它打破了傳統的信息分類方式,由用戶決定分類標準。

訊庫平臺能實時從互聯網上采集有針對性的資訊,將這些數據放到公司的云計算中心進行處理,再通過商業智能分析,生成結果后提供給用戶。

訊庫搜索出的結果比普通搜索引擎更多,而且每個結果都以文本形式直接呈現給用戶;普通搜索引擎只提供排在前面幾十頁的搜索結果的鏈接,其中有一部分鏈接是無法打開的。另外,訊庫能夠采集到搜索引擎通常搜不出來的微博、論壇中的內容,而這些內容恰恰是反映網絡輿情的關鍵信息。在每條資訊下方,訊庫都根據語義分析技術對其做出正負面態度判斷,判斷準確率為80%。

除了簡單的關鍵詞搜索,“訊庫”可以實現添加各種限定條件和復雜邏輯關系的高級搜索。在搜索結果出來之后,還可進行資訊曝光指數、地域分布、預警媒體分析,并實時生成電子剪報?!吧疃韧诰?、準確研判、趨勢預測、實時推送”,是訊庫核心功能的體現。

這一產品最典型的應用是政府輿情監測和企業競爭情報分析。在政府層面,通過互聯網的數據采集,訊庫把公眾的意見反映給政府,政府以此來提高決策和執政水平。而在企業層面,訊庫把與企業有關的信息搜集起來,通過智能分析,得出對企業有借鑒性的參考和建議。

七年經歷了三次質變

“訊庫團隊是一個能打硬仗的團隊,是能夠在有限的資源和巨大的壓力下高效工作的團隊?!?/p>

依靠非結構化大數據做支撐,通過自主研發的語義分析技術,訊庫在數據挖掘和分析的全面性、可靠性和實時性上已經先于同行邁出一大步。目前,圍繞數據的分析采集與處理,公司已經有4項發明專利,60項軟件著作權和4個注冊商標。

自公司成立至今,短短七年時間,訊庫已經歷了三次質變。最初的1.0和2.0版本是為了解決資訊的全面、實時的問題:第一個版本所做的是讓資訊搜集不漏;第二個版本可以在資訊出現后的幾分鐘內將結果傳給客戶。而3.0版本致力于從語義分析層面解決用戶數據的提取準確性問題。

移動互聯網的出現改變了用戶的使用模式,讓碎片化的時間發揮作用,資訊推送的成本更低,效果更好。為了提升用戶體驗度,除了PC版本外,訊庫還推出了手機客戶端等移動互聯網方式,用戶可以隨時登陸訊庫,個性化定制某類資訊。通過訊庫客戶端,以一個更快的方式推送給使用者,不同于現在的頻道、欄目訂閱,它更精準地將想訂閱的資訊推送到用戶的手中。這樣做的好處是,過濾掉重復資訊和非定制化資訊,用戶看到的資訊就是他想看到的內容。

除政府和企業客戶外,初曉光團隊還針對個人定制化產品進行研發和設計,基于訊庫分析工具,用戶可以根據歷史上的大量數據,通過某種運算形式,對他所關心的問題做市場調查。通過非結構化大數據技術來挖掘互聯網上的數據,得到某一時刻公眾對這一企業的評價,讓企業實時知道這一時間點的公眾輿論和情感傾向,產生的結果往往比傳統問卷調查準確得多。

未來,訊庫將以國內為主要市場,積極同擁有數據的政府部門、科研院所、社交媒體平臺開展合作,共同探索大數據在各行各業的應用。

初曉光的創業理想是,將訊庫變成中國重要的互聯網大數據服務商。

鏈接:初曉光,入選北京“海聚工程”,北京市特聘專家,北京麥克斯泰科技有限公司CEO。

猜你喜歡
資訊結構化輿情
促進知識結構化的主題式復習初探
資訊Information①
結構化面試方法在研究生復試中的應用
輿情
輿情
輿情
基于圖模型的通用半結構化數據檢索
基于軟信息的結構化轉換
微博的輿情控制與言論自由
資訊
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合