?

·專題·

2014-11-14 13:40郭晶
圖書與情報 2014年5期
關鍵詞:棱鏡術語領域

·專題·

引言:2012年美國奧巴馬政府發布了“大數據研究和發展倡議”,正式啟動“大數據發展計劃”?!禨cience》與《Nature》分別于2008年、2011年推出了大數據???。2012年達沃斯世界經濟論壇把大數據列為主題之一,2013年我國第462次香山科學會議的主題為“數據科學與大數據的科學原理與發展前景”。IBM、Amazon、Google、Facebook等國際知名企業都宣布或實施了大數據研發計劃,并進行了實際應用。麥肯錫、Gartner等公司分別發布了關于大數據的行業分析報告,對大數據的影響、關鍵技術和應用領域等都進行了詳盡的分析。

情報分析,也被稱為情報研究或信息分析,是根據用戶的特定需求,對大量紛繁無序的信息進行有針對性的選擇、分析、預測,為用戶提供系統、綜合、準確、及時、大流量的知識與信息的智能活動。由于情報分析是以數據、信息等情報源為基礎的信息采集、管理、分析和服務的工作,本身就是一項數據分析和數據挖掘工作,正是因為如此,大數據理念和方法,正在深刻地影響著情報研究的理論和實踐,也成為了情報學研究的熱點課題之一。

在這種背景下,我們于2014年申請了國家社會科學基金重點項目“大數據環境下的計算型情報分析方法與技術研究”(項目編號:14ATQ005),得到了國家社會科學基金委的肯定和批準。本專題的四篇文章就是該項目的初步研究成果。

第一篇是“從棱鏡計劃看大數據時代下的情報分析”,這篇文章并沒有討論棱鏡計劃中的隱私及保護問題,而是更深入地揭示了棱鏡計劃背后隱藏的情報現象,全面剖析了棱鏡計劃的本質,分析了棱鏡計劃的數據基礎、分析過程與方法、實施目標,并對大數據時代下的情報分析進行了探討。棱鏡計劃的真正目標是運用大數據進行情報分析,從大量數據中發掘出有價值的情報,為戰略決策提供全面準確、客觀有力的支撐與參考服務,這是大數據時代情報分析的重點,也是情報從業人員的關鍵能力所在。

第二篇是“不同領域的情報分析及其在大數據環境下的發展”,旨在從宏觀角度探討不同領域中的情報分析之間的學科差異。大數據時代本身,各行各業都在重視情報研究工作,有些學科領域不僅有自己的情報分析,而且這種情報分析本身就是這些學科領域的核心內容和特色。但是,這些情報分析又都不可避免地打上本學科領域的烙印,不可以一言以蔽之。本篇文章的目的是揭示情報分析的學科差異,反映情報分析的學科特點,并探討大數據環境下各學科領域中情報分析的發展。

第三篇是“大數據分析的方法及其在情報研究中的適用性初探”,大數據的價值不僅僅在于數據量,大數據的核心理念之一是大數據分析,即對海量的數據進行分析,從中獲取有助于決策的信息。目前,大數據分析方法已經成為大數據領域的熱點研究問題,而且,這些研究的內容對情報研究方法有借鑒意義,本篇文章梳理了當前大數據分析方法的研究與實踐成果,總結了常見的大數據分析方法,探討了這些方法在情報研究中的適用性。

第四篇“基于關聯規則的術語自動抽取研究”是一篇實驗類的研究論文。情報分析的第一步是要厘清文本中的各種概念,而概念又是用語詞來表達,因而,從文本中抽取出跟蹤術語,特別是抽取出由復合語詞組成的術語,是自動化情報分析的重要和基礎技術環節。本篇文章探討了關聯規則方法用于術語抽取的可行性。文章通過試驗驗證了關聯規則可以很好的完成復合術語的識別和抽取問題,而且,與現有的方法相比較,關聯規則方法具有實現簡單、占用系統資源少、沒有學科和語言的依賴性等優勢。

北京大學信息管理系李廣建

猜你喜歡
棱鏡術語領域
電子戰領域的爭鋒
2020 IT領域大事記
THE FAREWELL
領域·對峙
大棱鏡溫泉
2018年熱門領域趨勢展望
水晶棱鏡
文學術語詞典中的“經典”:艾布拉姆斯的《文學術語匯編》
這不是萬花筒 Fragment
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合