?

大數據時代的編輯出版

2014-10-27 20:47鐘金榮
新聞世界 2014年10期
關鍵詞:出版業數據挖掘大數據

鐘金榮

【摘 要】隨著大數據時代的來臨,數據技術革命已經滲透到包括出版業在內的各行各業,帶來了前所未有的機遇。數據通過向信息和知識的轉換,最終可以轉化為價值、效用和利潤。面對波濤洶涌的數據浪潮,出版人需要掌握駕馭龐大數據的能力,即通過收集、管理、挖掘和整合,在讀者細分、選題立項、版權貿易方面,利用提煉出的有效信息直接轉化為利潤,同時發現出版行業潛在的價值空間。

【關鍵詞】大數據 出版業 數據挖掘

當今的世界出版處于紙質—數字二元格局。一方面傳統的紙質書仍然是出版中的主力軍,在圖書銷售中占有絕大部分份額;另一方面數字出版表現出旺盛的生命力,正在努力尋找自己的發展之路。面對這個前所未有的信息高速流轉時代,不管是傳統的出版人還是新興的數字出版從業者都在莫名的欣喜,欣喜從沒有如此之多的信息可以為我所知、所用,但是在欣喜之余面對海量信息一種無所適從的茫然感也悄然襲來。

在大家開始對信息爆炸產生不良反應的同時,一片貌似更大的“技術烏云”聚攏在人們頭上。依仗存儲技術和處理器技術的進步,數據的收集與分析變得越來越便捷,數據的激增也意味著人類的記錄范圍、測量范圍和分析范圍在不斷擴大,“大數據”的概念被適時提出并越來越流行、越來越重要。隨之而來有人斷言,在“大數據”時代人類可以發現新的知識,創造新的價值,帶來“大知識”、“大科技”、“大利潤”、“大發展”。

一、大數據時代的出版

“大數據”這個名詞并不新鮮,早在20世紀80年代的美國就提出過相關概念。20多年來,各個領域的數據量都在迅猛增長,美國的企業界、學術界也不斷地對這個現象及其意義進行探討,直至演變成國家和政府層面的發展戰略。

“大數據”是指那些大小已經超出了傳統意義上的尺度,一般的軟件工具難以捕捉、存儲管理和分析的數據。為何稱其為“大”,并不僅僅在于其“容量之大”,更多的意義在于:人類可以“分析和使用”的數據在大量增加,通過這些數據的交換、整合和分析,人類可以發現新的知識、創造新的價值。

2011年麥肯錫公司在其研究報告《大數據:下一個創新、競爭和生產率的前沿》中指出:“已經有越來越多令人信服的證據表明:只要實施正確的政策和激勵,大數據將成為競爭的關鍵性基礎,并成為下一波生產率提高、創新和為消費者創造價值的支柱”①

網絡營銷市場(表1) 按功能劃分大數據在零售業的撬動作用。

麥肯錫的研究報告認為,基于數據分析的發展,大數據將在以上16個領域為零售業帶來巨大的機遇?;跀祿姆治龊透偁幰呀浭橇闶蹣I的常態,零售業的競爭一定程度上已經成為一種基于數據的競爭,數據的爆炸將影響未來行業的競爭方式,未來的競爭將更加精細化,這種精細化就體現在數據的收集和分析上。數據的分析和挖掘的能力就是企業的核心競爭力。

大數據對編輯出版的影響,首先體現在讀者細分上。每一本圖書的銷售,不管是紙質書還是電子書,都會產生銷售數據,數據的背后都隱含著讀者的信息,對這些數據進行分析,可以挖掘出讀者的結構、流量、購買周期以及不同讀者群的利潤貢獻率;掌握讀者的購買頻率和購買偏好,預測并推送促銷信息;利用多維分析,找出群體、時間、地區等各種細分結構的交叉情況,不僅清楚掌握了市場占有率還能發現新的增長空間,直接發現潛在讀者的所在。有了這些點、線、面的分析,出版者就可以據此預測讀者的消費意愿、調整和優化自身的出書結構、重新安排分銷渠道等等,從而提高銷售率和利潤率。

其次影響產品細分?;跀祿姆治?,找到書店更新庫存的最佳時期、確定最佳的庫存量、如何將圖書分類上架等等。通過參考不同圖書內容的銷售量的排行,出版社可以依據自身定位與實力確定想要爭奪的市場,規避不必要的風險。根據數據分析,發現定價趨勢,依據同一類圖書價格趨勢的參考,找出自己的定價區間。

再次是對供應鏈、商業模式的影響。例如,如果書店進購其他地區已經銷售低迷的圖書,很有可能同樣產生滯銷,那么供應環節與運營效率越高產生的損失就會越大。而對暢銷書估計不足,導致供應鏈滯后,就會錯失商機。

大數據有助于出版更加精細化,出版人不用再為以前模棱兩可的決策信息所困擾。市場數據、讀者數據、產品數據的實時更迭,將為決策者提供幫助。

二、大數據時代的編輯工作

1、選題工作的革新

選題是編輯工作中的重點,選題策劃和判斷能力的好壞是編輯能力強弱的直接體現,也是一本圖書成敗的關鍵因素。出版社之間的競爭,從某種意義上說就是出版物選題的競爭。傳統編輯工作中的選題策劃與判斷,依賴于編輯的直覺與經驗,編輯選題的工作更像是和市場的賭博。在大數據時代,編輯可以通過廣泛收集與選題相關的同類圖書出版、銷售等情況,進行提煉和分析,找出影響成功與失敗的因素。通過數據挖掘可以更科學地判斷選題價值,發現選題背后隱現的規律,預測選題的發展趨勢,從而提高出版的針對性。

2、讀者作者的對接

在傳統出版業里,讀者與作者是相互分離的,編輯的工作就是要讓作者和讀者相互認識、互相認可,一本書的暢銷離開了這兩個方面都不可能實現。

作者水平的高低和受歡迎程度直接決定成書的成敗,以往對作者的選擇,更多是編輯自身的判斷。但是在大數據時代,可以通過分析作者的擁護群體的多寡、作品被評論、引用、被借閱的次數等,更加清晰的了解到作者在讀者群中的人氣;對讀者數據的挖掘,預測讀者群的喜好變化,根據這種變化找到合適的作者,擺脫了過去工作的盲目性,也讓編輯不知道“讀者在哪里的感嘆”不再出現。

3、國際間數據融合,尋求版權合作

數字技術為知識的存儲、傳播和檢索創造出巨大的潛力。這些技術為人們的交流和文化產業的發展以及全球范圍內作品的使用提供了空前的可能性。②從輸出數量上看,近10年來我國圖書版權輸出的規??傮w偏小,這與中國經濟的快速發展、與中國在國際上的大國形象、與中國博大深厚的文化底蘊以及與中國的圖書版權引進數量相比都極不相稱。據新聞出版總署公布的數據,2001—2010年的10年間,國內出版社輸出的圖書版權共計19559種(年均1956種),與同期引進的114542種圖書版權(年均11454種)相比,存在著巨大的貿易逆差(1:5.87),(逆差最高峰時的2003 年則高達1:15.1③可以看到我國版權貿易有著巨大的上升空間,編輯應廣泛的收集國際最新圖書信息,以及這些圖書的相關介紹,通過對這些圖書信息進行分析、整合,進行可行性分析,尋找適合本社出版的圖書,為進一步的版權貿易做準備。此外,把自己出版的圖書數據進行整理,有針對性的發送給國外出版機構,主動尋求合作,提高版權貿易的效率和針對性。

三、大數據時代的編輯素養

一方面數據的極端豐富為編輯提供了更多選擇的可能,另一方面也為編輯的工作增加了困難。如何在繁雜冗長的數據中找到需要的信息,如何利用毫無章法的數據為自己的工作所用?在大數據時代,信息收集的具體應用更多體現在數據挖掘上。所謂數據挖掘,是指通過特定的計算機算法對大量的數據進行聯機分析,從而提示數據之間隱藏的關系、模式和趨勢,為決策者提供新的知識。知識的收集過程不是盲目進行的,而是根據特定的目標和需要,通過一種或幾種特定的手段和措施,對大量的、分散的、無序的數據進行甄別、歸類、篩選、整合,將其中高質量、有價值和時效強的數據挖掘出來,通過數據和數據之間的相互驗證,將數據上升為信息,再從信息中提煉規律,發現新的知識。整個過程,是在海量的數據中尋找知識,就像開礦掘金一樣困難。

數據時代的編輯,應該樹立起大數據觀,即明確收集與挖掘數據的重要性,也許單個編輯不懂具體的數據倉庫、數據可視化等具體數據分析技能,但是應該懂得數據挖掘的基本邏輯。事實上,不同數據挖掘之間只有具體操作的差異,它們的邏輯法則幾乎是一致的。只要嘗試去接觸其中一種,了解基本概念,并不需要具備掌握所有數據分析技術的能耐,就可以很好的讓數據為我所用,盡情的去發揮自己的創意。除此以外編輯還應具備以下數據能力:一是及時掌握環境數據,包括宏觀環境、社會環境、政治環境等;二是建立人際關系鏈,隨著實名制社區和電子商務的普遍化,人際關系鏈已經成為大數據重要的營銷價值。④

結語

書籍承載的是內容,對出版業而言,優質內容是永恒主題,是產業主線,因為不論未來出版呈現怎樣的業態,優質內容始終是出版之魂。編輯作為閱讀需求的發現者、創造者,更是數據時代的把關人。能否做到在數據時代找出優秀的內容、替讀者把好關,讓我們的讀者能在紛繁復雜的世界里發現真正價值的所在,這是未來壓在所有編輯出版人肩上的重擔。

參考文獻

①Big data:The next frontier for

innovation, competition, and produ-

ctivity,McKinsey Institute, May2011[DB/OL].HTTP://www.mckinsey.com/in-

sights/mgi/research/technology_and_innovation/big_data_the_next_frontier_for_innovation

②聯合國教科文組織,張雨澤 譯:《版權法導論》[M].知識產權出版社,2009

③潘文年,《風暖雁尋去 松高人獨來——中國圖書“走出去”十年步伐》[J].《編輯之友》,2012(1)

④麻震敏,《大數據時代:營銷智慧的進化論》[J].《成功營銷》,2012(7)

(作者:四川大學文學與新聞學院2012級出版專業碩士研究生)

責編:周蕾

猜你喜歡
出版業數據挖掘大數據
探討人工智能與數據挖掘發展趨勢
以按需出版為抓手,推動出版業數字化轉型
基于并行計算的大數據挖掘在電網中的應用
AR與VR技術在兒童出版業中的應用
基于大數據背景下的智慧城市建設研究
對出版業供給側改革的思考
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
南宋出版業考述
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合