?

大數據時代傳統出版業數據規模

2018-07-10 06:24李大美
傳媒 2018年12期
關鍵詞:印張印數數據量

文/張 立 李大美

關于傳統出版業的數據規模,目前國內外均無明確的統計,只籠統地認為規模不大,這也只是與網上數據比較而言。被引用較多的說法是“人類生產的所有印刷材料的數據量是200PB”,但這個數據究竟如何得出也無從追查。為了弄清楚我國傳統出版業的數據規模究竟有多大,筆者嘗試著利用原國家新聞出版廣電總局每年發布的《中國新聞出版統計資料匯編》中的統計數據,并通過一定的計算方法,來得出我國傳統出版業的內容數據量,以便大家了解。

內容數據量的計算方法

為便于計算傳統印刷媒體的整體內容數據量,筆者分別以中國新聞出版研究院所屬中國書籍出版社出版的圖書、出版發行研究雜志社出版的期刊,以及中國知識產權報為例,制定了一個每面大約排字量的計算標準(見表1),為方便統計,將圖書、期刊、報紙中的圖片、公式等換算為同等面積的文字進行計算。

表1 每面大約排字量計算標準

出版業年度內容數據量——以2016年為例

(一)2016年平均每冊(份)書刊報內容的數據量

1.圖書平均每本內容數據量為430KB

2016年全國共出版圖書總印數90.37億冊(張),總印張777.21億印張,用總印張除以總印數可以得出每本圖書平均印張數,即777.21億印張÷90.37 億冊(張)=8.60印張。平均每本圖書內容數據量為:8.60印張×25600(字 / 印張)=22.02萬字=430KB。

2.期刊平均每冊內容數據量為316.60KB

2016 年全國共出版期刊總印數 26.97億冊,總印張 151.95億印張,每冊期刊平均印張數為:151.95億印張÷26.97億冊 =5.63印張;平均每冊期刊內容數據量為:5.63印張×28800(字/印張)=16.21萬字=316.60KB。

3.報紙平均每份內容數據量為169.14KB

2016年全國共出版報紙總印數390.07億份,總印張1267.27億印張,每份報紙的平均印張數為:1267.27億印張÷390.07億份=3.25印張。平均每份報紙內容數據量為:3.25印張×26640(字/印張)=8.66萬字=169.14KB。

為了弄清楚我國傳統出版業的數據規模究竟有多大,筆者嘗試著利用原國家新聞出版廣電總局每年發布的《中國新聞出版統計資料匯編》中的統計數據,并通過一定的計算方法,來得出我國傳統出版業的內容數據量,以便大家了解。

(二)2016年新出版的書刊報內容數據量為0.32TB

1.圖書內容數據量為205.03GB

2016 年全國共出版圖書499884種,平均每種圖書為22.02萬字,2016年出版圖書內容數據量為:499884種×22.02萬字=1100.74億字=205.03GB。

2.期刊內容數據量為59.07GB

2016年全國共出版期刊10084種,平均期印數13905萬冊,總印數26.97 億冊;用總印數除以平均期印數,可以得知實際出版期數約每年19.4期,2016 年出版期刊內容數據量為:10084種×19.4期×16.21萬字=317.12億字=59.07GB。

3.報紙內容數據量為61.13GB

2016年全國共出版報紙1894種,平均期印數19494.94萬份,總印數390.07 億份;用總印數除以平均期印數,可以得知實際出版期數約每年200.09期,2016 年報紙出版內容數據量為:1894種×200.09期×8.66萬字=328.19億字=61.13GB。

2016年出版書刊報合計內容數據量為:1100.74億字+317.12億字+328.19 億字=1746.05億字=0.32TB。

(三)2016年度每家出版社平均出版圖書內容數據量為0.35GB

截至2016年底,全國共有出版社584家(包括副牌社33家);平均每家出版社2016年度出版圖書數據量為:1100.74億字÷584家=1.88億字=0.35GB。

由于《2017中國新聞出版統計資料匯編》中無雜志社和報社數量,且實際情況復雜、統計困難,故此處不計算平均每家雜志社和報社新出報刊內容數據量。

(四)全國大型出版集團2014年度出版圖書內容數據量

根據《2014年新聞出版產業分析報告》,筆者選取總體經濟規模綜合排名前三的出版集團進行圖書(不含集團中的報刊出版數據量)內容數據量的統計,具體如下。

1.排名前三的出版集團2014年圖書出版總數據量(含復本數)

2014年總數據量排名第一的江蘇鳳凰出版傳媒集團:2014年總印數39499 萬冊(張),總印張27.46111億印張??倲祿繛椋?7.46111億印張×25600(字 /印張)=703千億字=127.87TB。

排名第二的湖南出版投資控股集團:2014年總印數30051萬冊(張),總印張21.77402億印張??倲祿繛椋?1.77402億印張×25600(字/印張)=557.41 千億字=101.39TB。

排名第三的中國教育出版傳媒集團:2014年總印數45035萬冊(張),總印張50.56242億印張??倲祿繛椋?0.56242億印張×25600(字/印張)=1294.40 千億字=235.45TB。

2.排名前三的出版集團 2014年新出圖書數據量(不含復本數)

排名第一的江蘇鳳凰出版傳媒集團:總印張除以總印數可以得出每本圖書平均印張數,即274611.1萬印張÷39499萬冊(張)=6.95印張,每本圖書平均內容數據量為:6.95印張×25600(字/印張)=17.80萬字;已知2014年共出版圖書16534 種,可得出2014年新出圖書數據量為:16534種×17.80萬漢字=29.4 億漢字=5.48GB。

排名第二的湖南出版投資控股集團:每本圖書平均印張數為:217740.2萬印張÷30051萬冊(張)=7.25印張,每本圖書平均內容數據量為:7.25印張 ×25600(字/印張)=18.56萬字;已知 2014年共出版圖書9095種,可得出2014 年新出圖書數據量為:9095種×18.56萬字=16.88億字=3.14GB。

排名第三的中國教育出版傳媒集團:每本圖書平均印張數為:505624.2萬印張÷45035萬冊(張)=11.23印張,每本圖書平均內容數據量為:11.23印張×25600(字/印張)=28.75萬字;已知2014年共出版圖書14483種,可得出 2014年新出圖書數據量為:14483種×28.75萬字=41.64億字=7.76GB。

最近十年全國出版業累計出版書刊報內容數據量

上一部分對單年內容數據量進行了分析,那么,全國出版業最近十年累計出版書刊報的內容數據量又是多少呢?以2007~2016年《中國新聞出版統計資料匯編》中的統計數據為依據,筆者進行了詳細的測算。

(一)2007~2016年,全國平均每種(份)書刊報數據量分別為417.97KB、 316.60KB和221.10KB

平均每本圖書數據量:2007年至2016年的十年間全國出版圖書的總印數為772.61冊(張),總印張數為6457.80億印張,用總印張數除以總印數可以得出每本圖書平均印張數,即6457.80億印張÷772.61億冊(張)=8.36印張,每本圖書內容數據量為:8.36印張×25600(字/印張)=21.40萬字=417.97KB。

平均每冊期刊數據量:2007年至2016年的十年間全國出版期刊的總印數為310.89億冊,總印張數為1749.96億印張,則每冊期刊平均印張數為:1749.96億印張÷310.89億冊=5.63印張,每冊期刊內容數據量為:5.63印張×28800(字/印張)=16.21萬字=316.60KB。

平均每份報紙數據量:2007年至2016年的十年間全國出版報紙的總印數為4488.32億份,總印張數為19074.07億印張,則每份報紙的平均印張數為:19074.07億印張÷4488.32億份=4.25印張,每份報紙內容數據量為:4.25印張×26640(字/印張)=11.32萬字=221.10KB。

(二)2007~2016年,全國累計書刊報數據量為2.87TB

十年累計圖書數據量:2007~2016 年全國累計出版圖書3806095種,平均每種圖書為21.40萬字,則十年累計圖書數據量為:3806095種×21.40萬字 =8145.04億字=1.48TB。

十年累計期刊數據量:2007~2016 年全國共出版期刊98409種,平均期印數 160564萬冊,總印數310.89億冊;用總印數除以平均期印數可以得知實際出版期數 約每年19.36期,則十年期刊累計出版內容數據量為:98409種×19.36期×16.21萬字=3088.33億字=0.56TB。

十年累計報紙數據量:2007~2016年全國累計出版報紙19230種,平均期印數214678.12萬份,總印數4488.32億份;用總印數除以平均期印數可以得知實際出版期數約每年209.07期,則十年報紙累計出版內容數據量為:19230種 ×209.07期×11.32萬字=4551.11億字=0.83TB。

則2007~2016年全國書刊報累計出版數據量為:8145.04億字+3088.33億字+4551.11億字=15784.48億字=2.87TB。

其他相關數據量

(一)發行數據量

筆者根據 2007~2016 年《中國新聞出版統計資料匯編》中的相關數據,整理了十年來的出版物發行數據。

1.2016 年度發行數據

2016年,全國新華書店系統、出版社自辦發行單位出版物總購進量207.78 億冊(張、份、盒),總銷售量208.27億冊(張、份、盒),總銷售金額2771.34 億元,純銷售量70.25億冊(張、份、盒),純銷售金額852.49億元;非出版物商品銷售金額319.46億元(不含在銷售總金額之內);庫存數量65.75億冊(張、份、盒),庫存金額1143.01億元;發行網點163102處;從業人員67.12萬人。

2016年全國出版物零售情況如下:① 圖書零售量67.09億冊(張、份、盒),零售額795.56億元;② 期刊零售量0.30億冊(張、份、盒),零售額 11.76 億元; ③報紙零售量0.11億冊(張、份、盒),零售額1.10億元;④ 音像制品零售量0.39億冊(張、份、盒),零售額7.63億元;⑤電子出版物零售量0.16億冊(張、份、 盒),零售額11.39億元;⑥ 數字出版物零售額5.66億元。

2.2007~2016年累計發行數據

2007~2016年,全國新華書店系統、出版社自辦發行單位出版物銷售數量及金額合計為:總銷售量1831.08億冊(張、份、盒),總銷售金額20344.29億元;純銷售量667.61億冊(張、份、盒),純銷售金額6745.31億元。

2007~2016年,出版物總購進量1855.56億冊(張、份、 盒),總購進金額20904.24億元;庫存數量576.52億冊(張、份、盒),庫存金額8480.58億元;非出版物商品銷售金額1084.14億元(不含在銷售總額之內);發行網點合計1666836處;從業人員合計714.39萬人。

2007~2016年,出版物零售情況如下:①圖書零售量593.42億冊(張、份、盒),零售額6153.45億元;②期刊零售量9.45億冊(張、份、盒),零售額141.37億元;③報紙零售量5.06億冊(張、份、盒),零售額18.08億元;④音像制品零售量11.73億冊(張、份、盒),零售額149.26億元;⑤電子出版物零售量2.28億冊(張、份、盒),零售額79.7億元;⑥ 數字出版物零售額17.66億元。

(二)印刷復制數據

筆者根據2007~2016年《中國新聞出版統計資料匯編》對印刷復制相關數據也進行了整理

2016年,印刷復制(包括出版物印刷、包裝裝潢印刷、專項印刷、打字復印、 復制和印刷物資供銷)總體實現營業收入12711.59億元,利潤總額882.70億元;全國出版物印刷企業(含專項印刷)8936家;圖書、報紙、其他出版物黑白印刷產量31517.57萬令,彩色印刷產量150688.38萬對開色令;裝訂產量 33668.54萬令;印刷 用紙量64299.06萬令。

2007~2016年,印刷復制總體實現營業收入78334.83億元,利潤總額5427.38億元;全國出版物印刷企業(含專項印刷)84102家;圖書、報紙、其他出版物黑白印刷產量294288.64萬令,彩色印刷產量1690138.69萬對開色令;裝訂產量305001.04萬令;印刷用紙量545632.08萬令。

(三)進出口數據量

根據2007~2016年《中國新聞出版統計資料匯編》,筆者對全國出版物進出口數 據進行了詳細的整理。其中圖書、報紙、期刊、音像制品、電子出版物與數字出版物的出口數據,來自對全國出版物進出口經營單位和部分出版單位、發行單位的出口數據統計,系不完全統計;進口數據來自對全國出版物進出口經營單位的進口數據統計。

2016年,全國出口圖書、報紙、期刊2169.94萬冊(份),出口金額7785.11 萬美元;全國出版物進出口經營單位累計進口圖書、報紙、期刊3108.18萬冊(份),出口金額30051.73萬美元;全國出口音像制品、電子出版物與數字出版物 11.75萬盒(張),出口金額3225.66萬美元;全國出版物進出口經營單位進口音像制品、電子出版物與數字出版物 10.81萬盒(張),出口金額25859.38萬美元。

2007~2016年,全國累計出口圖書、報紙、期刊16066.95萬冊(份),累計出口金額59273.74萬美元;全國出版物進出口經營單位累計進口圖書、報紙、期刊28453.20萬冊(份),累計進口金額271215.06萬美元;全國累計出口音像制品、電子出版物與數字出版物282.64萬盒(張),累計出口金額14414.03萬美元;全國出版物進出口經營單位累計進口音像制品、電子出版物與數字出版物 233.73萬盒(張),累計進口金額148717.08萬美元。

(四)版權數據量

根據2007~2016年《中國新聞出版統計資料匯編》,版權數據主要包括版權管理與版權貿易數據。2016年,全國版權合同登記19744份,作品自愿登記 1895053份;全國共引進版權17252種,其中引進圖書、音像制品和電子出版物版權17174種;全國共輸出版權11133種,其中輸出圖書、音像制品和電子出版物版權9811種。

2007~2016年,全國版權合同登記167662份,作品自愿登記7950290份;全國共引進版權161274種,其中引進圖書、音像制品和電子出版物版權154878 種;全國共輸出版權74390種,其中輸出圖書、音像制品和電子出版物版權62249 種。

(五)出版物元數據

文章在此僅對出版物中的圖書元數據的數據量進行介紹,其他出版物元數據由于未獲得具體數據量,故在此不做介紹。由于圖書元數據中包含的大部分數據項在圖書在版編目(CIP)中都有所體現。因此,對圖書元數據量的統計將以中國版權圖書館CIP登記數量及新中國成立以來的館藏數量作為基本的規模統計。圖書在版編目數據國家標準《圖書在版編目數據》于1990年7月31日發布,自1991年3月1日起實施,經過幾年的實施和準備,于1999年4月1日起在全國強制性推廣實施,截至2016年7月共登記約340萬條數據,加上自新中國成立以來的館藏數據100多萬條,目前我國圖書元數據量為400多萬條。

(六)出版業網站數據

根據中國新聞出版研究院2013~2015年《全國新聞出版業網站運營趨勢分析報告》可以得到我國出版業網站的相關數據,該系列報告從三個指標來衡量出版業網站影響力,即頁面瀏覽量、獨立用戶數及總訪問次數(數據為網站月度平均值)。具體見圖1~3。

圖1 2013~2015 年全國新聞出版業網站月均頁面瀏覽量

圖2 2013~2015 年全國新聞出版業網站月均獨立用戶數

圖3 2013~2015 年全國新聞出版業網站月均訪問次數

從以上圖中可以看出,出版業網站中新聞門戶和在線教育類網站影響力明顯高于其他三類;新聞門戶類網站頁面瀏覽量、獨立用戶數及訪問次數總體上呈逐年增長態勢;而在線教育類網站則進入了調整期,2015年出現明顯下降。

猜你喜歡
印張印數數據量
基于大數據量的初至層析成像算法優化
高刷新率不容易顯示器需求與接口標準帶寬
寬帶信號采集與大數據量傳輸系統設計與研究
全國少數民族文字期刊分類種數、印數、總印張、總金額
主要刊期的期刊出版數量
《2012年全國新聞出版業基本情況》(節選)
固定資產管理系統對物流管理的促進和發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合