?

推進CNONIX國家標準應用 打造企業數據服務平臺

2016-11-07 16:17李列群
出版廣角 2016年17期
關鍵詞:服務平臺

【摘要】CNONIX 標準的建立,旨在為我國出版產業鏈上的出版商、發行商、數據集成商等各類機構提供標準的圖書信息交換格式,實現產業鏈上圖書信息的互聯互通,既可通過加速產品信息的流動,促進圖書產品的流通效率,又可通過產品信息一次制作、多方應用的方式,降低行業信息的應用成本,提高行業各機構的信息系統應用效率。文章以上海新華傳媒為例,探索CNONIX在新聞出版發行行業的應用。

【關鍵詞】CNONIX國家標準;服務平臺;上海新華傳媒

【作者單位】李列群,上海新華傳媒連鎖有限公司。

一、CNONIX(中國出版物在線信息交換)介紹

Online Information Exchange 的縮寫ONIX(在線信息交換),是一種以元數據描述圖書產品信息的數據交換協議。包括ONIX for Books(圖書在線信息交換)、ONIX for serials (連續出版物在線信息交換)、ONIX for Publications Licenses(出版許可在線信息交換)、Licensing Terms & Rights Information(許可條款和版權信息)等多項協議。該協議是1999年由美國出版者協會(AAP)提出并開發的一份產品信息交換協議,旨在讓各個出版者能以一致的格式發送豐富的產品元數據給零售商,特別是開展網上零售業務的電商。該協議主要解決圖書產品信息的在線交換問題。

在該協議中,圖書是個廣義的概念,包括單行本的圖書、電子出版物、系列書、套書等。該標準由四個部分組成:ONIX代碼表、ONIX概述和數據元素目錄、ONIX產品信息記錄格式、ONIX XML信息交換規則。它提供了圖書產品全面、準確、網絡化、數字化、動態描述、維護和交換規范信息,能使圖書產品信息和供應信息整合在一個平臺,滿足書業對信息共享和供應鏈管理的需求。

2014年,經中國國家標準化管理委員會頒布的《中國出版物在線信息交換(CNONIX)》國家標準采用了ONIX for Books的元數據描述體系和結構。CNONIX標準基于XML語言進行描述。CNONIX 標準的建立,旨在為我國出版產業鏈上的出版商、發行商、數據集成商等各類機構提供標準的圖書信息交換格式,實現產業鏈上圖書信息的互聯互通,既可通過加速產品信息的流動,促進圖書產品的流通效率,又可通過產品信息一次制作、多方應用的方式,降低行業信息的應用成本,提高行業各機構的信息系統應用效率。

2014年,國家新聞出版廣電總局同財政部一起將CNONIX國家標準應用示范工作納入文化產業發展資金的扶持范圍,通過項目資金的支持,帶動行業各單位積極實施CNONIX國家標準。目前,已有12家示范單位的13個CNONIX應用項目獲得財政支持,7家單位的CNONIX項目被納入國家新聞出版廣電總局的改革發展項目庫,22家出版單位、發行單位、圖書館、研究機構等成為應用示范單位。

二、CNONIX在新聞出版發行行業中的應用

上海新華傳媒作為22家示范單位的一員,正努力探索CNONIX在新聞出版發行行業的應用。

之前,由于圖書產品信息的標準不統一,上海新華傳媒實施的ERP圖書書目信息數據來源分散、格式多樣,有來自B2B出版社提供的書目信息,有ERP補錄的數據,有館配的圖書征訂信息,有大學教材的征訂信息,有MARK/CALIS數據等,形成了各種信息相互獨立的系統孤島。在數據規范化上,由于各種原因,ERP的產品重復信息達到了幾萬條,不完整和不規范的數據充斥在標準的數據中,成為信息系統的負擔甚至是垃圾。同時,上海新華傳媒的一城書集等線上業務也在逐步發展,需要標準化并符合網上銷售特點的產品信息。因此,圖書產品信息的標準化和規范化已成為上海新華傳媒圖書業務整體發展的技術關鍵。上海新華傳媒在CNONIX標準實施中充分考慮CNONIX國家標準的落地,在貫徹CNONIX國標的企業信息系統建設中,計劃在以下幾方面嘗試具體應用。

1.構建企業的CNONIX云服務平臺

總體建設框圖如(圖1):

企業CNONIX云服務平臺是企業內的服務平臺,行業CNONIX數據服務平臺上接原新聞出版總署信息中心的出版發行信息公共服務平臺,共享和下載使用行業的CNONIX元數據內容;下接企業和各個業務信息系統,是企業連接和共享行業CNONIX元數據內容的通道和橋梁。同時,平臺提供錄入、采集、整理、加工基于CNONIX標準圖書產品信息的元數據內容工具,為圖書出版發行行業建立符合CNONIX標準的圖書書目信息服務。

無論是在戶內環境下,還是在“云”里,我們認為,一個應用平臺應包含以下三個部分。

一個基礎:幾乎所有應用平臺都會用到一些在機器上運行的平臺軟件。它們的各種支撐功能(如標準的庫與存儲,以及基本操作系統等)均屬此部分。

一組基礎設施服務:在現代分布式環境中,應用平臺經常要用到由其他計算機提供的基本服務。比如遠程存儲服務、集成服務及身份管理服務等。

一套應用服務:隨著越來越多的應用平臺面向服務化,這些平臺提供的功能可為新應用所使用。盡管這些新應用主要是為最終用戶提供服務的,但這同時也令它們成為應用平臺的一部分。

云平臺是由搭載了云平臺服務器端軟件的云服務器、搭載了云平臺客戶端軟件的云電腦以及網絡組件所構成的,用于提高低配置或老舊計算機的綜合性能,使其達到現有流行速度的效果。

彈性虛擬計算:根據企業不斷變化的組織架構、管控模式和業務需求,云平臺能為企業云應用服務快速提供動態、靈活、彈性、虛 擬、共享和高效的計算資源服務。

智能監控運維:云平臺能實現對計算資源、存儲資源、網絡資源、云應用服務7×24小時全時區、多地域、全方位、立體式、智能化的IT運維監控,保障IT系統安全、穩定、可靠運行。

云服務平臺中數據服務包括錄入、采集、整理、加工基于CNONIX標準的圖書產品信息元數據內容工具。而系統具有以下功能。

(1)具有CNONIX數據的錄入加工功能

(2)具有CNONIX數據的校對功能和有效性檢查功能

(3)具有數據向CNONIX的轉檔功能

(4)具有數據安全性保護和備份功能

(5)具有多級用戶管理功能

上海新華傳媒在CNONIX云平臺的建設上,采用了目前先進的高性能和高可用構架的數據分析系統,運用Hadoop分布式數據庫、Spark集群計算環境和Nginx輕量級的Web服務器/反向代理服務器。此外,其還使用zabbix實現了對系統和網絡的有效監控。

2.CNONIX標準數據采集、加工、轉換、交換、驗證的目標

書目CNONIX標準數據采集系統的建設目標是建立一套架構合理、功能齊全、運行穩定的CNONIX標準數據加工系統。該系統除了應具備ERP原新書目補錄功能,還需要與企業內的ERP、WMS、Mark/Calis數據,企業外的圖書供應商、圖書館等進行全面的無縫對接,滿足實時高效、安全穩定的要求。系統需具備良好的可擴展性,同時能根據公司現有ERP系統的現實情況和對內對外的各種數據源整體制訂相應的流程。

書目數據的CNONIX數據轉換設計目標是實現書目數據按照中國出版物在線信息交換圖書產品信息格式規范(GB/T 30330-2013)的要求,實現標準CNONIX格式數據的輸出。數據交換的要求為建立相應的數據接口,高效安全地和上下游進行CNONIX標準數據的交換。數據驗證的要求為采集、加工、轉換、交換的數據符合國家CNONIX實驗室的驗證要求,并通過驗證。

3.探索拓展符合CNONIX標準的“數字出版物業務數據系統”建設

(1)搭建符合CNONIX標準的數字出版物數據庫。上海新華傳媒以已有的數字出版物中心書庫為基礎,結合CNONIX格式文件,增加數字圖書新的元數據字段,擴充原有中心書庫數據的圖書記錄信息。主要數字圖書相關的擴充信息包括:數字產品技術保護;數字產品使用限制;數字產品使用類型(預覽、印制、復制/粘貼、共享、文本朗讀、借出);數字產品使用狀態;數字產品使用限度(復合元素)(無限許可、有限許可、禁止使用);數字產品數量;數字產品使用單位(份數、字符數、單詞數、頁數、百分比、設備量、并發用戶、不同時間段的內容百分比、天數、次數)等。其他一些非數字圖書相關的元數據將同時建立,以便我們未來可以根據數字書號直接查詢到對應紙質書籍相關的圖書信息。此模塊搭建完成后,出版社可直接在平臺中按照CNONIX標準填入數字圖書相關信息數據。

(2)調整現有系統及流程,以滿足新標準數據的錄入和轉出。為了滿足符合CNONIX數據格式標準的需求,公司原有的轉檔流程以及相關系統將升級改造。對于一些數字產品需要輸入的字段,我們將開發新的輸入程式以供轉檔人員在轉檔環節增加錄入。如未來CNONIX的云服務平臺搭建完成后,一些圖書的基本信息(如作者、書名、簡介等)不再需要通過掃描電子書后獲取,而是直接由接口訪問CNONIX云服務平臺,根據數字圖書的唯一編號獲取可訪問信息后下載使用,如此,不僅減少了掃描過程中數據的錯誤率,而且極大地提升了轉檔效率。

對企業已有的數字圖書銷售數據以及各閱讀器所采集的用戶閱讀行為數據,我們也將開發新系統,將數據整合后導入本地CNONIX數據庫,再由上傳接口上傳到企業CNONIX云服務平臺,達到和紙質書結合分析統計的目的。

在CNONIX標準下,我們計劃搭建企業內的數據服務云平臺的數據接口,從而實現數字圖書的完整數據統計目標。接口部分將采用Microsoft .NET框架建立跨平臺的Web Service服務,將數據格式轉成標準的XML格式加密傳遞。平臺接口搭建完成后,只需將標準的格式化數據提供給企業內部的數據服務云平臺即可,例如ISBN編號、圖書定價等。

4.CNONIX將應用在圖書行業數據分析系統中

統一、標準的元數據有利于出版發行行業的大數據分析。CNONIX標準的推廣應用,給出版發行行業一個良好的契機來推動本行業的大數據發展。上海新華傳媒的云服務平臺將利用大數據技術定期提供包含出版數據、流通(零售)數據、數字圖書館閱讀數據的分析和研究。為出版發行的大數據分析開發出更加智能化的行業大數據平臺,實時提供包括購買行為分析平臺、閱讀行為分析平臺、預測模型建立等,成為專業型大數據庫。通過大數據分析,我們可以為行業和政府管理部門定期提供以下報告。

(1)圖書市場監測報告

(2)圖書監測銷量排行

(3)書店采購指南

(4)出版社/集團報告

(5)區域市場分析報告

(6)數字圖書閱讀分析報告

(7)圖書館讀者行為分析報告

通過以上報告,我們可以對行業進行大數據分析,包括出版的大數據、發行的大數據、零售的大數據等。

出版的大數據,意味著出版已經不再是靠經驗和直覺,而是需要大量的數據支持。圖書在出版階段,包括策劃、編輯、營銷的各個過程中都需要相關云端數據的支持。企業利用已有的信息平臺,已匯集了300萬種圖書出版數據,和自2004以來的25個省、自治區、直轄市1500多家大中型書店的零售數據,以及數字圖書的大量圖書館借閱原始數據。這個云平臺可以為出版社提供海量的信息,包括誰在看書、看什么書、年齡構成、特定圖書的歷史銷售、地區銷售差別、定價策略等。CNONIX標準的應用,使圖書出版數據、流通數據、借閱數據三個云數據庫標準統一、信息關聯更加方便。圖書數據CNONIX標準化將為出版大數據分析提供更加詳細的信息,例如參與者信息不僅包含作者信息,還會有前言、插圖、封面設計等各類相關內容。出版營銷也可以從粗放式轉向數字時代的精準營銷,做到有的放矢。

發行的大數據,意味著發行工作已經不能簡單地依靠傳統經驗,而是“謀定而后動”,即分析相關圖書的歷史銷售數據,圖書發行的數量、時機都將是科學的決策。交易中心云數據平臺提供的實時信息反饋,會及時修正發行策略,提供具體信息,包括及時增印、調整庫存、區域調整等,幫助發行真正做到“隨機應變”。

隨著圖書零售O2O模式的建立、圖書閱讀O2O模式的建立,交易中心采集的這些數據將更加及時、詳細。用戶的購書行為,包括什么時間、地點、出于什么目的而購買、同時買了什么、持續的購買行為等將建立更加詳細的購買行為數據。用戶的閱讀行為,包括什么時間,在哪兒,看了哪本書的哪一頁,甚至每一頁的停留時間等信息,我們都可通過大數據技術精準獲取。

我們的中心核心數據庫和分析系統的CNONIX也將擴容系統,為出版發行的大數據分析開發出更加智能化的行業大數據平臺,包括購買行為分析平臺、閱讀行為分析平臺、預測模型建立等。通過系統集成,我們集合服務器、網絡、存儲硬件,使用商用數據庫軟件、系統中間件和自主開發的行業數據管理軟件,為行業提供高效有用的信息。

上海新華傳媒的CNONIX國家標準實施的整體目標是建成新華傳媒CNONIX云服務平臺數據中心和滬版圖書CNONIX標準書目的加工服務平臺。此外,我們還希望公司的圖書產品及相關信息的數據中心及服務平臺,通過數據清洗等技術手段,成為上海地區的CNONIX數據應用中心。

猜你喜歡
服務平臺
密碼服務平臺
打造一體化汽車服務平臺
福建高速網絡綜合服務平臺
江蘇省一體化在線交通運輸政務服務平臺構建
論基于云的電子政務服務平臺構建
高速公路伴隨式信息服務平臺
醫院銀醫保通自助服務平臺的功能及應用
基于云計算的民航公共信息服務平臺
關注行業前沿 打造專業服務平臺
天津高速公路出行服務平臺的實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合