?

英文科研文獻數據庫平臺網站中信息構建理論的體現
——以Scientific Research Publishing為例

2016-12-07 02:54黃明煥
電腦與電信 2016年7期
關鍵詞:領域

黃明煥

(廣東機電職業技術學院外語商務學院,廣東 廣州 510000)

英文科研文獻數據庫平臺網站中信息構建理論的體現
——以Scientific Research Publishing為例

黃明煥

(廣東機電職業技術學院外語商務學院,廣東 廣州 510000)

科研文獻數據庫信息構建工作對于輔助科研人員開展科學研究活動具有重大現實意義。本文從組織系統、導航系統、搜索系統以及標簽系統的開發入手,對以Scientific research publishing網站為代表的英文科研文獻數據庫網站中信息構建理論的體現進行了分析,并對英文科研文獻數據庫網站的信息構建工作的機遇和挑戰進行了歸納。

信息構建;用戶需求;英文科研文獻

1 引言

信息構建(Information Architecture,簡稱IA)一詞由美國建筑師理查德·沃爾曼(Richard Saul Wurman)1975年創造。1989年,沃爾曼在其著作《信息懸念(Information Anxiety)》一書中對信息構建提出完整定義,認為信息構建是指“組織、標識、導航和檢索系統的設計,目的是幫助用戶查找和管理信息”,核心思想是“讓信息可理解”和“把復雜變為清晰”[1]。

進入21世紀以來,IA核心思想在國內外不少網站數據庫建設中得到體現和發展,這與專業網站數據庫開發迫切希望適應網絡信息爆炸這一時代背景的現實性需求密切相關。皮特·羅森菲爾德(Peter Rosenfeld)和勞里斯·莫威爾(Louris Morville)在其著作《Web信息架構:設計大型網站(第三版)》中指出,IA是“共享信息環境的結構化設計,網站和企業網絡的組織系統、標簽系統、搜索系統以及導航系統的組合”[2]。我國學者周曉英在《基于信息理解的信息構建》一書中,將“信息的清晰化、可理解、有用性和可用性強以及良好的用戶體驗”作為網站IA工作的四個目標[3]。

2 用戶需求分析

2.1 科研文獻數據庫信息的構建意義

本文提到的科研文獻數據庫指的是,針對作者以其本人的研究成果(如實驗、觀察、調查研究等的結果)為素材寫成的專著、期刊論文、科技報告、學位論文等原始創作量大、無序、分散等問題,人們收集、整理、加工、著錄其特征如著者、篇名、分類、主題、出處等,并有序編排,形成包括索引、文摘、目錄及相應的數據庫[4]。有效開展科研文獻數據庫信息構建工作,對于輔助科研人員開展科學研究工作的自我定位、選題、收集資料、確定研究方法等各個環節具有重大現實價值。

2.2 互聯網時代科研文獻數據庫的發展趨勢

科技全球化背景下,英文已成為跨國科技交流合作最主流的工作語言。而計算機技術的蓬勃發展,互聯網技術的加速升級和普遍應用,給科研文獻數據庫從內容到形式帶來了深刻變化,主要表現在:

(1)科研文獻數據語言的英文化:《Ei Compendex收錄期刊標準》一文指出,主流的科研文獻數據庫都將英文文獻的質量和數量作為評價該期刊是否為世界級期刊的準則之一[5]。烏利希期刊指南收錄有50,443種學術期刊。其中,64.4%是英語期刊,7.8%是漢語期刊,7.6%是德語期刊。在1946年—2008年,官方語言為非英語的國家英語學術期刊的創刊量與全世界范圍內的英語學術期刊創刊量曲線走向一致,都呈現出急劇上升的趨勢[6]。

(2)科研文獻數據儲存形式的數字化:80年代以后,在互聯網技術蓬勃發展的背景下,以電子信息資源為對象的機讀型文獻儲存技術日趨完善,為各國使用者普遍接受和采用??蒲形墨I形式由紙質文獻為主發展成為電子文件、電子出版物、網上文獻、網上資料、網上出版物等多種數據資源為主。進入互聯網時代之后,數字化資源因其網絡化、可發現、可計算、易交換、易關聯等優點,迅速成為科研文獻的首選儲存形式。

(3)科研文獻數據的海量化:進入21世紀,全球科技水平顯著提升,研發周期普遍縮短,科研成果傳播的手段更加多

元化,更多新興交叉學科的出現和發展,推動全球科研文獻數量激增。以生物多樣性歷史文獻圖書館(BHL)為例,截止到2016年6月,該館匯總圖書已達184,140冊,共計49,538, 618頁[7]。在醫學文獻領域,國際知名生物醫學數據庫PUBMED數據量每年以60萬至70萬余條的速度遞增,EMBASE每年新增記錄50萬條[8]。

(4)科研文獻數據的多元化:數據挖掘技術、信息傳播技術的迅猛發展,推動了科研文獻數據量的急劇增長,這為更多企業、行業組織投入文獻數據庫建設提供了更多的便利。當前,科研文獻數據的獲取已由公共圖書館、檔案館、文獻情報機構等公共渠道為中心,發展成為公益性、商業性、行業性等多種屬性科研文獻網絡數據庫交叉發展的態勢。各種文獻數據庫在收錄文獻類型的選擇上也各具特色。

表1 部分英文文獻數據渠道收錄文獻類型一覽表[9]

(5)科研文獻數據的網絡化:海量數據時代,網絡信息具有更新快、數據面寬、時效性強等特點,成為科研文獻數據檢索的主流。近年來,隨著第三代搜索引擎技術的智能性、精準度和搜索面不斷提升,谷歌學術、微軟學術和百度學術等互聯網學術資源搜索平臺在科研工作中的應用更加廣泛。

(6)科研文獻數據檢索方式的智能化:數據庫檢索方式歷經了文獻、索引等為代表的手工檢索階段、計算機信息檢索階段和網絡信息檢索階段。Web 2.0時代,第三代搜索引擎自然語言處理技術更加成熟,為了順應這一趨勢,國內外數據庫檢索平臺整合資源,引入智能輸入提示、長句子自動切分、機器智能識別用戶需求等技術,變得更加智能[10]。

3 信息構建理論在美國科研出版社(Scientific Research Publishing)數據庫網站建設中的體現

美國科研出版社(Scientific Research Publishing:SRP),是全球最大的開放讀取刊物出版商之一,目前擁有200多種可供開放讀取的在線同行評議刊物,涵蓋物理、化學、醫學、生物、數學、通信、計算機、電力、能源、工程等學科領域,審稿委員達到5000名。到2015年12月31日為止,該出版社已出版文章超過51,569篇[11]。

3.1 組織系統的設計

核心內容:展示信息,做好內容分類,滿足專業用戶的典型需求。

本網站(http://www.scirp.org/Index.aspx)專業用戶除了文獻讀者,還包括需要發表期刊論文、會議論文的投稿人,需要出版專著的作者,圖書館管理人員、圖書經銷商以及需要英文翻譯或校正服務的科研人員。專業用戶的需求可劃分為信息需求和功能需求兩大塊:

(1)用戶的典型信息需求

包括:本數據庫的特色、收錄文獻的類別與范圍、出版成果規模、出版社資質、期刊編委會成員、網站使用方法、投稿需知、訂購指南、參會指引、出版社聯絡方式等。

(2)用戶的典型功能需求

包括:論文、圖書等科研文獻數據的檢索與下載、期刊信息檢索、會議信息檢索、會議論文集檢索與購買、論文提交、會議報名、站內咨詢等。

本網站組織系統的設計,體現在通過組織體系和結構的設計,較好地解決了用戶瀏覽網頁時產生的“這里是哪兒”、“這里有什么”、“為什么選擇我”、“應該如何做”等問題。

圖1 美國科研出版社網站組織系統

3.1.1 組織體系

采取精確性排列(字母、年表、地理位置)和模糊性排列(主題、任務、用戶、隱喻和功能)相結合混合式組織體系,例如:期刊列表的排列通過兩種排列法同時展示。

圖2 期刊列表(標題首位字母+學科主題排列法)

3.1.2 組織結構

分為兩步走:網站首頁+子網站。

網站首頁鏈接可以劃分為頂部、左側、右側和底部共4個板塊。頂部板塊對應全站導航鏈接。全站導航除了首頁鍵外,另有論文、期刊、圖書、會議、服務、博客、論文提交共7項。它們是用戶的典型需求的體現。右側板塊是重心,用于出版社核心業務活動的動態展示。這也是用戶最為關心的內容。左側板塊類似于輔助,包括出版社業務的整體展示、用戶指南、在線咨詢等次級的用戶信息需求和功能需求。底部板塊的組織手法較為傳統,用于單位簡介、站點地圖等鏈接。

為了避免同一頁面層級過深可能帶來的負面觀感,針對信息量大、需分層級構建的情況采取子網站/網頁鏈接的辦法。

表2 網站首頁主要鏈接情況

對應網頁對應網頁對應網頁對應網頁右側右側右側著名科研文獻庫站點下部居中Scientific Research Publishing Open Special Issues Recently Published Papers Cross Ref,PORTICO,Google Scholar,Open Access Library, PMC, EBSCO,CABI,Thomson Reuters, Pro-Quest About SCRIP Sitemap News Jobs期刊推薦議題征稿近期發表論文關于我們站點地圖動態新聞工作啟事底部居中底部居中底部居中底部居中對應網頁對應網頁對應網頁對應網頁

3.2 導航系統的開發

核心內容:協助用戶在不同的內容板塊之間移動,在頁面、情境之間切換,提高瀏覽信息的靈活性和網站使用的便利性。

開發結構:全站導航(Home,Articles,Journals,Books, Conferences,Services,Blog,Submit);區域導航(Journals by Subject、Journals by Title等);情境嵌入式導航(Cross Ref, PORTICO等);輔助導航(Sitemap等)。

如圖3所示,用戶在網站任意層次,都可以通過全站導航直通網站的重要區域和功能。

圖3 美國科研出版社網站導航系統流程

3.3 檢索系統的建設

核心內容:基于用戶的信息需求和搜尋行為構建系統搜索查詢模型。

圖4 首頁期刊、圖書、會議檢索(標題、關鍵詞、作者等)

圖5 期刊論文檢索(論文標題、關鍵詞、摘要、作者、數字對象唯一標識符、國際標準連續出版物編號、作者工作單位、領域)

圖6 會議活動檢索(字母、年表、時間先后、地理位置、主題等)

網站結合自身服務特點,圍繞用戶就期刊、圖書、會議、期刊和論文等核心的信息查詢需求,根據不同的搜索水平和動機、信息需求類型傾向設計可面對多元化信息檢索任務的搜索系統。

3.4 標簽系統的設計

核心內容:形成網站語言表達風格,推動網頁結構清晰化,在視覺上提高用戶對于網站信息的理解。

表3 網站首頁主要標簽設置概況

圖標型(1)美觀、直觀圖標型(2)易于理解圖標圖標型(3)Cross Ref,PORTICO, Google Scholar OpenAccess圖標型(4)Pdf(469k) Text Contact, Voice Contact著名科研文獻庫站點鏈接開放下載標識文章格式、文件大小站內咨詢工具

從美國科研出版社網站標簽系統來看,標簽系統的一致性,不僅指同等級標簽在版面形式(字體、字號、英文字母大小寫、顏色等)和語法上保持一致,還體現出同一風格體系下不同等級的標簽的差異性。如導航系統(選項3)的標簽設置在字體、顏色上與其它導航系統標簽有顯著不同。標簽詞的選擇應做到概念清晰、定義范圍科學。與文字標簽相比,使用圖表標簽通常更加美觀、直觀,表達上更加生動。如本網站使用的開放下載圖表頗具特色,能夠鮮明地表現文獻數據庫的最大特點——開放性。

4 結語

計算機技術和通信技術高速發展的今天,信息資源呈爆炸式增長,給英文科研文獻數據庫網站的信息構建帶來的有機遇,也有挑戰。

(1)隨著個人移動終端日益普及,移動互聯網技術不斷進步,越來越多人選擇使用智能手機或者平板電腦檢索、下載與閱讀電子文獻資料、圖表資料,分享更新的網絡數據。研究如何通過信息構建,使用戶在個人移動設備上同樣能獲得良好的英文科研文獻數據庫體驗富有意義。

(2)大數據時代特有的3V特征,即大數據量(volume)、快速的產生速度(velocity)、多樣性(variety),為數據庫開發建設帶來海量實時、豐富的數字資源,也使數據庫網站的信息構建能力,包括后臺的數據處理、分析和檢索能力面臨著空前的挑戰。

(3)以高速度、大容量、高保真為特征的計算機和網絡技術的發展,使得全球范圍內合作開發和共享數字化資源成為可能。當前,全球范圍的電子圖書資源共同開發與開放共享已成定勢。對于現有的英文科研文獻數據庫而言,研究未來如何拓展個性化服務滿足用戶需求,形成特色競爭力已經刻不容緩。

[1]劉強,曾民族.信息構筑體系及其對推動信息服務業進步的影響[J].情報理論與實踐,2003(1):1-7.

[2]Peter Rosenfeld,Louris Morville.Web信息架構:設計大型網站(第三版)[M].北京:電子工業出版社,2008.

[3]周曉英.基于信息理解的信息構建[M].北京:中國人民大學出版社,2005.

[4]羅愛靜.醫學文獻信息檢索(第2版)[M].北京:人民衛生出版社,2010.

[5]Peter C.Katz,Mary C.Berger.Ei Compendex收錄期刊標準[J].哈爾濱工業大學學報,2001(6):872-874.

[6]陳理斌,武夷山.世界學術期刊出版語言選擇現狀與趨勢[J].科技管理研究,2011(1):35-43.

[7]Biodiversity Heritage Library.now online[EB/OL].http://www. biodiversitylibrary.org,2016.6.

[8]劉雷.大數據時代的生物醫學及其面臨的隱私保護問題[A].見:CODATA中國全國委員會編.大數據時代的科研活動[C].北京:科學出版社,2014.

[9]吉久明,孫濟慶.文獻檢索與知識發現指南(第2版)[M].上海:上海人民出版社,2013.

[10]胡杰.文獻檢索課案例教學的失效性分析[J].大學圖書情報學刊,2014(3):89-110.

[11]Scientific Research Publishing.about SCIRP[EB/OL].http:// www.scirp.org/AboutUs/Index.aspx,2016.6.

Practice of Information Architecture Theory in the Database Platforms of the Scientific Research Literature in English Language:the Website Construction of Scientific Research Publishing

Huang Minghuan
(Guangdong Jidian Polytechnic,Guangzhou 510000,Guangdong)

Information architecture is significantly effective for helping the researchers to carry on the scientific research activities.This paper analyzes the practice of information architecture theory in the website of Scientific Research Publishing in its construction of organization system,navigation system,search system and labeling system,which represents the database platforms of the scientific research literature in English language.The paper also summarizes the opportunities and challenges for the information architecture efforts of database platforms of the scientific research literature in English language.

information architecture;user demand;scientific research literature in English language

G353.1

A

1008-6609(2016)07-0110-05

黃明煥,男,江西撫州人,碩士研究生,助理研究員。研究方向:英文情報學研究,涉外行政管理人才培養研究,區域合作機制研究。

猜你喜歡
領域
電子戰領域的爭鋒
將現代科技應用于Hi-Fi領域 Perlisten S7tse
2020 IT領域大事記
領域·對峙
自動化在機器人領域中的應用
別在必敗的領域里競爭
如何理解健康領域的“特許經營”
新常態下推動多層次多領域依法治理初探
肯定與質疑:“慕課”在基礎教育領域的應用
馮契在辯證邏輯領域的創見
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合