?

WorldCat標注系統的優化方案

2012-04-29 00:44黃如花劉鎏
圖書與情報 2012年5期
關鍵詞:優化方案

黃如花 劉鎏

摘 要:WorldCat標注系統是分眾分類法在書目信息管理方面的代表,適應了社會化網絡下信息組織的發展趨勢。但是,因其自身在標簽、管理機制、檢索機制等方面存在的不足,一定程度上影響了信息組織的精準度,不利于用戶的實際操作使用?;谶@些分析,文章構建了一個整體優化方案,通過明確標簽含義層次、增加用戶編輯功能、完善用戶社區聚合功能等具體措施對WorldCat標注系統進行優化。

關鍵詞:WorldCat 標注系統 優化方案

中圖分類號: G250.73文獻標識碼: A 文章編號: 1003-6938(2012)05-0016-05

WorldCat標注系統同一般的標注系統一樣,都是由用戶、資源和標簽三個集合構成,具有平面化的組織結構、多維度揭示信息資源、自由隨意性、共享性、社會性和動態自適應性[1]。同時WorldCat標注系統進行標引的資源對象都是已經經過預先規范加工處理過的規范化書目數據,本身就因為主題、著者等因素關聯在一起,是有序存在的。另外,WorldCat標注系統的用戶由成員館用戶和一般用戶組成,前者提供基本書目信息以構成WorldCat全球書目信息數據庫,具有專業的信息資源組織管理能力;后者跟一般標注系統的用戶群體類似,根據自身對資源的理解進行標注,具有差異性和主動性。本文通過對WorldCat標注系統的標簽、管理機制、檢索機制等方面的分析,結合常規標注系統的特點,制訂了優化方案,方案包括前期準備工作、具體實施內容和后期調整完善三個部分。

1 WorldCat標注系統優化的前期準備工作

為了確保針對WorldCat標注系統的優化方案能夠最貼合其實際情況和用戶的實際需求,也為了避免優化方案在實施過程中過多地影響到WorldCat自身的正常運行提供書目信息服務,方案實施之前的準備工作是必須進行的,并可以從四個方面展開。

1.1 全面了解WorldCat標注系統

主要是針對現在標注系統中的用戶、資源和標簽的數量、質量、關聯等方面進行了解,掌握最新的、最為全面的數據統計信息,為后面的數據分析制定詳細的優化方案和實施步驟提供參考。

1.2 詳細調查WorldCat標注系統用戶

主要是針對用戶對現在標注系統的使用滿意度和修改意見的收集、統計和分析。從而確定需要進行優化改進的地方,并且在優化方案中體現用戶的使用需求,力圖讓優化后的標注系統更加吸引用戶的長期和高頻率使用。

1.3 調查了解其它標注系統

主要是針對那些跟WorldCat標注系統有相類似特征的標注系統,比如專門針對書目信息的LibraryThing和亞馬遜標注系統進行調查,了解它們的各個集合和服務模塊的設置和結構,尤其是那些WorldCat標注系統所不具有的功能,應當重點關注,考察是否可以借鑒。

1.4 制訂優化實施方案

基于以上的調查數據,制定一個有具體時間進度、可操作性強的實施方案。需要特別注意的是,該實施方案應當留有可以在實施過程進行調整的余地,同時要注意不會對WorldCat的其它功能造成長時間、高程度的影響。

2 WorldCat標注系統優化的具體內容

2.1 明確標簽的實際含義,構建標簽的層次體系結構

標注系統中的標簽都是以平面形式存在的,缺乏上下級之間的類別管理[2],標簽之間的關聯性弱,加上標簽來自于自然語言本身就存在著同義和異義等容易造成的歧義,使得信息資源按照標簽的聚合會出現差錯,導致檢全率和檢準率得不到較好的保證[3]。WorldCat的標注系統也不例外,以其首頁上的熱門標簽云中的標簽為例。標簽“nonfiction”和“non-fiction”實際上指的都是非小說類文學作品,兩個詞是可以通用的。但是在標注系統中,兩個不同的標簽意味著將本來具有相同特征的信息資源劃分到不同的類別之中,割斷了這些資源之間本來的關聯性。再如,標簽“fiction”和“historical fiction”,前者指的是小說,后者指的是國家年度最佳的小說名單,后者應當從屬于前者,是前者的下位類。但是由于標注系統中標簽的平面無等級性,使得這兩個標簽之間不存在任何類別關聯,也就使得它們分別代表的資源之間沒有建立任何的關聯性。

因此,可以在后臺構建一個對標簽進行后控的詞匯庫,其內容包括基本的同義詞詞表和多義詞詞表,并且這些語詞之間都是相聯系的??紤]到WorldCat的多語種性,每個語種應當選定一個最為權威的成員館來進行關于該語種的語詞庫建設。然后由技術人員進行不同語種之間常用標簽詞匯的關聯賦予工作。同時該詞匯庫開放部分的權限給普通的用戶,用以添加新出現的詞匯和語義以確保該語詞庫能夠與實際的自然語言使用情況保持動態一致。

WorldCat標注系統的特征之一就是其資源對象是已經經過處理的書目信息,本身就是按照傳統的信息組織方法進行規范組織的,具有基本的層次系,按照著者、時間、年份、語種、主題等進行了簡單的歸類組織?;诖?,可以將賦予給同一個資源對象的標簽跟隨該資源歸入到同一個大類之中。標簽根據不同的分面規則劃歸到不同的類別之中,標簽與標簽之間就不再是一個平面結構,而是有了比較明晰的等級層次關系。

2.2 增加針對標簽本身的瀏覽和檢索界面,優化用戶對標簽修改編輯的功能

WorldCat標注系統中對于標簽并沒有比較清晰的管理機制存在。一方面,標注系統中用戶使用過的標簽并沒有按照某種順序排列全部顯示出來也沒有用來查找某個標簽的檢索機制,用戶沒有辦法通過瀏覽或檢索的方式進行標簽的查找;另一方面,用戶在對自己已經使用過的標簽進行編輯或者刪除等管理操作時,相對應的信息資源的被標注情況并沒有得到改變。例如,先給“Decision-making in the absence of certainty:a study in the context of technology and the construction of 21st century academic libraries”一書添加了“圖書館”這樣一個標簽。然后在“我的標簽”界面中對使用過的“圖書館”標簽進行修改,改成“圖書”。理論上,原來被賦予給資源對象的標簽也應該從“圖書館”相應地變成“圖書”。事實上,返回到資源對象的界面,發現筆者對該資源的標注行為變成了兩次,分別賦予了“圖書館”和“圖書”兩個標簽(見圖1)。

[圖1 編輯標簽的出錯示例]

WorldCat標注系統需要增加對標簽的管理機制。該管理機制不僅包括前面提到的對標簽語義和層次關系的后控制,還包括提供瀏覽、檢索機制來方便用戶查找某個具體的標簽和對標簽進行編輯修改。

因此,WorldCat標注系統可以將熱門標簽云中的標簽和所有用戶標注使用的標簽都根據字順等規則進行排列,保持實時動態性,保證用戶新添加的標簽也能夠快速地出現在標簽列表中。標簽的檢索設置只需要提供簡單的語詞檢索即可,由于標簽之間通過后控實現層級化和關聯化,可以在用戶獲取檢索結構的同時顯示與該標簽相關的其它標簽選擇,實際上擴展了用戶的檢索范圍。同時,需要在WorldCat首頁的熱門標簽云設置可以方便鏈接到標簽瀏覽和檢索界面的按鈕,確保用戶在熱門標簽云中尋找不到所需要的標簽后能夠快速找到如何進行標簽查找的途徑。此外,WorldCat標注系統需要保證用戶對標簽再編輯的同步性,當用戶對標簽進行修改時,系統應當將這樣的修改同步保存到標簽數據庫中和反映在用戶之前使用該標簽進行標注的信息資源的標簽顯示中。

2.3 構建專門通過標簽進行信息資源檢索的途徑

用戶通過自由標注來組織信息資源,被賦予了相同標簽的信息資源被聚合在一起。這樣的聚合讓用戶可以通過標簽對信息資源進行檢索。標注系統是WorldCat為了適應社會化網絡環境和信息組織管理新趨勢而添加進來的。標注系統本身就包含了一定的檢索功能,主要是通過檢索某個標簽來查找它所相關聯的信息資源。在目前的WorldCat檢索功能中,無論是簡單檢索(見圖2)還是高級檢索(見圖3)都沒有設置提供給用戶進行標簽檢索的途徑。在檢索框中輸入任何檢索詞,即便是該檢索詞在標注系統中已經是某個信息資源的標簽,WorldCat的檢索系統會自動將其默認為按照傳統題名、關鍵詞等方式進行檢索。

[圖2 WorldCat簡單檢索界面]

在WorldCat中唯一能夠進行標簽檢索的方式就是找到這個標簽,通過點擊該標簽進行檢索。但是WorldCat首頁中用來顯示用戶標簽的標簽云中,只是顯示了很少一部分使用頻率較高的標簽,而且WorldCat沒有標簽瀏覽頁面,使得用戶無法找到想要檢索的標簽,也就不能通過標簽的檢索查找到所需要的資源。從這個意義上來看,標注系統利用標簽聚合信息資源以便于用戶快速查找的功能完全沒有發揮出來。

[圖3 WorldCat高級檢索界面]

需要注意的是,雖然WorldCat上原有的檢索方式可以對檢索結果分別按照“相關性”、“著者字順”、“題名字順”和“出版時間”等順序進行排序,但是通過標簽進行檢索的時候,檢索結果并沒有按照一定的規則進行排序,這樣不利于用戶在眾多的檢索結果中獲取自己所需要的信息資源。

為了實現標注系統的檢索功能,可以在WorldCat的簡單檢索界面和高級檢索界面添加“標簽”檢索的途徑,也可以在首頁設置專門的按鈕鏈接到通過標簽進行資源檢索的界面。

WorldCat通用檢索的檢索結果是可以按照相關度、著者等因素進行排列的,這樣有利于用戶在眾多的檢索結果中進行進一步篩選。所以WorldCat標注系統通過標簽對資源對象的檢索,其結果也可以模仿諸如“著者”、“出版時間”等這樣的條件進行排序。除此之外,還可以在頁面右側設置類似的進一步篩選框讓用戶進一步篩選。從而縮短用戶通過標簽檢索并獲取信息資源的所需要的時間(見圖4)。

2.4 構建WorldCat用戶的社群,實現用戶之間的交流和資源共享

標注系統的社區聚合功能能夠很好地將用戶與用戶、用戶與資源用標簽聯系起來,構成了一定規模的社會網絡,并且利用標注系統的運作原理不斷強化和擴展已經形成的社會網絡。對同一資源對象進行標注或保存的用戶和使用相同或相似標簽的用戶被聚集在一起,形成具有相同興趣點和關注點的用戶群體。在群體中,用戶之間交流、共享信息資源,并且運用群體的智慧管理和創造[圖4 WorldCat普通檢索結果的其它篩選條件]

信息資源,體現了社會化網絡環境下網絡用戶之間信息資源的共享和交流。標注系統用戶所具有的交互性從根本上說受到社會化網絡這個大環境的影響,同時,用戶的交互性也推動著標注系統的社會化發展[4]。但是在World

Cat的標注系統中,用戶是松散的。標簽僅僅是將被賦予有同樣標簽的信息資源聚集在一起,而沒有對用戶之間的關系做出關聯,使得用戶沒有辦法形成群體社區。這樣不利于WorldCat標注系統的交互體驗,也不利于其在社會化網絡環境下的進一步發展。

在WorldCat上,用戶與用戶之間唯一的關聯是用戶可以關注另一個用戶自己構建的書目列表,不存在用戶之間真正的信息資源共享和交互活動??梢越梃bFlickr上社群(Groups)的構建,構建用戶之間的社群建設規則。這樣用戶既可以參與到其它社群中的活動也可以自己創建新的社群開放給一定的用戶參與進來,并且這些社群可以通過用戶權限的設置實現隱私和資源的完全公開、半公開和完全保密。

WorldCat標注系統增加用戶之間的交互可以在一定程度上彌補作為社會化網絡環境下的網站對用戶社會性的關注不足。同時基于WorldCat系統用戶是由成員館和普通用戶構成的這一特色,增強用戶之間的交流可以幫助書目信息組織管理的專業人員與普通用戶進行互動,有利于WorldCat的發展和服務質量的提升。

2.5 提供WorldCat標注系統檢索API接口,實現與其它標注系統的互操作

WorldCat中的書目信息來自于其各個成員館,尤其是2003年OCLC開始實施的“開放的WorldCat”(Open WorldCat)計劃允許各成員館和普通用戶以Wjkl的方式對書目信息的評論和標簽進行添加之后,其開放和共享性一直就是WorldCat不斷發展壯大的重要因素之一。但是WorldCat標注系統的開放和共享性較差,既沒有跟其成員館所使用的圖書館標注系統進行對接,也沒有與LibraryThing和亞馬遜這類專門提供書目信息的標注系統關聯[5],不利于WorldCat標注系統中標簽資源的共享。

雖然通過常規的搜索引擎,如谷歌、必應或者百度,仍然能夠檢索到標注網站中的信息內容,但是由于搜索引擎針對的是整個網絡信息資源,覆蓋范圍過于廣泛,會降低查找和檢索的檢全率和檢準率。所以WorldCat標注系統可以借鑒元搜索引擎的架構,構建一個跨標注網站的搜索引擎。每個標注網站自身都設計有通過檢索標簽來查找相對應的信息資源的簡單搜索引擎,跨標注網站的搜索引擎可以以此為基礎進行設計(基本結構見圖5)。

[圖5 跨標注網站搜索引擎的結構圖]

針對標注的跨網站搜索引擎的結構類似于雙層C/S結構:用戶向搜索引擎提交檢索請求,搜索引擎根據這個檢索請求向相連接的多個標注網站自帶的搜索引擎發出實際的檢索請求,然后多個搜索引擎會將獲得的檢索結果返回到跨標注網站搜索引擎,經過去重、合并、排列后反饋給用戶。

最后,借鑒“一鍵分享”的模式實現標簽和資源的跨系統分享。共享無疑是社會化網絡環境最為突出的特征,為了讓標注網站能夠體現并且促進信息的共享,可以借鑒一些視頻和新聞網站的做法,在資源旁邊設置一些可以將該資源快速分享到社會化服務網站平臺,比如微博、人人網的按鈕。

只需要用戶擁有分享目標系統的登錄權限,點擊相應的按鈕,資源便可以即時分享,省去了用戶操作上的麻煩,提高了信息資源分享的效率。標注網站可以效仿這樣的做法,在資源旁邊設置同樣的用來分享該信息資源到其他標注網站的按鈕,通過后臺的插件鏈接,方便用戶將需要的資源、標簽與其他標注網站的用戶共享。

事實上,目前WorldCat的檢索API(Application Programming Interface,應用程序編程接口)已經免費提供給所有需要的用戶[6]。將這個API放到其它應用程序之中,就可以通過它來檢索訪問WorldCat上的書目信息。因此,WorldCat標注系統的檢索功能可以借鑒這個API的開發方式進行,然后將標注系統的API放置到首頁,提供給需要的用戶。除此之外,WorldCat還可以將標注系統的API主動提供給那些已經將其它標注系統用到OPAC中的圖書館,讓兩個標注系統進行鏈接,實現跨標注系統的檢索。如賓夕法尼亞州立大學(University of Pennsylvania)圖書館自行開發使用的PennTag系統,就是一個比較完善的標注系統,該校圖書館同時也是WorldCat成員館之一。WorldCat可以將標注系統的API提供給賓夕法尼亞州立大學圖書館,將WorldCat標注系統與PennTag系統相關聯。用戶可以通過任何一個標注系統的檢索同時獲取兩個系統的信息資源,從而實現標注系統資源的共建共享。

3 WorldCat標注系統優化的后期完善

當所有具體的優化內容都穩妥實施完成之后,還需要對WorldCat標注系統的運行情況、用戶使用情況進行調查分析,對優化方案的成效進行評估,并且對優化后的WorldCat標注系統進行微調。

3.1 了解優化后的WorldCat標注系統

參照準備工作中對WorldCat標注系統進行調查分析的內容,對經過優化的系統重新進行一次全面的了解。然后把獲得的關于標注系統中的用戶、資源和標簽的數量、質量、關聯等方面的情況與優化前的情況一一對比分析。

3.2 調查用戶對新標注系統的使用情況

對用戶包括系統管理人員使用優化后的WorldCat標注系統的情況進行調查。調查的內容主要包括使用者對整個標注系統,尤其是經過優化處理的模塊的使用體驗、滿意度等。將使用體驗與未進行優化時的使用體驗進行比較,為下一步對優化方案成效的評估提供數據參考。

3.3 評估WorldCat標注系統的優化成效

以WorldCat標注系統本身優化前后的情況對比和用戶使用情況優化前后的對比為主要依據,綜合考慮在實施優化的過程中各種人力物力的投入情況,對WorldCat標注系統優化方案的成效進行客觀評估。評估的結果一方面可以作為對優化后WorldCat標注系統進行微調的依據,另一方面可以作為對WorldCat標注系統優化方案進行調整完善的依據。

3.4 完善WorldCat標注系統的優化方案

根據對WorldCat標注系統自身情況和對用戶使用情況的調查,參考其他同類標注系統,制定針對WorldCat標注系統的優化方案。優化方案實施后,根據成效對方案進行評估,再根據評估結果對WorldCat標注系統優化方案進行調整。對于會將WorldCat標注系統性能和客戶體驗顯著提升的優化措施保留并加強,反之則考慮弱化或剔除。

4 結語

WorldCat標注系統作為標注系統的一種,有助于用戶在自己理解的基礎上對書目信息進行組織管理,提高書目信息的使用率。針對WorldCat標注系統的不足,制訂有效的優化方案并實施,能夠充分發揮標注系統的共享功能和社區聚合功能,更好地體現標注系統的平等性、自由性、開放性和交互性。隨著對用戶標注行為和語義網的研究與應用的深化與發展,WorldCat標注系統能夠將其應用到后續的優化之中,充分發揮分眾分類法的優勢,引導和促進用戶對WorldCat中書目信息的使用。

參考文獻:

[1]王英.Folksonomy與傳統分類法的比較分析及其完善研究[J]. 圖書館學研究,2010,(2): 45-47,74.

[2]Thmas Marliesel, Caudle Dana,Schmitz Cecilia. To tag or not to tag[J]. Library Hi Tech,2009,27(3):411-434.

[3]黃建年,侯漢清.關于TAG分類及相關理論問題的研究[J]. 圖書館雜志, 2008, 27(7): 49-52.

[4]易明等.基于社會網絡分析的社會化標簽網絡分析與個性化信息服務研究[J].中國圖書館學報,2010,36(3):107-114.

[5]姚曉鋒.用戶標簽和圖書館主題分類的比較研究——以Librarything為例[J].圖書館學研究,2010,(4): 63-66.

[6]WorldCat Search API(Web service)[EB/OL].[2012-7-16].http://www.worldcat.org/affiliate/tools?atype=wcapi.

作者簡介:黃如花(1968—),女,武漢大學信息資源研究中心教授、博士生導師;劉鎏(1986—),女,武漢大學圖書館學碩士研究生,上海浦東圖書館館員。

猜你喜歡
優化方案
EPON技術在城區網絡優化中的應用
全站儀在數字繪圖中測量方法優化方案
大學周邊健身房滿意度調查報告
證券行業信息系統安全運行問題及優化
湖北經濟消費結構優化研究
山地光伏電站優化方案研究應用與建議
加強施工項目成本管理的思路與對策
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合