?

圖書館中文圖書編目外包數據質量控制分析

2022-07-17 09:07徐新邦
江蘇科技信息 2022年16期
關鍵詞:字段編目書目

徐新邦

(中國國家圖書館 中文采編部,北京 100081)

0 引言

業務外包(Outsourcing)也叫資源外包、資源外置,從20世紀80年代開始流行,是一種全新的企業經營管理模式。業務外包主要指企業保留內部核心業務資源,將原來由內部員工完成的一些非核心業務活動交由外面的企業或機構來完成。這樣不僅可以降低企業經營成本,還能發揮外包團隊的專業優勢,更快更好地完成外包工作,提高企業效率,節省企業的時間成本[1]。

20世紀90年代開始,業務外包以其獨特的優勢以及在IT外包領域的成功運用,逐漸吸引了西方國家圖書館領域的關注,并很快獲得西方各國圖書館的使用推廣,取得巨大的成功。直到20世紀90年代后期,中國圖書館界開始效仿西方國家圖書館界,逐漸引進業務外包這一全新模式,并將其運用于圖書館各項業務中。近二十幾年來國內圖書館業務外包實現快速發展,不僅在各大高校圖書館中獲得認可,還在許多公立圖書館得到不同程度的實施,業務外包應用的范圍也越來越廣[2]。

1 圖書編目業務外包及其優勢

和其他圖書館不同,目前國家圖書館采取的外包模式是館內加工模式。根據圖書編目的標準和要求,業務外包公司派出自己的編目人員到國家圖書館內進行圖書分類、著錄、標引等工作,將圖書制作成合格的MARC數據。在這種外包模式下,圖書館提供一些場地、設施和設備供業務外包公司使用,但圖書編目所需的材料成本和人工費用由業務外包公司自己負擔。為了保證編目數據的質量,國家圖書館提供專業審校人員,對業務外包公司編目人員提交的MARC數據進行抽樣檢查,并撰寫驗收報告[3]。

圖書館引進圖書編目業務外包的方式具有以下優勢:(1)減少圖書館編目人員的數量,節省了大量的人力資源,可以提升圖書館編目人員個人能力,讓其主要從事書目數據校對、質量控制和維護數據庫等工作。(2)縮減經費投入,節省下來的經費可以用于商業數據庫、圖書、期刊等采購工作,豐富館藏資源,更好地服務讀者。(3)提高圖書上架的速度,降低時間成本,解決新書大量積壓問題,讓新書更快地從入館到讀者手上。(4)對于業務外包公司而言,其數據庫的MARC數據稍加修改,就可以適用于各種不同類型的圖書館需求,避免整個社會勞動力的重復浪費。(5)圖書館編目人員可以從繁復的工作中脫離出來,專注于核心業務發展,提高工作積極性,進行更深層次的研究工作,這樣可以促進整個圖書館界發展。(6)通過對業務外包公司書目數據的審校,密切關注書目數據質量,并定期開展針對外包公司編目人員的書目數據制作培訓,提高其編目能力,加強與業務外包公司之間的溝通交流[3-5]。

2 中文圖書書目外包數據錯誤及分類

本文收錄整理了2018年4—9月抽校的3家編目外包公司提交的中文圖書書目數據,按照字段類型分為0XX字段、1XX字段、2XX字段、3XX字段、4XX字段、5XX字段、6XX字段、7XX字段。為了分析書目數據不同字段錯誤之間的關系,將編目數據錯誤分為普通錯誤和關聯錯誤,而普通錯誤主要分為缺失錯誤、多余錯誤、錯著錯誤3類。

缺失錯誤主要包括書目數據中字段、子字段的缺失,還包括字段中部分著錄或標引內容的遺漏。如:009443956(陳勁松著),300字段漏著“國家自然科學基金”,需補充;009471155(李明主編),外包公司提交數據中沒有312字段,需要補充312字段封面英文題名,同時添加一個510字段;009511979(佐克西亞季斯著),200字段$f中“帕季米特里烏”少了一個“帕”字,最后改為“帕帕季米特里烏”。

多余錯誤不僅包括書目數據中字段、子字段或者內容的重復,還包括出現一些額外的字段、子字段或者內容。如:009564067(劉鐵主編),外包公司編目人員著錄了兩個701字段“劉鐵主編”,需要刪除其中一個701字段;009549293(王清遠著),105字段內容特征代碼,圖書中并無書目資料目錄,而編目人員錯誤錄為“az”,最后改為“z”。

錯著錯誤主要包括書目數據中字段、子字段的錯誤使用,還包括內容的錯誤著錄等。如:009487527(霍德尼斯著),102 字段$b出版地區代碼“230100”錯誤,最終改為“230000”;009460337(袁爾銘主編),圖書中原文為“建制沿革”,而編目人員在330字段中錯誤錄作“建置沿革”;009578889(鄭安然著),編目人員同樣在330字段將“自強自立、自得自樂”錯著為“自強自立、自得其樂”;009579378(楊秀清著),701字段$4責任說明 “編著”,被外包公司編目人員錯誤寫成“清著”。

關聯錯誤主要指由于一些字段或子字段的錯誤,引起其他字段或者子字段的錯誤著錄或標引。如:009503018(溫布蘭特著),根據中文書目數據制作規則,200字段$e子字段首字母應小寫,單詞“Toothsome”改為“toothsome”,同時也要改正510字段,所以510字段的錯誤是由于200字段$e子字段的錯誤引起的,屬于關聯錯誤;009609536(蒂瓦里主編),編目人員在690字段分類號標引為TB332,正確標引為TB383,而090字段$a子字段和690字段密切相關,也需要改正;009529712(張宇慶著),100字段閱讀對象代碼em改為kem,同時105字段內容特征代碼z改為v,105字段的錯誤是由于100字段的錯誤引起的,屬于關聯錯誤。

3 中文圖書書目外包數據抽檢統計及數據分析

3.1 3家編目外包公司中文圖書書目數據錯誤數量統計及數據分析

本文選取了3家不同編目外包公司在2018年4—9月提交的中文圖書書目數據(共90車,約29 000條),對其中的編目數據錯誤按照0XX,1XX,2XX,3XX,5XX,6XX,7XX字段(4XX字段太少,不具備統計性)的順序分別進行統計,結果見表1。

表1 3家編目外包公司中文圖書書目數據錯誤數量統計

可以看出,3家編目外包公司在各個不同字段均出現著錄或標引錯誤。其中4XX字段由于字段數量太少,大部分圖書在書目數據制作的過程中不涉及,不具備統計性,所以未進行統計。從表1中可以看到,外包公司1書目數據錯誤的數量明顯多于其他兩家,而外包公司3的錯誤數據數量最少。但是外包公司1大概提交了13 000條中文圖書書目數據,外包公司2提交了約10 500條中文圖書書目數據,外包公司3完成的中文圖書書目數據在3家外包公司中最少,約5 500條數據。經過對比,可以看出:雖然外包公司3的數據錯誤數量最少,但外包公司1和2數據質量反而優于外包公司3。

圖1是3家編目外包公司中文圖書書目錯誤數據數量在不同字段下的柱狀對比圖??梢钥闯?,3家編目外包公司中文圖書書目錯誤數量上均呈現出中間高、兩頭低的現象。3XX字段是每一家外包公司出現數據錯誤最多的字段,而0XX和7XX字段是著錄錯誤出現較少的字段。這表明中文圖書書目外包數據審校工作的重點在中間部分,涉及3XX字段、2XX字段、5XX字段、6XX字段。

圖1 編目外包公司中文圖書書目錯誤數據數量在不同字段下的柱狀對比

分析上述情況,在中文圖書書目數據中,0XX和7XX字段的種類較少,制作時確定性較強。而3XX字段包含300,304,305,306,310,312,314,330等字段,編目人員需要一定的工作經驗,不然很容易在著錄的過程中混淆,將本應著錄在304字段的信息放在312或者314字段中,或者把應該放在305字段的內容錯誤放在306字段里。另外330字段內容提要工作量較大,直接影響中文圖書書目數據制作的快慢,而編目外包公司一般實行計件工資,編目人員薪酬與完成書目數據的數量密切相關,這就促使編目人員在著錄330字段過程中容易為了追求數量而忽略了質量。

圖2 各字段中文圖書書目錯誤數據數量分布

圖3 各字段關聯錯誤和普通錯誤占比

圖2為各字段中文圖書書目錯誤數據數量分布圖,可以看出3XX,2XX,6XX字段錯誤數量位列前三。2XX字段包括200,205,210,215等,其中200字段既是重點字段,也是難點字段。在題名選取過程中,編目人員要在不違背基本著錄規則的情況下,從多個角度考慮問題,將復雜的題名信息判斷出來,正確地放在200字段中每一個題名子字段中[6]。6XX字段錯誤數量較大,表明編目人員對中國圖書館分類法以及如何進行分類標引不熟悉,需要進一步的業務培訓和指導工作。

3.2 編目外包公司中文圖書書目錯誤數據數量分類統計及數據分析

本文在統計3家編目外包公司中文圖書書目錯誤數據數量過程中,將普通錯誤和關聯錯誤分開進行統計,結果見表2。

從表2可以看出,1XX字段、2XX字段關聯錯誤數據數量為0,出現關聯錯誤的數量明顯少于其他字段,而3XX字段和6XX字段關聯錯誤的數量也不多,出現最多關聯錯誤數據的字段則是5XX字段。由圖2可知,3XX字段、2XX字段、6XX字段著錄或標引的錯誤數量排名前三,但從表2發現3XX字段、2XX字段、6XX字段關聯錯誤數量很少,這表明3XX字段、2XX字段、6XX字段更多的是自身性錯誤,受其他字段數據的影響較弱,相互之間也不容易影響。減少3XX字段、2XX字段、6XX字段錯誤數據數量,將顯著降低書目數據錯誤數量,大幅提升編目外包公司中文圖書書目數據的質量。

表2 編目外包公司中文圖書書目錯誤數據數量分類統計

為了研究不同字段中關聯錯誤在編目錯誤中的占比,本文根據表2中的數據進行計算,結果見圖3。

5XX字段主要包括510,512,516,517,540等字段,這些字段受其他字段影響較大。在圖3中,5XX字段關聯錯誤在編目錯誤中占比接近90%,在所有字段中比重最高。5XX字段中使用最多的是510字段、517字段,而它們的著錄跟200字段、312字段密切相關。只要200字段、312字段在著錄過程中出現錯誤,510,517字段也必然出現錯誤。另外0XX字段也有類似的情況,當690字段、701字段、711字段出現著錄錯誤時,090字段也會錯誤著錄。另外,在1XX,2XX,3XX,6XX字段中,關聯錯誤的占比極低。這表明:書目數據質量控制工作的關鍵點不能放在0XX字段、5XX字段上,而應該重點放在3XX,2XX,6XX字段上。減少3XX字段、2XX字段、6XX字段的數據錯誤量,不僅可以減少其自身的錯誤數量,還能減少0XX字段、5XX字段等其他字段的數據錯誤量,這樣可以更快地減少中文圖書編目錯誤數據數量,大幅提高圖書館書目數據整體質量。

4 總結

在圖書館編目業務外包的實施過程中,圖書館界有效釋放人力資源短缺的壓力,增加館藏資源,服務更多的讀者,促進了圖書館多元化發展。本文在總結某一段時間3家編目外包公司的抽校報告過程中,對其中最關鍵的錯誤數據進行統計分析,同時將錯誤數據進行分類。經過對錯誤數據的數理統計可以看出,中文圖書書目錯誤數據分布呈現出中間高、兩頭低的現象。在錯誤數據數量上,3XX字段處于絕對領先的地位,而2XX字段和6XX字段其次,0XX和7XX最少。同時通過對關聯錯誤數據的統計分析,0XX字段、5XX字段錯誤數據數量較多,受其他字段的影響較大。雖然3XX字段、2XX字段、6XX字段編目錯誤數據數量排前三,但關聯錯誤數據數量非常少,而且其關聯錯誤數據數量在編目錯誤中占比很低。所以3XX字段、2XX字段、6XX字段編目錯誤無論在數量上還是關聯性上,都處于最重要的位置,為書目數據質量控制工作指明了方向。在數據審校以及業務培訓中,要加強編目人員對3XX字段、2XX字段、6XX字段的理解,讓其熟練掌握3XX字段、2XX字段、6XX字段的著錄或標引,這樣不僅能減少3XX字段、2XX字段、6XX字段的數據錯誤量,還可以相應減少0XX字段、5XX字段的數據錯誤量,更快地減少中文圖書編目錯誤數據數量,大幅提高圖書館書目數據整體質量。

猜你喜歡
字段編目書目
推薦書目《初春之城》
國家圖書館藏四種古籍編目志疑
淺談臺灣原版中文圖書的編目經驗
粵劇編目整理之回顧與展望
CALIS聯機合作編目中的授權影印書規范著錄
網絡環境下圖書館編目工作問題探討
CNMARC304字段和314字段責任附注方式解析
無正題名文獻著錄方法評述
關于CNMARC的3--字段改革的必要性與可行性研究
本刊郵購書目
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合