?

面向知識服務的干部人事檔案知識庫構建初探

2023-07-22 02:48李澤鋒焦浩葉丹云鄭州航空工業管理學院信息管理學院
浙江檔案 2023年6期
關鍵詞:知識庫本體檢索

李澤鋒 焦浩 葉丹云/鄭州航空工業管理學院信息管理學院

干部人事檔案是組織人事部門對干部進行任免、調配、教育培養、考察監督、職級晉升等的重要依據,是反映干部個人德、能、勤、績、廉等方面情況的全面原始記錄,在組織人事工作中發揮著重要的憑證查考、輔助決策作用。在知識經濟時代,如何提升干部人事檔案的利用服務效能、滿足用戶的知識需求已經成為檔案領域關注的重點問題。檔案知識庫可對檔案資源進行整合加工處理,實現語義關聯,形成知識資源為用戶提供相應的檔案知識服務[1]。由此可見,檔案知識庫為革新干部人事檔案的利用服務方式提供了解決方案。

國內外關于檔案知識庫的相關研究呈方興未艾之勢,對相關研究進行梳理后發現,國內研究成果主要圍繞檔案知識庫建設的理論基礎研究[2-3]、實踐路徑研究[4-7]以及各類知識庫研究[8-10]等;國外相關研究則集中于檔案知識庫理論[11]、架構[12]以及相關技術[13]應用等方面,由此可見國內外關于檔案知識庫的研究已初具規模。進而對干部人事檔案知識庫有關研究進行梳理,發現僅有周娟娟等[14-15]構建了符合干部人事檔案特征的知識圖譜,探究了服務方式向知識決策轉變的可行性,為創新干部人事檔案的服務方式提供了借鑒。依據現有研究來看,盡管我國檔案知識服務和知識庫研究已經有所發展,但是關于干部人事檔案知識服務的研究仍處于初步探索階段,亟需學者進行深入的探索。因此,本文從知識服務的視角,探索干部人事檔案知識庫的構建及應用,助力干部人事檔案的利用服務建設。

1 干部人事檔案知識庫價值闡釋

1.1 保障干部人事檔案服務質量

干部人事檔案服務質量的高低是衡量干部人事檔案是否有效發揮其作用的體現,其本質是檔案信息滿足規定或潛在需求(需要)的程度和水平?!陡刹咳耸聶n案工作條例》中明確要求檔案信息應“真實準確、完整規范、方便利用”?,F階段已有部分干部人事檔案完成數字化工作,可以通過干部人事檔案管理系統以關鍵詞檢索等方式查詢干部個人信息。但檢索結果多顯示為粗粒度的文檔,無法精準定位用戶所需信息以便利用。且檔案審核工作皆由人工開展,受制于審核人員的技術和算力,審核工作更多是針對材料的真實完整與否進行判定,難以展開內容數據層面的關聯推算從而形成數據真實性、完整性的科學研判。干部人事檔案知識庫以數字化檔案為原材料,經過加工、組織加上一定的推理規則組成[16],通過引入數據挖掘領域相關技術,將各類檔案資源整合在一起,深入挖掘分析檔案內容,能夠在語義和知識層面細粒度地組織關聯干部人事檔案知識內容,既能實現細粒度的檔案知識表征,形成可視化的干部個人數據鏈、個人關系網、領導班子與領導干部整體情況分析圖,又能對數據真實性、完整性等進行智能研判,為組織人事工作提供真實、全面、可視化的檔案知識資源,保障干部人事檔案服務質量。

1.2 提升干部人事檔案利用效率

干部人事檔案的主要內容和分類涵括履歷類、考核鑒定類、學歷學位、專業技術職務(職稱)、學術評鑒和教育培訓類等十大類材料。由于各類干部人事檔案中具有交叉關聯的內容,傳統干部人事檔案管理系統通常以簡單的分類標引方式進行條目著錄以提供利用服務,將會影響用戶的查閱效率。干部人事檔案知識庫擔負知識提供者的重任,以關聯組織、可視化的干部人事檔案知識服務用戶,輔助組織人事部門及其干部人事檔案工作機構、因工作需要查閱檔案的用戶快速深入地了解干部個人信息或者領導班子情況,進行科學高效的決策,在滿足用戶知識需求、提升檔案利用效能的同時,提升干部人事檔案服務效率。

1.3 創新干部人事檔案服務方式

在知識經濟時代,干部人事檔案的利用服務仍主要以經過加工掃描等技術手段形成的數字圖像和數字文本為主,停留在信息服務層面,未能深入挖掘干部人事檔案的信息和數據,無法充分發揮干部人事檔案蘊含的知識價值[17]。然而組織人事部門在研判干部職級晉升、進行政治審查等工作時,通常需要的是分散在不同文檔中的知識片段,亟需高效率整合的知識服務。干部人事檔案知識庫開拓了檔案知識服務方式、方法的新思路,打破了以往的粗粒度檔案信息服務方式,深度挖掘與開發檔案數據資源,實現以知識為導向的干部人事檔案智能知識服務,提升組織人事部門的決策效率。

2 干部人事檔案知識庫邏輯架構設計

干部人事檔案知識庫以干部個人為核心,以各類檔案數據為載體,將組織、人、時、地、事五大要素作為數據維度對離散、碎片化的知識片段進行組織關聯,形成可視化的知識網絡,從而實現智能化知識服務。本文結合干部人事檔案數據的特征和知識需求,采用分層架構體系結構,將干部人事檔案知識庫自底向上劃分為知識獲取層、知識組織層、知識服務層,如圖所示。

2.1 數據獲取層

數據獲取層是干部人事檔案知識庫邏輯架構的基礎,主要負責采集、保存和鑒定干部人事檔案數據,并進行序化處理以形成粗粒度知識單元,為知識組織層夯實數據資源基礎。該層涵括數據采集模塊、數據加工模塊和數據鑒定模塊。

2.1.1 數據采集模塊。數據采集模塊的主要功能是準確地識別、提取與干部個人相關的不同來源和格式的歷史記錄數據,為知識組織提供知識來源。中央組織部統一制定了干部人事檔案的管理體制、具體內容和分類標準等,形成了較為規范的數據存儲格式、檔案目錄數據庫、元數據信息等,為數據采集提供了便利。數據采集來源主要涵括兩個方面,一是經過數字化加工形成而保存于干部人事檔案管理系統的結構化數據、半結構化數據和非結構化數據;二是與稅務、公安、社保、征信等系統平臺互聯互通的干部個人數據[18],如個人征信報告。這些數據信息雖未歸入干部人事檔案的類別,但是卻與和干部個人密切相關,對于干部人事管理具有重要的價值。

2.1.2 數據加工模塊。數據加工模塊主要是對干部人事檔案數據進行預處理,采用標準通用的數據格式保存、描述檔案數據。借助光學字符識別(OCR)、自然語言處理(NLP)、實體識別、關系抽取等機器學習技術,實現字段級別的檔案數據化,形成細粒度的檔案資源,將干部人事檔案數據中的組織、部門名稱、人名、時間、崗位、業務等實體要素及其關系抽取出來,形成粗粒度的檔案知識單元。同時,智能化的檔案知識服務要求檔案數據高度形式化[19]。為使干部人事檔案數據達到機器可讀、可交換和共享重用的格式要求,將其轉化成符合W3C語義網規范的資源描述框架(RDF)三元組形式。以RDF三元組形式描述檔案數據資源,重組為細粒度的檔案知識元,形成結構規范的檔案語義關聯數據集。

2.1.3 數據鑒別模塊。數據鑒別模塊的主要任務是對采集和加工后的關聯數據集進行數據分析,運用統計學、模式識別、數據抽象和機器學習等計算機技術對其展開挖掘,通過實體關聯關系抽取、關鍵要素對比查缺等手段,完成干部人事檔案數據真實性、完整性等的鑒定工作?;跀祿庸つK抽取出的實體要素例如人名、時間、崗位等及要素間關系展開智能分析與比對,對識別出的異常數據進行標記與反饋,以機器自動識別輔以人工檢測的方式進行數據真實性與完整性判定,經鑒別存在問題的數據需經過核驗及處理后方可流入下一層。

2.2 知識組織層

知識組織層是干部人事檔案知識庫的核心層,借助知識組織技術和方法對采集、保存和鑒定后的干部人事檔案數據進行知識化分析、組織和語義關聯推理,將干部個人檔案數據轉化為知識。本體作為概念描述的重要工具,能夠清晰表述知識庫中的概念及其關系,有利于知識的重用和共享及知識庫的維護和共建[20]。在知識組織層,主要借助本體構建工具進行知識組織,實現檔案知識之間的深層次語義關聯,形成干部個人數據鏈、關系網等知識網絡。知識組織層主要包括本體構建模塊和知識推理模塊。

干部人事檔案知識庫模型

2.2.1 本體構建模塊。本體構建模塊實現干部人事檔案語義層面的整合,支持檔案數據資源重組和知識管理。干部人事檔案本體構建注重檔案數據的重用和共享。目前本體構建的主流工具是protégé本體編輯工具,利用其進行干部人事檔案本體的構建及其可視化,具體步驟包括:確定語義本體的干部人事檔案的領域、明確領域核心概念、定義概念間關系或類間關聯、定義類的屬性和創建本體[21]等,形成包括實例對象、關系及邏輯規則等的初始知識庫。干部人事檔案語義本體的構建,注意參考復用現有術語詞表如《中國檔案主題詞表》《政務文書檔案專業詞表》《綜合電子政務主題詞表》等,建立和完善本體分類等級體系,并采用核心擴展方法確定本體的領域概念,如“組織機構”“部門名稱”“人名”“職務”“時間”“業務”等核心概念,概念之間獨立互斥且涵蓋該本體完整的干部人事管理知識;利用RDF三元組形式組織和描述本體的干部人事檔案知識,注意與其它相關干部個人信息關聯,確保實現語義互操作與語義融合。

2.2.2 知識推理模塊。知識推理模塊是在已有知識的基礎上,通過一定的方法來預測當前尚未顯現出的隱含知識,比如潛在相關的實體、關系,并將其逐步加入知識庫中,以達到擴充、優化知識庫的目的[22]。知識圖譜能夠將領域內外的知識單元編織成龐大的知識網絡,實現高效的知識問答與推理?;谥R圖譜的知識推理需與特定的本體模型相結合,基于本體定義與知識結構實現知識圖譜的補全與語義實體融合[23]。從干部人事檔案本體庫中挖掘推理出缺失的以及深層的潛在實體及關系,并對干部人事檔案知識庫進行補全并去噪,從而完成檔案知識的推理。

2.3 知識服務層

知識服務層是干部人事檔案知識庫的接口層,需要根據用戶需求、應用場景來提供相應知識服務。干部人事檔案主要應用于教育培養、選拔任用、管理監督干部和評鑒人才,其知識庫的核心功能是為用戶提供決策服務所需的知識。知識服務層需要滿足用戶的知識服務需求包括:能通過關鍵詞檢索所需知識、可依靠分類導航欄目進行瀏覽以及智能提供決策方案等。因此,知識服務層主要包含的知識檢索模塊、知識導航模塊以及知識決策模塊。

2.3.1 知識檢索模塊。知識檢索模塊可為用戶提供自然語言檢索選項和關鍵詞檢索選項。用戶選擇自然語言檢索功能時,系統將自動識別用戶所輸入的自然語言,并與系統中預設的分詞詞典、同義詞表進行比較,此間不斷與決策者交互[24],由此獲得能準確表達用戶真實知識需求的自然語言。知識庫根據用戶的知識需求,基于知識推理等技術,將檢索到的檔案知識準確反饋至用戶。關鍵詞檢索功能主要面向需要決策咨詢服務的機構或部門,使用關鍵詞檢索需要檢索者對檔案知識庫的知識組織原理具有深度了解,能夠從用戶提交的咨詢內容中提取出對應的關鍵詞?;谥R庫的推理模塊實現全面系統檢索和高效知識問答,提高決策咨詢服務的質量和效率。

2.3.2 知識導航模塊。知識導航模塊的主要功能是為用戶快速、清晰地查找與瀏覽所需知識提供便捷。導航模塊的類別劃分基于用戶的知識需求、認知水平和利用習慣等因素,以用戶能夠方便快捷地找到解決問題的檔案知識為分類原則。干部人事檔案由中央組織部主管,各地區各部門各單位按照干部管理權限分級負責、集中管理。其歸檔和利用工作遵循“來源原則”,因此用戶可以通過“來源導航”的方式獲取知識服務,按圖索驥地查找所需的檔案知識。同樣地,根據檔案種類和性質的不同設置“類別導航”方式,根據檔案形成年度的不同設置“時間導航”方式,根據干部職級或檔案密級的不同設置“權限導航”方式等。

2.3.3 知識決策模塊。知識決策模塊是提供知識服務的核心功能模塊,此模塊旨在向用戶提供精準的知識決策服務,發揮輔助決策功能。具體功能實現路徑分為以下兩種:一是針對用戶需求向用戶提供多項知識決策方案,同時附以推薦指數排序和排序依據,知識決策方案的生成需要決策模塊提取檢索和導航模塊用戶輸入的知識服務需求,經過運算推理后,依據用戶提交的知識需求結合相似問題的歷史解決方案,生成若干知識決策方案并進行智能排序,一并推送給用戶供其參考。

二是提供干部人事檔案知識的可視化呈現,多維度展現干部相關信息輔助決策判斷??梢暬尸F是以干部個人為中心點,關聯與干部個人相關的組織機構、職能部門、人物、時間、地點、業務等要素,立體化、多維度地展示干部個人數據鏈、關系網以及領導班子與領導干部整體情況。在時間維度,可視化呈現干部個人基本信息,形成展示干部學習經歷、工作經歷、參加黨團、職級變化等信息的時間樹,同時對干部個人能力進行分析;在空間維度,對領導班子和干部整體情況進行全方位、多視角的動態分析和展示,對省、市、縣各級單位領導班子基本信息、超缺編情況、黨外干部配備情況等進行綜合分析,同時對領導班子的年齡結構、性別比例、學歷結構、職級分布、業務特長、考核監督、政治面貌等進行統計和可視化展示;在社會網絡維度,關聯分析干部的社會關系,以干部為核心點,網絡化展示干部的親屬、同鄉、同校、同班子、同培訓等情況,并且擴展顯示可通過間接第三個人產生關聯的間接關系。

3 干部人事檔案知識庫應用場景分析

干部人事檔案知識庫通過語義檢索、智能問答、可視化呈現等檔案知識服務方式實現具體的知識應用和知識服務。根據干部人事檔案的特點和作用,干部人事檔案知識庫服務主要服務于干部選拔任用、審核監督、社會信用體系構建的場景。

3.1 輔助干部選拔任用的決策服務

干部人事檔案知識庫通過對干部人事檔案數據及其相連數據的深度挖掘分析、知識單元抽取、知識元關聯表示,形成干部個人數據鏈、關系網和領導班子架構網絡。干部人事檔案知識庫提供的干部個人數據鏈可以匯總分析干部的學習能力、業務能力、創新能力、個性特點、內在素質等,展示干部在德、能、勤、績、廉方面的主要表現,形成干部個人畫像。領導班子的可視化分析有助于了解各單位班子架構,呈現班子編制、學歷、年齡、培訓、考核、監督等信息,實現選任崗位的智能推薦、匹配和班子配備優化服務。同時,黨政領導干部的選拔任用實行任職回避制度和選拔任用工作回避制度,需要明確干部的夫妻關系、直系血親關系、三代以內旁系血親以及近姻親關系等[25]。知識庫提供的干部社會關系網絡刻畫了干部之間的關系,實現科學、公平地任免干部。干部和領導班子架構多維度智能分析研判的知識服務,幫助組織人事部門最大限度地合理配置干部人力資源,實現人崗匹配,營造干部人事檔案工作的“青山綠水”,優化干部選拔任用工作生態,為干部選拔任用的決策提供充分的依據。

3.2 面向干部審核監督的管理服務

組織人事部門堅持“凡提必審”“凡進必審”“凡轉必審”三原則,在干部動議、考察、任職前公示,人才引進,軍隊轉業(復員)安置,檔案轉遞、接收等環節及時做好干部人事檔案審核工作[26]。根據干部人事檔案對干部的“三年兩歷一身份”如出生日期、參加工作時間、入黨時間、學歷學位、工作經歷、干部身份等信息進行審核,確保見檔識人、人檔相適。知識庫通過整合、挖掘、關聯干部人事檔案離散的知識片段,形成立體的干部信息網絡。繪制關于干部的經歷成長圖,展示干部的出生時間、參加工作時間、參加組織時間、公務員身份等;挖掘梳理干部的成長經歷,以時間樹的方式呈現干部的學歷學位、工作經歷、專業技術職務、職級變化等信息,并鏈接相關的檔案數字化副本,方便組織人事部門及其干部人事檔案工作機構的檔案工作人員及時、快速地定位到檔案審核所需的內容,為審核干部人事檔案提供便利,為干部隊伍的宏觀管理提供精準高效的知識服務。

3.3 助力社會信用體系的構建服務

個人信用檔案數據治理的對象至少應包括個人身份情況數據、金融信貸數據、社會公共信用記錄數據和互聯網替代數據[27]。干部人事檔案是記載干部基本信息、成長經歷、德才表現等方面的原始記錄,是個人信用檔案數據的重要組成部分。隨著我國社會信用體系建設的不斷推進,干部人事檔案知識服務將與社會信用體系構建緊密相連。知識庫不僅有效整合了原始的干部人事檔案數據,提升信用評價的權威性和可靠度,還通過知識組織技術對其進行挖掘、組織和可視化,提升干部人事檔案數據的語義關聯程度,深化干部人事檔案知識服務的內容,全方位、立體化地反映干部個人全貌,實現檔案數據可溯源,問題可監測,有助于及時整改和處理干部人事檔案發現的問題,推動社會信用體系的構建。

猜你喜歡
知識庫本體檢索
2019年第4-6期便捷檢索目錄
基于TRIZ與知識庫的創新模型構建及在注塑機設計中的應用
基于本體的機械產品工藝知識表示
高速公路信息系統維護知識庫的建立和應用
專利檢索中“語義”的表現
《我應該感到自豪才對》的本體性教學內容及啟示
基于Drupal發布學者知識庫關聯數據的研究
專題
Care about the virtue moral education
國際標準檢索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合