?

基于圖像學理論的人物照片檔案開發利用研究

2022-07-14 09:49錢毅崔浩男
檔案與建設 2022年6期

錢毅 崔浩男

摘 要:人物照片檔案資源蘊含豐富的隱性知識和語義信息,其深度開發利用仍處于探索階段。文章借鑒圖像學的圖像類型和分析層次理論,結合當下的人臉識別等技術,提出以“認人—識人—用人”為明線、“人臉特征庫—人物知識庫—人物應用場景池”為暗線的人物照片檔案開發新框架,以實現照片檔案的要素識別、語義關聯和深度利用,對于轉變照片檔案開發利用的傳統思維和固有方式具有指導作用。

關鍵詞:照片檔案;信息資源開發;圖像學理論;語義增強

分類號:G273

Research on the Development and Utilization of Portrait Photographic Archives Based on Iconology Theory

Qian Yi1,2, Cui Haonan1,3( 1.School of Information Resource Management of Renmin University of China, Beijing 100872; 2.Research Center of Electronic Records Management of Renmin University of China, Beijing 100872; 3.Research Center for Digital Humanities of Renmin University of China, Beijing 100872 )

Abstract: Portrait photographic archives contain rich tacit knowledge and semantic information, and their in-depth development and utilization is still in the exploratory stage. Based on the image type and analytic hierarchy theory of iconology, combined with the current face recognition and other technologies, this paper puts forward a new framework for the development of portrait photographic archives, which takes recognizing portrait - knowing portrait - using portrait as the bright line and face feature database - portrait knowledge database - portrait application scene as the dark line, so as to realize the element recognition, semantic relevance and in-deep utilization of photographic archives. This paper has a directive function for changing the traditional thinking and inherent way of photographic archives development and utilization.

Keywords: Photographic Archives; Development of Information Resources; Iconology Theory; Semantic Enhancement

檔案資源的智慧化轉型是“十四五”時期檔案工作應對數字時代挑戰、實現全面數字轉型的題中之義。但是,當前檔案資源的智慧化轉型研究還大多圍繞常規文本類資源展開,對特殊門類資源的管理和開發關注不足,缺乏深入、可復用的智慧化開發路徑與方法。特殊門類的檔案資源往往信息表示更為復雜,凝聚的語義更為豐富,可挖掘的價值更強,對于豐富和提升檔案機構的資源品質具有不可或缺的獨特作用。因此,本文聚焦人物照片檔案,即組織機構或個人在社會實踐活動中直接形成的對國家和社會具有保存價值并歸檔保存的人像照片,結合圖像學理論與人工智能技術,創新照片檔案開發利用的思維,探索照片檔案資源智慧化轉型的路徑和方案。

當前,照片檔案管理的研究趨勢已從傳統照片檔案轉向數碼照片檔案,進入“深水區”和“內涵式”的高質量發展階段。為聚焦研究主題,筆者通過在中國知網、萬方、維普等文獻庫中檢索主題為“數碼照片檔案”的文獻(檢索時間為2022年2月),發現當前研究主要圍繞“數碼照片檔案”“數碼照片”“照片檔案”“檔案管理”等主題展開;研究主體集中在公共事業單位;研究內容比較關注在數碼時代的客觀環境下,依托照片檔案管理的現狀改進實際工作,側重經驗總結。[1-3]此外,當前研究較少關注人物照片檔案這一特定類別,僅有學者提出一種照片檔案人物自動標注方法,以解決不同照片重復人物的標注問題。[4]

1 人物照片檔案開發利用的新理論

本文的研究對象是人物照片檔案,即原生數碼照片檔案和傳統載體照片檔案的數字化成果中包含人物要素的部分。人物照片檔案歸根結底屬于“圖像”的范疇,因而可以借鑒藝術領域中圖像學的相關理論。圖像志(Iconography)被認為是圖像學發展的早期階段,[5]是藝術史研究的一種方法學,主要涉及圖像的收集、整理和描述、分類工作,并對作品中的人物身份、事件、形象進行知識性的解釋。20世紀后,傳統圖像志發展為現代圖像學研究,開始注重對圖像作品主題事件和深層意義的探索。[6]

1.1 圖像類型研究

美國藝術史學家馬克·D·富勒頓區分了“象征性”和“敘事性”兩種圖像類型,認為象征性圖像表示某種物體或現象,敘事性圖像則主要和某個故事或事件相關聯,都帶有深刻的精神寓意和文化內涵。[7]據此,人物照片檔案可區分為“象征型人物照片”和“敘事型人物照片”。象征型人物照片是指以人物形象為核心拍攝對象,為特定目的而進行的有選擇性的拍攝,如人物標準肖像照、會議合影等形式。這類照片往往在照片檔案中占據相當比重,由于其形成本身具有特定目的性和時機選擇性,因而在常規管理到位的情況下,相關元數據信息有一定的保障。敘事型人物照片則是指為記錄客觀活動場景而拍攝的一類照片,人物作為其中的要素得以展示。這類照片的“敘事性”特點突出,主要用于展示客觀活動過程和典型場景,承載更多的業務動作和事件屬性,相對而言沒有刻意突出人物形象,符合人們平時生活中的“抓拍”情形,人物形象表達也更為自然。簡而言之,象征型照片有較強的確定性,數據來源更為明確;敘事型照片的隨機性更強,數據來源更為豐富。在人物照片檔案開發中應有機融合兩種照片類型,在不同應用場景中充分發揮兩種照片的優勢。

1.2 圖像分析層次研究

圖像學提供的圖像分析層次思想可以用于指導人物照片檔案的開發。帕諾夫斯基將圖像學分析步驟分為三層:第一層為“前圖像志描述”,即描述圖像的自然意義,包括外觀的形式結構、外在事實意義等,解釋者應該有實際經驗;第二層為“圖像志分析”,是發現、解釋圖像的傳統意義和作品的特定主題,解釋者應該有原典知識;第三層為“圖像學分析”,解釋圖像或作品的內在意義和內容,解釋者應該有綜合直覺能力。[8]由此可見,結合圖像背后的內涵才能理解圖像的完整意義。在大規模數字化的當下,這種對圖像作品內容的描述和闡釋方法可為人物照片檔案的內容開發環節帶來啟示。如表1所示。

2 人物照片檔案開發利用的新框架

基于上述圖像學理論,結合人工智能技術,尤其是人臉識別技術的廣泛應用,本文從實際業務開展和基礎設施構建兩條線索共同切入,探索人物照片檔案開發利用的新思維。一方面,從檔案行業的業務開展內容看,“認人—識人—用人”分別對應圖像學分析的三個層次,可作為“明線”貫穿業務活動中;另一方面,從資源體系和技術融合的角度看,結合上述線索可以構建“人臉特征庫—人物知識庫—人物應用場景池”的基礎設施“暗線”,分別代表著要素與要素的連接、知識與知識的關聯、場景與場景之間的協同?!懊骶€”與“暗線”的三個環節分別由淺至深地實現信息要素識別、信息語義關聯和信息深度利用的目的。如圖1所示,本文提出基于圖像學理論的人物照片檔案開發框架,可根據需求進一步構建實現路徑和應用場景模塊,實現底層對象、中層要素、高層語義的連接。

2.1 明線——實際業務開展

照片檔案管理可以圍繞“人”這一基礎性要素創新人物照片檔案開發的流程,促使人物照片檔案在“載體—文件—數據—語義—價值”維度上延伸。

(1)認人:人臉識別技術的成熟應用

認人,指通過人工智能技術中的人臉識別技術能夠對數碼照片檔案中的人物予以高效識別和精準指認。就照片檔案的利用而言,利用者通常會用“人名”作為關鍵字進行檢索,這就要求對照片中的人物進行充分的識別和標注。目前對人物照片檔案的識別方式比較傳統:主要依據照片檔案六要素“拍攝時間、事由、地點、人物、背景、攝影者”進行。在要素齊全的情況下,可根據“人物”要素的相關著錄信息進行識別,而當照片檔案進館要素不齊、照片檔案載體本身出現發黃粘連和脫落、只著錄了主要人物信息卻沒有著錄所有人物信息時,[9]則往往依靠人工識別。AI人臉識別技術的發展使得基于人物圖像的數碼照片自動“認人”成為可能,據此可以對人物圖像識別的邏輯與嵌入照片檔案管理全過程的技術要點進行重新設計。

(2)識人:人物照片檔案的語義關聯

識人,指基于現有人物圖像,結合相關檔案館藏以及外部信息源進行語義分析和邏輯關聯。目前,單靠文字說明和部分著錄元數據的照片檔案無法滿足檔案深度利用的要求,通過人工逐一標注海量照片數據的方式則囿于各項成本而難以實現。為突破瓶頸,需進一步創新“識人”機制,可使用對應的圖像數據增強工具,結合圖像語義提取圖像特征值建立特征索引庫。同時,設計“識人”模式下的成果反哺機制,通過人臉識別技術所識別的人物信息,回溯至檔案特征索引庫中增加“補充性著錄資料”,逐漸豐富照片著錄信息。依托這種方式,通過自建或利用相關語義基礎設施,可以批量對人物照片檔案相關信息進行語義增強,如利用其家族、所在機構、社交圈、相關事件、行動軌跡等基礎數據對人物進行語義拓展和關聯。

(3)用人:人物照片的深度挖掘利用

用人,指借助照片檔案資源中的人物要素及其關聯信息,在各類利用場景中挖掘人物照片檔案資源的深度利用價值,最終服務于前端開發工作。其核心含義是將“認人”和“識人”中獲得的人物表面信息,結合其他背景要素信息,在人工智能技術手段下,形成真實、完整、流暢的檔案敘事。其主要思路包括:第一,基于人工智能的各項服務場景技術,如照片時間軸技術、GPS地點人物相結合的元素檢索技術、情感分析技術等,實現對照片檔案中人物的軌跡分析、交集分析、關系分析、情感分析等。第二,結合人物照片檔案的其他元素信息(如主題、時間、地點、攝影者等)進行交叉分析處理,完整展示照片形成的歷史背景和社會環境因素,探索多人物交集環境下多要素結合的檔案檢索、查詢應用,明晰檔案信息深度挖掘利用的基本路徑。第三,協助檔案機構人員開展歸檔環節的決策分析,通過人物庫與移交照片的對比,獲取反饋結果,從而為檔案人員開展歸檔鑒定提供判斷依據,實現敏感信息自動識別與檔案分級分類。第四,借助數據平臺實現開發成果的實時迭代更新,當新的人物照片檔案數據源納入該成果主題時,依照開發模型和規范,相關新數據會被及時填入開發產品中。

2.2 暗線——基礎設施構建

建設人臉特征庫、人物知識庫、人物應用場景池等檔案語義基礎設施是提升人物照片檔案資源開發能力的“暗線”。檔案語義基礎設施是用于拓展檔案數據內涵的具有工具性和服務性的語義產品。[10]照片檔案語義基礎設施不僅包含帶有照片檢索服務的文獻庫,還包含基于資源對象和數據單元層面的基礎知識庫和開發產品,應支持跨機構的共建共享、跨網域的開放互聯和跨領域的知識融通。[11]這將涉及到照片檔案數字化、文本化、數碼照片的知識表示、數字圖像互聯與共享、照片知識庫構建等多個環節。[12]

(1)人臉特征庫:通過技術賦能管理

人臉特征庫建設的核心是通過人臉識別技術賦能精細化管理,主要包括“技術認人”和“管理認人”兩個關鍵節點。技術認人是通過人臉識別技術和外部資源的協同來建設人臉比對庫,提高認人的效率,避免大量的重復勞動,是后續開發環節的基礎。管理認人是在主題場景的指導下,通過人工提取著錄項,豐富元數據中的基本信息,有利于進一步增強信息密度、打破信息迷霧、提升信息關聯。通過技術和管理手段來構建人臉特征庫實現照片人物識別,可以克服合影人物眾多難以識別、老舊照片人物模糊、人物信息不全等難點,是照片價值得以充分發揮的重要途徑,也是照片檔案資源進行人機交互的重要方式。

(2)人物知識庫:通過關聯增強語義

通過人臉識別、人工著錄能夠得到較為充分的人物照片檔案基礎數據,由此可以進一步以人物照片檔案內容的解析為基礎,建立人物照片檔案信息的關聯關系,實現照片檔案之間、照片檔案與其他資源之間的靈活互動,建設人物知識庫等語義基礎設施。由于與照片人物相關的信息很有可能分布存放在不同單位和系統之中,加之采用不同的描述方法和標準,難以實現跨機構、跨系統的開發利用。但人物照片檔案與相關檔案資源往往隱含著共同的“記憶點”,因而通過對照片檔案內容進行分層處理,形成照片層、元數據層和標簽層的多層數據對象,針對數據對象采用主題建模、標簽加注等手段來構建本體模型和知識圖譜,可以在人物層面實現語義樹的層次拓展和縱向延伸。在這個過程中,人物照片檔案所記錄反映的“人、事、時、地、物”要素及其互相之間的關系能夠得到更加靈活的揭示,可以將更多的顯性知識與隱性知識、內部知識與關聯知識、通用知識與專用知識疊加起來,實現照片檔案內容的語義增強,[13]有助于完整反映歷史事實的證據情況和發展線索。

(3)人物應用場景池:通過成果輔助敘事

數字時代的人物照片檔案開發成果及其應用場景應更加多元,包括數字出版物、專題數據庫、微系統、融媒體可視化產品等。這些多元化的成果能提供各種數據服務,用戶可通過可視化產品瀏覽、數據庫檢索、數據集調用、微服務應用等多種方式加以利用,并可以在線上直接與開發者進行雙向交互,由此支撐構建以照片檔案為核心資源的融媒體數字記憶空間,真正實現全方位、多模態圖文互動的檔案敘事。隨著媒體融合時代的到來,檔案敘事不再單單依靠文字,而是應綜合運用圖片、視頻、音頻等多種信息傳播方式,給用戶帶來更加豐富的使用感受。隨著互聯網技術與數字展陳設備的發展,照片檔案的圖像敘事正在實現流程再造,敘事的“集中采編、移動優先、融媒產品、全屏直播”成為趨勢,統一的檔案故事在不同媒體中呈現出不同敘事特征,一種多元化的檔案敘事形態正在形成。伴隨著照片檔案智能化的發展,照片檔案在檔案敘事中的作用將不斷凸顯,其與檔案文本敘事方式可以有機結合,利用融媒體展陳產生新的敘事風格,實現從“零散信息”到“聚合信息”的跨越,即借助照片檔案的典型性特點,結合其他檔案材料的完整性特點,實現多資源、多媒體聯動,完成全方位的檔案敘事。

3 總結與展望

照片檔案具有生動性、講述力、故事感,采用圖像文字組合等簡單的數字化形式雖能復原或重構相關信息,卻難以描述故事元素之間的復雜關聯和模糊語義。本研究基于圖像學理論,以“認人、識人、用人”為線索,提出實現人物照片檔案信息識別、分析和挖掘利用的新框架,有助于從根本上轉變照片檔案的管理邏輯起點,實現從照片檔案的載體管理轉向照片檔案的內容管理。未來在檔案工作實踐過程中結合人工智能技術不斷檢驗、改進現有框架,可以將原先照片資源開發過程中對人物照片檔案的簡要羅列式的思維,創新為“以人敘事”的新型人物照片檔案開發思路,將原先“用照片去襯托故事”的利用模式變為“用照片去講故事”的新模式,實現人物照片檔案資源和其他資源之間的關聯敘事,真正實現照片檔案資源的“活化”。

*本文系國家檔案局科技項目“AI人臉識別在數碼照片檔案管理中的應用研究”(項目編號:2021-X-09)階段性研究成果。

注釋與參考文獻

[1]朱玉清.基于高校照片檔案編研的反饋及思考[J].中國檔案,2021(4):44-45.

[2]曾靜怡,顧偉,劉力超,等.照片檔案創新編研思路探析[J].檔案學通訊,2021(4):71-76.

[3]曾靜怡.上下文在照片檔案敘事中的應用[J].檔案學研究,2021(6):100-105.

[4]李剛.一種照片檔案的人物自動標注的方法[J].電子技術與軟件工程,2020(15):137-138.

[5]比亞洛斯托基,楊思梁,宋青青.圖像志[J].新美術,1990(1):73-88.

[6]徐建融.大辭海:美術卷[M].上海:上海辭書出版社,2012:516.

[7]李旭暉,吳燕秋,王曉光.基于角色關聯的敘事型文化遺產知識表示方法[J].圖書情報工作,2017(9):116-122.

[8]宋小蒙.從圖像志看圖像學的本土化[J].美與時代(下),2020(11):15-17.

[9]郭俊山.淺談檔案館搬遷中的檔案保護[J].黑龍江檔案,2019(1):97.

[10]劉煒,謝蓉,張磊,等.面向人文研究的國家數據基礎設施建設[J].中國圖書館學報,2016(5):29-39.

[11]夏翠娟.面向人文研究的“數據基礎設施”建設——試論圖書館學對數字人文的方法論貢獻[J].中國圖書館學報,2020(3):24-37.

[12]顏佳,楊敏,彭梅.面向數字人文的圖像數據基礎設施建設研究——以我國圖博檔領域為視角[J].圖書館,2021(5):51-58.

[13]陳濤.目標檢測在數字人文圖像中的應用嘗試[J].數字人文研究,2021(3):39-50.

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合