王于心 劉鴻齊 于 琦 賈晨晨 賀培鳳
1山西醫科大學管理學院,晉中, 030060;2山西醫科大學第二醫院,太原,030001
數據素養是指科研工作者從數據管理視角、數據利用視角以及數據技能視角等方面對數據的應用能力[1]。隨著數據密集型科研范式的興起,數據的獲取、利用、管理、共享等意識逐漸成為科研從事者的必備技能,同時也成為各個科研領域發展的重要內在驅動[2]。研究生具有“研究”和“學習”的雙重使命,這就決定了這個群體在科研過程中對數據的需求和產生都十分巨大[3],同時醫學研究生作為醫務工作者的后備人才,其數據素養水平直接影響到科研創新[4]。本研究通過了解山西省醫學研究生數據素養現狀,為加強醫學研究生數據素養能力提供參考。
采取方便抽樣法,于2019年5月4日-6月30日,選取山西醫科大學、山西中醫藥大學、長治醫學院三所山西省醫學院校的部分在讀研究生作為研究對象,共發放調查問卷450份,回收有效問卷412份,有效回收率為98.1%。
根據數據素養的概念與內涵,參考相關文獻,自編調查問卷。問卷內容包括兩部分:①一般人口學資料,包括性別、學歷等;②數據素養問卷,包括數據意識(6題)、數據利用(4題)、數據管理(6題)、數據共享(4題)和數據權益(5題)五個維度,每題4分,滿分100分,問卷Cronbach's alpha系數為0.920,具有較好的內部一致性和較為理想的內容效度。
采用EpiData 2.0軟件進行數據錄入,使用SPSS 22.0統計軟件進行一般描述性分析、單因素分析(t檢驗和單因素方差分析)和多因素有序logistic回歸分析,P<0.05為差異有統計學意義。
本調查的412人中,男生92人(22.33%),女生320人(77.67%)。其中山西醫科大學249人(60.44%),山西中醫藥大學137人(33.25%),長治醫學院26人(6.3%)。碩士研究生250人(60.68%),博士研究生162人(39.32%)。
山西省醫學研究生數據素養的綜合平均得分為(59.73±16.49)分,總體處于中等水平[5]。其中數據意識、數據利用、數據管理、數據共享、數據權益的平均得分分別為(16.80±6.25)、(7.25±3.76)、(15.13±5.77)、(9.42±4.38)、(11.14±6.40)。
不同學科的數據素養綜合得分在56-65分之間,處于中等水平,然而各學科水平參差不齊。其中綜合得分最高的學科分別是基礎醫學(65.74±5.38)與公共衛生(63.69±5.12),并具有統計學意義(P<0.05)?;A醫學的數據意識、數據管理、數據共享和數據權益均為最高分,具有顯著性差異(P<0.05),然而在數據利用方面,基礎醫學卻劣于公共衛生。見表1。
表1 山西省醫學研究生不同學科數據素養的單因素分析
不同發表文獻情況人群中,已發表文獻人群綜合得分明顯優于未發表文獻(P<0.01)。中英文文獻都發表的人群數據素養各方面得分最高,未發表文獻的人群得分最低。文獻發表情況越好,數據素養各方面表現越優,表明研究生的數據素養水平具有可塑性,可隨著科研水平的提高而提升。見表2。
表2 山西省醫學研究生不同文獻發表情況數據素養的單因素分析
不同學校、學歷、性別的醫學研究生在數據素養綜合得分方面均未有顯著性差異。其中博士研究生在數據利用、數據管理和數據權益方面優于碩士研究生,并具有統計學意義(P<0.05),說明文化程度越高,數據素養水平越高。見表3。
表3 山西省醫學研究生不同學校、學歷、性別數據素養的單因素分析
將有意義的因素(學科、文獻發表情況、學歷)作為自變量,將數據素養按照分數高低劃分為優(80-100分)、良(60-80分)、差(60分以下)三個等級作為因變量[6],進行多因素有序logistic回歸分析。結果顯示,文獻發表情況對數據素養的影響強度高于學歷和學科。中英文文獻發表水平越高、學歷越高的醫學研究生的數據素養水平越高,在不同學科中,基礎醫學的醫學研究生數據素養水平最高。見表4。
表4 山西省醫學研究生數據素養的多因素有序logistic回歸分析
本次調查對象數據素養平均得分(59.73±16.49)分,未達到“及格”,處于中等水平,可能是因為國內大多醫學院校在數據素養課程設置方面存在數據素養相關課時不足、尚未開展系統化教學等問題[7-8],導致醫學研究生在數據素養培養上處于自學、被動接受的處境,致使整體水平一般。其中數據利用、數據共享和數據權益等掌握較差,可能是因為醫學院校的傳統課程只注重課本內容的講解,而忽略了技能的提升與科研數據思維的培養[9],導致醫學研究生并未形成多維的數據利用方式[10]。Memarzadeh等的研究表明個人數據利用能力與數據素養之間是正相關關系[11],因此加強數據利用能力是提升數據素養水平的關鍵一環。
本研究發現,基礎醫學與公共衛生學科的研究生數據素養得分最高,同時在數據利用、數據管理和數據權益的能力方面均高于醫學高校的其余學科。該結果與黃玲等研究者的結果相悖[12],究其原因,一方面可能是因為大數據經過十年左右的發展,在醫學領域對數據素養的要求越來越高,因此不同專業之間的差異顯著;另一方面不同學科之間數據素養水平差異在很大程度上與專業課程有關[13],基礎醫學與公共衛生專業在實驗技能課程上要求較高、數據素養基礎較好,因此總體情況較優。
山西省醫學研究生在不同文獻發表情況、學歷方面均有顯著性差異(P<0.05),這與Bazrafkan的研究結果基本一致[14]。有研究指出,可能是因為學歷高的醫學博士生獲取數據的意愿更強烈、學習數據知識更加積極[15]。進一步分析顯示,文獻發表情況是影響數據素養水平的主要影響因素。其中人群的文獻發表水平越高、對數據實際處理與操作越多,其數據素養水平就越高。
因此學術科研能力強的人群應當發揮模范帶頭作用,帶領低水平人群在實踐中提升數據素養能力。同時臨床醫學研究生應當轉變他們只注重臨床能力培養的觀念,注重數據素養的提升。