?

基于對應分析的分類變量一致性評價量化指標的構建*

2014-03-10 07:03南方醫科大學公共衛生與熱帶醫學學院生物統計學系510515安勝利張海蘭
中國衛生統計 2014年5期
關鍵詞:符合率一致性矩陣

南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 安勝利張海蘭

基于對應分析的分類變量一致性評價量化指標的構建*

南方醫科大學公共衛生與熱帶醫學學院生物統計學系(510515) 安勝利△張海蘭

目的將對應分析(correspondence analysis,CA)應用于臨床診斷試驗的一致性評價,構建基于CA的一致性評價量化指標,提高其在一致性評價應用中的客觀性。方法根據CA的具體算法構造出距離矩陣,參考kappa系數的原理,利用SAS9.1構造一致性評價量化指標(分別簡稱CBD和CCBD);通過不同情形下的模擬數據和實例對量化指標進行可靠性和實用性考核。結果兩個待評價方法時,CBD和kappa均與符合率存在較高的正相關;多個待評價方法時,CBD或CCBD分別與kappa或fleisskappa成正相關。對于存在kappa悖論的資料,CBD表現出相對于kappa較高的穩定性。此外,CBD或CCBD與其相應的對應分析圖得出的結論亦吻合。結論基于CA所構建的一致性評價量化指標是客觀可靠的,對于臨床科研中的一致性評價具有重要的理論和實際意義。

對應分析 一致性評價 量化指標

隨著醫學不斷發展,新診斷方法、新治療方法層出不窮,在臨床科研中常常需研究它們與傳統方法或金標準的一致性。kappa是對分類變量進行一致性評價的常用指標,但此方法不直觀,且存在要求測量結果分類數相等、kappa悖論等問題[1]。所謂kappa悖論是指由于特定數據的分布原因,導致用kappa評價一致性的結果與實際觀察到的符合率結果相背離。Helena等人曾經對kappa系數的缺陷進行過探討和改進[2-4]。對應分析(correspondence analysis,CA)又稱R-Q型因子分析,是多維圖示分析技術的一種,主要用于分類變量的關聯性分析[5-8],可藉圖形直觀表達結果的一致性,但因其結論具有一定的主觀性,從而限制了CA在一致性評價中的應用。近年來,有學者曾提出通過構造量化指標來改進對應分析的構想[9],但并未進一步探討實現。本研究將以CA的原理和算法為基礎,并參照kappa系數的原理[2,10-11],構建能反映分類變量之間一致性情況的量化指標,即兩變量一致性指標(correspondence based distance,CBD)和多變量一致性指標(combined correspondence based distance,CCBD)。通過模擬不同情形下的數據和實例對量化指標進行考核,且與kappa系數比較,驗證CBD和CCBD的實用性和可靠性,以期構建一個相對客觀、直觀、可靠的一致性評價方法。

量化指標構造方法

對應分析中得到的慣量比例是指各維度(公因子)分別解釋總慣量的比例及累計百分比,一般取累計百分比達到較高時的維度,本研究將對三維以下維度的情況進行研究。根據對應分析原理可以得到對應分析圖中各散點的坐標,通過計算可得到各散點之間的距離矩陣,本研究參照kappa系數的原理,應用各散點之間的距離矩陣構造出一個新的量化指標。具體構造步驟如下:

1.進行對應分析,得到對應分析圖和各變量各分類的一維或二維坐標(xij,yij),其中i是變量個數,j是各變量的分類數。

2.利用以上各點坐標構建所有變量各分類之間的距離對稱矩陣Dij(所有變量所有分類數的總和,i=j)。

3.參考kappa系數的原理[2,4],構造一致性量化指標(CBD和CCBD):kappa系數的原理和計算公式是根據行列表的邊緣概率構造的,據此,本研究亦通過以上距離矩陣得到邊緣概率,構造出基于距離矩陣的一致性量化指標。兩變量和多變量的構造方法有所不同,具體如下:

(1)只有兩個變量時,所用距離矩陣為Dij的子集,行為第一個變量的各分類,列為第二個變量的各分類,一致性量化指標CBD(取值范圍為[-1,1]):

上式中,cap0指各變量各類別之間的實際符合率指各變量各類別之間的期望符合率(i指兩個變量的相同分類第i類,j指第j類,dpi.是距離矩陣中第i行距離之和占總距離的比例,dp.j是距離矩陣中第j列距離之和占總距離的比例)。

(2)變量為三個或三個以上時,距離矩陣為對稱矩陣Dij,一致性量化指標CCBD(取值范圍為[-1,1]):

4.量化指標的標準誤和95%置信區間。

(1)CBD的標準誤計算公式為:

上式中,dsum是各變量各分類的所有距離總和。該式因將cape當作一個常數,將cap0當作總體對待,故所得結果是一個近似值,。當樣本量N較大時,cape相對于CBD變化不大,且CBD近似服從正態分布,故CBD的95%置信區間為:CBD±Z0.05/2·SECBD。

(2)CCBD的標準誤計算公式為:

上式中,zsum是距離對稱矩陣中的距離總和。當樣本量N較大時近似服從正態分布,故CCBD近似服從自由度為1的卡方分布,其95%置信區間

5.量化指標之間比較的假設檢驗[12]:

由于以上CBD近似服從正態分布,故兩個CBD的差異性假設檢驗可通過下式實現:

數據模擬及驗證

為減小抽樣誤差,對每種情形下的數據均進行了500次樣本量為500的模擬,最后采用這500次各個分類組合的平均頻數進行分析。

1.兩個待評價方法(以二分類測量結果為例)

此種設計可總結為四格表形式,共模擬了15次平均觀察符合率不同數據。結果顯示kappa系數、CBD均與符合率存在正相關關系(見表1),rCBD=0.98509,rkappa=1.00000,符合率與kappa的相關系數稍大于其與CBD的相關系數,但兩者相差不大,且都反映出很強的正相關關系。此外,每次模擬數據所得CBD所反映結論均與其相應的對應分析圖一致。若其中一個方法為金標準,則可計算相應的靈敏度和特異度。

2.多個待評價方法(以三個待評價方法二分類測量結果為例)

模擬具有一定關聯性的兩個待評價方法Mb、Mc和一個金標準方法Ma的數據,均為二分類(假定為normal和sick)進行多重對應分析,并利用其對應分析圖上的各個點的坐標建立距離矩陣,獲得總一致性量化指標CCBD,同時分別求得Mb、Mc與標準方法Ma的一致性量化指標CBD。所得結果見表2。兩個CBD的差異性假設檢驗結果為Z=-2.048,P=0.0405,可認為二者不等。與Mb相比,Mc與金標準Ma的一致性程度更好。

3.多個待評價方法(以三個待評價方法三分類測量結果為例)

模擬了10次不同情形的數據,結果顯示待評價方法兩兩之間的CBD與其相應的kappa系數呈正相關關系(見表3);CCBD和fleisskappa呈正相關關系。此外,各情形下得到的CCBD所反映結論均與其相應的對應分析圖一致。

表1 符合率、CBD、kappa系數和靈敏度、特異度匯總表

表2 符合率、各量化指標、各kappa系數匯總表

實例分析

甲、乙兩個醫師對相同的240個病人的X光胸片進行診斷[3],其數據如表4:

表3 兩醫師對X光胸片診斷結果

經計算,該數據CBD=0.667,kappa=0.0065,符合率=0.7042.由于kappa公式中的Pe與P0很接近,則分子P0-Pe接近于0,導致該資料的kappa取值很小,只有0.0065。若按照kappa系數評價,則甲醫師和乙醫師的診斷結果幾乎是沒有一致性的,但從實際觀察符合率來看卻較高,此即所謂的kappa悖論。而本研究構造的量化指標CBD結合對應分析圖則能得到甲醫師和乙醫師的診斷結果一致性較好的結論,與觀察符合率反映的情況一致,顯示了本研究所構造量化指標的實用性和可靠性。

討 論

本研究模擬了不同情況下的分類數據,結果顯示所構建的量化指標能客觀正確地反映各方法測量結果之間的一致性程度,并適用于存在kappa悖論的數據;同時,本研究所構建的一致性量化指標并不像kappa那樣,要求待評價方法的結果分類數相同;另外,相對于金標準,不同待評價方法之間的CBD大小還可進行假設檢驗。

值得注意的是,本研究構建的一致性量化指標是以對應分析過程中得到的一維或二維坐標數據為基礎的,因此在分析過程中,必須先明確對應分析的一維或二維空間數據能包含大部分信息量,然后再計算量化指標。

本研究構建的量化指標尚存在以下不足:符合率較小時,CBD的抽樣誤差會很大,導致其置信區間較寬;對于有序變量數據是否存在更合理的加權對應分析量化指標,本次研究尚未涉及。以上問題擬在以后的研究中加以改進和完善。

1.Feuerman M,M iller AR.Relationships between statisticalmeasures of agreement:sensitivity,specificity and kappa.JEval Clin Pract,2008,14(5):930-933.

2.Chmura KH,Periyakoil VS,Noda A.Kappa coefficients in medical research.Stat Med,2002,21(14):2109-2129.

3.王軍.Kappa系數在一致性評價中的應用研究.四川大學,2006.

4.閆巖,華琳,張建.對診斷一致性kappa系數及評價指標的探討.中國衛生統計,2007,24(3):313-315.

5.高惠璇.應用多元統計分析.北京大學出版社,2005.

6.陳明,陳景武.對應分析方法及其在臨床上的應用.數理醫藥學雜志,2007,20(2):132-134.

7.李寶紅,董時富,孫振球.對應分析在生態學研究中的應用.中華流行病學雜志,2007,28(9):914-917.

8.李寶紅,孫振球.對應分析在探討疾病季節分布中的應用.中國衛生統計,2007,24(6):593-596.

9.Nadia S,Christina W,Bin Z,et al.Correspondence analysis is a useful tool to uncover the relationships among categorical variables.Journal of Clinical Epidem iology.2010,63(6):638-646.

10.趙燕,屬性值測量系統分析的方法研究與應用,天津大學,2007.

11.夏邦世,吳金華.Kappa一致性檢驗在檢驗醫學研究中的應用.中華檢驗醫學雜志,2006,29(1):83-84.

12.Cohen J.A coefficient of agreement for nom inal scales.EDUCATIONAL AND PSYCHOLOGICAL MEASUREMENT,1960,1:37-46.

(責任編輯:郭海強)

The Structure of Quantitative Index for Categorical Variables’Agreement Evaluation based on Correspondence Analysis

An Shengli,Zhang Hailan(DepartmentofBio-Statistics,SchoolofPublicHealthandTropicalMedicine,SouthernMedicalUniversity(510515),Guangzhou)

ObjectiveCorrespondence analysis(CA)can be applied to the consistency evaluation of clinical diagnosis trials.It is expected to build quantitative indexes for agreementevaluation system w ith correspondence analysis to improve its objectivity.MethodsFirst,the distance matrix is constructed according to the specific algorithm of CA.Then,referring to the principle of kappa,the quantitative indexes(CBD and CCBD)were built.The reliability and utility of the quantitative indexes were tested w ith the simulative data under different situation and some examples.ResultsFor two evaluated methods,positive correlations existamong kappa,CBD and concordance rate.In the casew ithmore than 3 evaluatedmethods,CBD and CCBD are proportional to kappa and fleiss kappa coefficient respectively.As for the data in which kappa paradox exists,the stability of CBD is better compared w ith kappa.In addition,the conclusions drawn by the correspondence analysis diagrams are the same as thatof CBD or CCBD.ConclusionThe quantitative indexes of consistency evaluation builtby CA is objective and reliable,and it is of important significance both in theory and in practice to the consistency evaluation in clinical research.

Correspondence analysis;Consistency evaluation;Quantitative indexes

*:南方醫科大學公共衛生與熱帶醫學學院院長基金(GW201421)

△通信作者:安勝利,E-mail:ASL0418@126.com

猜你喜歡
符合率一致性矩陣
注重教、學、評一致性 提高一輪復習效率
對歷史課堂教、學、評一體化(一致性)的幾點探討
IOl-master 700和Pentacam測量Kappa角一致性分析
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure
彩色多普勒超聲檢查在診斷乳腺良惡性腫瘤中的應用價值
CT、MRI在眼眶海綿狀血管瘤與眼眶神經鞘瘤影像學鑒別診斷中的研究
初等行變換與初等列變換并用求逆矩陣
基于事件觸發的多智能體輸入飽和一致性控制
矩陣
矩陣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合