?

數量性狀全基因組關聯分析中上位效應遺傳位點檢測方法研究進展

2015-01-07 07:16郭家中王小龍劉海峰
關鍵詞:上位表型方差

郭家中,王小龍,仲 濤,劉海峰

(1 四川農業大學 動物科技學院,四川 成都611130;2 西北農林科技大學 動物科技學院,陜西 楊凌 712100)

數量性狀全基因組關聯分析中上位效應遺傳位點檢測方法研究進展

郭家中1,王小龍2,仲 濤1,劉海峰1

(1 四川農業大學 動物科技學院,四川 成都611130;2 西北農林科技大學 動物科技學院,陜西 楊凌 712100)

數量性狀的表型變異受到大量效應微小的遺傳位點和諸多環境因素的共同作用,但在數量性狀的遺傳研究領域,關于不同遺傳位點之間加性效應與上位效應相對重要性的認識卻存在著分歧。近年來,伴隨著全基因組關聯分析在人類及家養動物數量性狀研究中的發展,在全基因組關聯分析的框架內進行上位效應遺傳位點的檢測越發受到重視。文章以遺傳力失蹤問題為出發點,首先綜述了標記-QTL連鎖分析和GWAS框架下傳統上位效應遺傳位點的檢測方法,然后對基于表型方差同質性檢驗和廣義線性混合模型方法的上位效應統計推斷以及混雜因素的處理方法進行了總結與梳理,旨在為數量性狀全基因規模上位效應的相關研究提供理論參考。

數量性狀;上位效應;全基因組關聯分析;方差同質性

在家養動植物遺傳育種中,人們關注的大多數重要經濟性狀屬于數量性狀。經典數量遺傳學觀點認為,數量性狀的表型變異受到大量效應微小的遺傳位點和諸多環境因素的共同作用。然而,長期以來對于不同遺傳位點之間加性效應與上位效應(Epistasis)的相對重要性卻存在著認識上的分歧[1-7]。群體內遺傳方差組分的估計結果表明,大部分的遺傳方差是加性效應方差[2-3,5]。另外一些學者則認為,數量性狀的上位遺傳效應是廣泛存在的[4,6-7],但長期以來關于上位效應的相關研究卻未被重視。

上位效應最早由英國遺傳學家William Bateson于1909年提出,是指一個位點的等位基因效應被另一個位點的等位基因效應所掩蓋的生物學現象。目前,在生物學不同分支領域中存在3種類型的上位效應,即功能上位效應(Functional epistasis)、組合上位效應(Compositional epistasis)和統計上位效應(Statistical epistasis)[8]。其中組合上位效應就是William Bateson所定義的上位效應,而統計上位效應則主要來源于Fisher關于數量性狀表型值的剖分思想。廣義的統計上位效應是指一個遺傳位點對表型值的效應大小與遺傳背景有關,而最簡單的上位效應形式則是指2個遺傳位點之間的相互作用[4]。在實際研究中,上位效應與基因互作效應經常被互換使用。而在數量性狀QTL定位研究中,具有上位效應的數量性狀遺傳位點被簡稱為上位QTL[4](Epistatic QTL)。在過去的許多年中,盡管基于經典的QTL-標記連鎖分析策略檢測影響數量性狀的上位QTL方法已經有所發展[9-10],但成功的家養動物數量性狀上位QTL定位的研究成果并不多見[4,11]。

目前,隨著全基因組關聯分析研究(Genome-wide association study,GWAS)在人類和家養動物領域[12-13]不斷取得的進展以及GWAS分析方法的逐步完善[14-18],在GWAS框架下進行基因互作效應的檢測已引起人們越來越多的興趣。雖然一些常用的GWAS統計分析模型和軟件(PLINK[14]、GenABEL[15])也考慮了上位效應的檢測,但在應用中主要還是針對加性效應的檢測。最近,戶國等[19]對上位效應的概念起源及其對家養動物重要經濟性狀的遺傳影響進行了總結;郭家中等[20]針對家養動物數量性狀的加性效應遺傳位點的GWAS單標記分析策略進行了論述;欒奕昭等[21]討論了如何采用數據挖掘算法分析患病性狀基因的互作。然而,關于利用統計建模和推斷對上位QTL進行定位的研究尚缺乏詳細的探討。本研究以失蹤遺傳力問題作為出發點,首先綜述了標記-QTL連鎖分析和GWAS框架下傳統上位效應遺傳位點的檢測方法,然后對基于表型方差同質性檢驗和廣義線性混合模型方法的上位效應統計推斷以及混雜因素的處理方法進行了總結與梳理,旨在為數量性狀全基因規模上位效應的相關研究提供理論參考。

1 遺傳力失蹤問題

在過去的幾年中,針對人類數量性狀和復雜疾病的GWAS取得了豐碩的成果,鑒定出大量新的遺傳位點[12]。盡管如此,這些位點共同解釋的遺傳方差僅占到遺傳力的一小部分,剩余的大部分遺傳力無法解釋,從而形成“遺傳力失蹤”(Missing heritability)的遺傳學問題[22]。受此影響,GWAS的理論假設和依據遭到一些研究者的質疑[23]。

針對遺傳力失蹤問題,Manolio等[24]進行了詳細討論,并提出遺傳力失蹤的主要原因包括:(1)大多數遺傳位點對數量性狀的表型效應太小,由于統計分析功效的限制,此類位點很難檢測,例如人類的身高性狀[25];(2)數量性狀的表型變異也可能是由基因組結構的變化所引起的,如拷貝數變異(Copy number variation)或結構變異(Structural variation);(3)數量性狀的表型變異也可能受到稀有變異(Rare variants),即少數等位基因頻率小于0.5%的遺傳變異的影響,而由于理論假設的限制,GWAS方法無法檢測這類變異[26];(4)數量性狀的表型變異還可能來源于多個遺傳位點之間的相互作用,即上位效應。而關于上位效應的重要性則被Paré等[27]、Bloom等[28]的報道進一步證實。另外,Zuk等[29]提出基因加性效應方差會因基因互作效應而高估,從而造成遺傳力被低估,該觀點嘗試從遺傳力定義中分母的角度解釋遺傳力失蹤的可能原因。

2 上位效應位點檢測的直接方法

2.1 標記-QTL連鎖分析中的上位效應檢測

相對于數量性狀加性效應的分析,由于統計學上位效應和生物學上位效應之間的差異,上位效應遺傳分析和理論解釋并不統一[8,30]。在數量性狀的遺傳分析中,大家主要討論2個位點間的互作這一最簡單的上位效應形式,也就是將2個位點的總體基因型值與2個位點的邊緣加性效應之和的離差定義為統計上位效應[8](圖1),如圖1-A顯示了雙位點加性效應模式;而圖1-B則展示了雙位點顯性上位效應作用:對于某一數量性狀只有當第1個位點的顯性等位基因不存在時,第2個位點不同基因型控制的表型均值才具有統計上的顯著性差異。而包含了互作效應項的線性模型分析方法通常也被稱為上位效應分析的直接方法,對于雙位點上位效應的檢測可以采用雙因素方差分析(Two-way ANOVA)比較以下2個模型[31]或直接根據模型(2)進行互作效應的估計和推斷:

yij=μ+αi+βj+eij。

(1)

yijk=μ+αi+βj+γij+eij。

(2)

式中:yij、yijk均為數量性狀表型值;μ為對環境效應進行校正后的總體均值,αi為A位點的基因型效應,βj為B位點的基因型效應,eij為服從標準正態分布的殘差,γij為A和B位點的基因型互作效應。

圖1 數量性狀雙位點加性效應和顯性上位效應示意圖

盡管模型(2)是雙位點上位效應分析的常用模型,但在全基因組規模的研究中,還要面臨多重檢驗的問題??紤]到上位效應的性質,如果使用傳統的Bonferroni方法進行多重檢驗的校正則過于保守,可能會遺漏一些真實的位點。針對標記-QTL連鎖分析中上位效應的統計檢驗,Carlborg等[32]提出了上位QTL分析的隨機化檢驗方法,即基于分析的數據直接構造經驗分布。采用上述方法,Carlborg等[11]以赤色原雞與白來航雞雜交所獲得的F2個體作為資源群體,首次檢測到6個控制雞生長性狀的上位效應遺傳位點;隨后,Carlborg等[33]、Besnier等[34]和Pattersson等[35]圍繞影響不同周齡雞體質量的上位QTL開展了系列研究,其中有5個上位QTL在F8世代仍然可以被檢測到。

上述多世代樣本的遺傳分析說明,上位效應是可以穩定遺傳的,這也是迄今為止畜禽重要經濟性狀上位效應的定位中最成功的研究成果。眾所周知,動物的毛色性狀也被認為受上位遺傳效應的控制,但該性狀屬于典型的質量性狀。戶國等[19]對控制動物毛色性狀不同座位的相互關系進行了討論??傮w來說,基于傳統標記-QTL分析的上位QTL研究報道并不多見。究其原因,主要是因為影響數量性狀表型的統計上位遺傳效應非常小而難以檢測,尤其以低密度的微衛星標記作為分析基礎時更不容易檢測。但隨著基因組測序技術的發展,高密度的SNP分型芯片的成功研制為數量性狀QTL定位提供了新的機遇。

2.2 GWAS框架下上位效應位點的檢測

與傳統的標記-QTL連鎖分析只能利用家系內的信息相比,GWAS理論上能夠充分利用群體內包含的所有重組信息,因此該方法有著更高的統計功效[36]。自2005年被成功用于定位與影響人類年齡相關的視網膜黃斑的遺傳變異位點[37]以來,GWAS就迅速地在人類復雜疾病的遺傳研究中得到應用并取得了巨大成功[12]。此后,隨著各物種高密度SNP芯片的陸續開發,該方法又被應用到家養動植物和模式生物數量性狀的遺傳研究中[12,38-39]。

在基于單標記回歸分析策略的數量性狀GWAS方法或模型[13-17]發展成熟后,尤其受到“遺傳力失蹤”問題的影響,如何鑒定具有上位效應的遺傳位點就成為復雜疾病或數量性狀GWAS方法領域發展的重點[40]。事實上,Purcell等[14]開發的PLINK軟件中已經包含了雙位點互作的上位效應分析命令。然而,大規模上位效應具體分析中的最大障礙卻是計算量問題。簡單來說,兩兩互作的二維全基因組分析的計算時間大約是一維單位點加性效應模型所需時間的平方倍。目前,各物種高密度SNP芯片至少包含幾萬個位點,例如豬的Illumina Porcine SNP60K Beadchip、牛的Illumina Bovine SNP50 Beadchip等商業芯片。如果采用上述密度的SNP芯片,全基因組上位效應分析將需要較長的計算時間。例如,Cordell[40]在單節點計算機群上應用PLINK軟件的“——fast-epistasis”命令,最終運行14 d才能完成約90 000個SNPs之間兩兩互作效應的分析。而Wang等[41]推算若在單核計算機上采用EPISNP[42]軟件對500 000個SNPs進行兩兩互作效應的分析,則需要1.2年才能完成。類似地,理論上3個遺傳位點之間互作效應分析所需要的計算時間則是SNPs位點數目的立方倍。因此,在基于高密度SNP芯片數據的實際研究中,若采用上位效應直接檢測方法分析3個以上遺傳位點的互作效應是不現實的。

為了解決計算量問題,Schüpbach等[43]在PLINK軟件上位效應分析模塊的基礎上發展了FastEpistasis軟件。而生物信息學研究人員采用不同的機器學習(Machine Learning)算法,又陸續開發了SNPHarvester[44]、TEAM[45]、BOOST[46]、SNPRuler[47]、Screen and Clean[48]等程序或方法。相對而言,TEAM在單個位點具有主效應的數據分析中統計功效最高;而BOOST則對單位點無主效應的數據統計功效最高。另外,前4種方法是單階段分析方法;而Screen and Clean模型則采用兩步法,其中第二階段只是針對第一階段分析檢測到的顯著性SNPs進行全基因組上位效應分析,通過正向選擇策略總體減少了計算時間,但相對于前4種方法,該方法假陽性率最高[41]。另外,有觀點認為[8,49],以單標記顯著性檢驗為基礎的兩步法并不是非常合理的,因為上位效應可能發生在那些效應非常小的遺傳位點之間,甚至發生在那些根本就沒有主效應的位點之間。最近,Hemani等[50]以經典的數量性狀遺傳分析模型為基礎,利用GPU硬件技術發展了雙位點窮盡式上位效應遺傳分析軟件epiGPU,理論上利用GeForce GTX 580圖形處理器使用 epiGPU將較基于CPU技術的計算機快90倍。Hemani等[51]利用此軟件,采用雙階段分析策略,在846個人類群體樣本中以7 339個基因表達豐度作為表型,進行全基因組規模雙位點上位效應關聯分析,共檢測到500多個雙位點上位效應,顯示了該程序在計算效率上的優勢。

3 基于方差同質性檢驗的上位效應分析

3.1 方差同質性檢驗的非參數方法

如上所述,盡管包括FastEpistasis 和epiGPU在內的一些以模型(2)為理論基礎的高效率計算軟件或程序[42-47,49]已經陸續被開發出來,但在GWAS中尚未得到廣泛應用。而從統計推斷的角度,理論上多個(≥2)遺傳位點之間的互作效應會導致單個位點表型方差的異質性,即不同基因型組間的表型方差具有顯著性差異[27,52]。更重要的是,從計算效率的角度,針對單個位點開展表型同質性檢驗是上位效應遺傳位點檢測的捷徑[52-53]。因此,在統計遺傳學領域,近期關于上位效應的檢測方法主要圍繞方差同質性檢驗而展開。

傳統的方差同質性檢驗主要有兩種方法:一是圍繞樣本觀察值與組內均值的離差構造的Bartlett檢驗;二是以樣本觀察值與組內中位數的離差為基礎而構造的Levene檢驗(即Brown-Forsythe檢驗)。與中位數相比較,許多情況下均值更容易受到樣本中極端值的影響,所以Levene檢驗比Bartlett檢驗更穩健??偟膩碚f,這兩種方法均屬于非參數檢驗,且構造的檢驗統計量均服從F分布。當分母自由度非常大時,F分布近似等價于分子自由度的χ2分布。Levene檢驗可采用下面的公式表示:

(3)

在基于群體水平設計的數量性狀GWAS中,Paré等[27]、Struchalin等[52]最早同時提出將方差同質性統計檢驗方法作為上位效應遺傳位點的分析策略。其中Struchalin等[52]從理論上對基因互作效應估計的直接法和方差異質性檢驗的間接法進行了比較,表明直接檢驗的統計功效高于間接方法,且方差同質性檢驗的功效仍受到單個位點主效應的影響;對于符合正態分布的經典數量性狀,Bartlett檢驗、通過秩轉換后的Bartlett檢驗(Bartlett test with prior rank transformation to normality)以及Levene檢驗3種方法中,Bartlett檢驗擁有最高的統計功效,而當性狀偏離正態分布時,Levene檢驗的統計功效更高。Struchalin等[54]開發了R環境下的GWAS方差異質性分析軟件包VariABEL,其中包含了Bartlett檢驗和Levene檢驗2種方法。而Paré等[27]基于方差同質性檢驗,發現了影響婦女炎癥標記含量的基因互作位點,用實例說明了方差異質性分析是上位效應檢測的一種有效方法。盡管如此,Shen等[55]通過模擬發現,在針對不平衡數據的GWAS中,由于方差的分布偏離正態性、方差理論分布的下限為零和方差與均值的相關性等,基于Bartlett檢驗、Levene檢驗或平方Z-score檢驗(Squared Z-score)的表型方差異質性統計推斷將存在非常高的假陽性率。另外,Shen等[56]還發現,在檢測控制表型方差的遺傳位點研究中,表型數據的刻度水平對統計功效有很大影響,應謹慎使用任何形式的轉換方法對原始數據進行轉換。

3.2 群體混雜因素的考慮

眾所周知,群體水平的全基因組關聯研究必須考慮群體分層及多個親緣關系較近樣本個體對統計檢驗的干擾。顯然,上述因素也同樣會影響群體水平的遺傳方差同質性檢驗。當混雜因素的干擾較低時,考慮到方差同質性檢驗服從χ2分布,仍可采用基因組控制的校正方法[57]。但是在家養動植物數量性狀的遺傳分析中,面對親緣關系造成的高強度混雜,僅使用基因組控制方法進行關聯結果的校正則不夠合理。針對此問題, R?nneg?rd等[58]和Shen等[59]根據層次似然理論(Hierarchical likelihood,h-likelihood),先后發展出基于層次廣義線性模型(Hierarchical Generalized Linear Models)的R軟件包hglm和廣義嶺回歸方法(Generalized Ridge Regression)R軟件包bigRR。上述方法的主要原理是通過在殘差部分中擬合加性隨機效應從而達到對群體混雜的校正。因此,在未來的全基因組方差異質性研究中,上述方法很有可能被廣泛采用。

在傳統的GWAS框架中,與群體水平的研究不同,基于家系的關聯或連鎖分析則從試驗設計上排除了混雜因素對統計推斷的干擾[60]。因此,基于家系設計的數量性狀同類研究在實踐中經常出現。最近,R?nneg?rd等[61]發展了適合于F2或回交設計連鎖分析的方差異質性QTL檢測方法,該方法基于雙層廣義線性模型理論(Double generalized linear model,dglm),通過分別估計遺傳協變量對表型的均值和方差的效應,可同時檢測控制表型均值的普通QTL及影響表型方差的vQTL(Variance-controlling QTL,vQTL)??傮w而言,與Bartlett檢驗、Levene檢驗不同,R?nneg?rd等[61]的方法屬于參數檢驗,尤其對于經典的數量性狀統計功效更高。

3.3 表型方差異質性與上位效應的關系

基于方差同質性檢驗上位效應遺傳位點的檢測策略近期得到了關注及發展,但值得注意的是,方差異質性的存在并不一定僅僅是指發生在2個位點間的上位效應,同時也表明可能有一個復雜的調控網絡存在[53]。另外,數量性狀表型方差異質性也可能是由遺傳因素與環境協變量之間的相互作用造成的;近年來,在動物育種研究領域,由遺傳因素與環境間的互作造成的表型方差異質性也越來越引起大家的興趣[62-64]。簡言之,上位效應與方差異質性之間是充分非必要的關系[52-53]。盡管如此,由于將二維或高維(多個位點間的互作效應)的全基因組分析簡化為一維分析,以基因型分組為基礎的方差同質性檢驗是一種高效的上位效應遺傳位點研究策略。

4 結 語

長期以來,在數量遺傳學和群體遺傳學以及相關領域中,關于上位效應的重要性一直存在爭論[1-7]。3種上位效應的定義以及內涵的差異[8]造成了上位效應理解的困難與混亂,最終導致上位效應的遺傳研究被長期忽視。自2008年以來,受到“遺傳力失蹤”[22]這一科學問題的影響,在全基因組關聯分析框架下數量性狀上位效應的遺傳研究逐漸受到了重視,各種高效率上位效應分析方法和軟件相繼被提出,尤其是基于表型方差同質性的檢驗分析策略被視作全基因組規模上位效應分析的一條捷徑。與此同時,一些研究小組[51,65]以表達譜芯片技術測定的基因表達豐度作為表型值并結合高密度SNP芯片,成功鑒定出多個互作效應位點;另外,也有學者將數量性狀表型值的變異系數(Coefficient of variation,CV)作為因變量,鑒定了控制相關性狀表型變異系數變化的遺傳位點[66-67];而 Jimenez-Gomez等[68]同時采用上述2種策略鑒定出多個影響擬南芥相關代謝性狀的遺傳位點。上述研究策略為數量性狀的上位效應研究開辟了新的思路。隨著SNP分型和表達譜芯片成本的整體下降,這一類型的上位效應研究也許會越來越多。

總體來說,伴隨著統計模型的發展、計算機計算效率的不斷提高以及高密度SNP芯片和高通量測序技術的不斷發展,家養動物數量性狀全基因組規模的上位效應研究將進入新的階段,所獲得的結果將會促進對數量性狀表型變異遺傳機制的更深入理解。

[1] Wright S.Evolution in mendelian populations [J].Genetics,1931,16(2):97-159.

[2] Falconer D S,Mackay T F C.Introduction to quantitative genetics [M].4th Edition.England:Longman,1996:129-140.

[3] Lynch M,Walsh B.Genetics and analysis of quantitative traits [M].Sunderland,MA:Sinauer Associates,1998:65-71.

[4] Carlborg O,Haley C S.Epistasis:Too often neglected in complex trait studies? [J].Nat Rev Genet,2004,5(8):618-625.

[5] Hill W G,Goddard M E,Visscher P M.Data and theory point to mainly additive genetic variance for complex traits [J].PLoS Genet,2008,4(2):e1000008.

[6] Breen M S,Kemena C,Vlasov P K,et al.Epistasis as the primary factor in molecular evolution [J].Nature,2012,490(7421):535-538.

[7] Hemani G,Knott S,Haley C.An evolutionary perspective on epistasis and the missing heritability [J].PLoS Genet,2013,9(2):e1003295.

[8] Phillips P C.Epistasis:The essential role of gene interactions in the structure and evolution of genetic systems [J].Nat Rev Genet, 2008, 9(11):855-867.

[9] Haley C S,Knot S A.A simple regression method for mapping quantitative trait loci in line crosses using flanking markers [J].Heredity,1992,69(4):315-324.

[10] Kao C H,Zeng Z B,Teasdale R D.Multiple interval mapping for quantitative trait loci [J].Genetics,1999,152(3):1203-1216.

[11] Carlborg O,Jacobsson L,Ahgren P,et al.Epistasis and the release of genetic variation during long-term selection [J].Nat Genet,2006,38(4):418-420.

[12] Visscher P M,Brown M A,McCarthy M I,et al.Five years of GWAS discovery [J].Am J Hum Genet,2012,90(1):7-24.

[13] Andersson L S,Larhammar M,Memic F,et al.Mutations in DMRT3 affect locomotion in horses and spinal circuit function in mice [J].Nature,2012,488(7413):642-646.

[14] Purcell S,Neale B,Todd-Brown K,et al.PLINK:A tool set for whole-genome association and population-based linkage analyses [J].Am J Hum Genet,2007,81(3):559-575.

[15] Aulchenko Y S,Ripke S,Isaacs A,et al.GenABEL:An R library for genome-wide association analysis [J].Bioinformatics,2007,23(10):1294-1296.

[16] Aulchenko Y S,de Konning D J,Haley C.Genome-wide rapid association using mixed model and regression:A fast and simple method for genome-wide pedigree-based quantitative trait loci association analysis [J].Genetics,2007,177(1):577-585.

[17] Kang H M,Zaitlen N A,Wade C M,et al.Efficient control for population structure in model organism association mapping [J].Genetics,2008,178(3):1709-1723.

[18] Zhang Z W,Ersoz E,Lai C Q,et al.Mixed linear model approach adapted for genome-wide association studies [J].Nat Genet,2010,42(4):355-360.

[19] 戶 國,王守志,李 輝.上位性及其對家養動物復雜經濟性狀形成的遺傳學影響 [J].東北農業大學學報,2012,43(3):117-122.

Hu G,Wang S Z,Li H.Epistasis and its genetic influence on phenotype shaping of complex economic traits in domestic animals [J].Journal of Northeast Agricultural University,2012, 43(3):117-122. (in Chinese)

[20] 郭家中,王小龍,劉小林.家養動物數量性狀全基因組關聯研究進展:單標記回歸分析策略 [J].家畜生態學報,2013,34(8):1-5.

Guo J Z,Wang X L,Liu X L.Advancement of genome-wide association study for quantitative traits in farm animals:Strategy of single-marker regression analysis [J].Acta Ecologiae Animalis Domastici,2013,34(8):1-5.(in Chinese)

[21] 欒奕昭,左曉宇,劉 軻,等.基于單核苷酸多態性的基因互作分析方法學進展 [J].遺傳,2013,35(12):1331-1339.

Luan Y Z,Zuo X Y,Liu K,et al.Advances in development of gene-gene interaction analysis methods based on SNP data: A review [J].Hereditas,2013,35(12):1331-1339.(in Chinese)

[22] Mahar B.The case of the missing heritability [J].Nature,2008,456(7218):18-21.

[23] McClellan J,King M C.Genetic heterogeneity in human diseases [J].Cell,2010,141:210-217.

[24] Manolio T A,Collins F,Cox N J,et al.Finding the missing heritability of complex diseases [J].Nature,2009,461(7265):747-753.

[25] Yang J,Benyamin B,Mcevoy B P,et al.Common SNPs explain a large proportion of the heritability of human height [J].Nat Genet,2010,42(7):18-21.

[26] Bansal V,Libiger O,Torkamani A,et al.Statistical analysis strategies for association studies involving rare variants [J].Nat Rev Genet,2010,11(11):773-785.

[27] Paré G,Cook N R,Ridker P M.On the use of variance per genotype as a tool to identify quantitative trait interaction effects:A report from the Women’s Genome Health Study [J].PLoS Genet,2010,6(6):e1000981.

[28] Bloom J S,Ehrenreich I M,Loo W T,et al.Finding the sourc-es of missing heritability in a yeast cross [J].Nature,2013,494(7436):234-237.

[29] Zuk O,Hechter E,Sunyaev S R,et al.The mystery of missing heritability:Genetic interaction create phantom heritability [J].Proc Natl Acad Sci USA,2011,109(4):1193-1198.

[30] Alvarez-Castro J M,Carlborg O.A unified model for functional and statistical epistasis and its application in quantitative trait loci analysis [J].Genetics,2007,176(2):1151-1167.

[31] Shen X.Novel statistical methods in quantitative genetics [D].Uppsala (Sweden):Uppsala University,2012.

[32] Carlborg O,Andersson L.Use of randomization testing to detect multiple epistatic QTLs [J].Genet Res,2002,79(2):175-184.

[33] Carlborg O,Kerje S,Schütz K,et al.A global search reveals epistatic interaction between QTL for early growth in the chicken [J].Genome Res,2003,13(3):413-421.

[34] Besnier F,Wahlberg P,Ronnergard L,et al.Fine mapping and replication of QTL in outbred chicken advanced intercross lines [J].Genet Sel Evol,2011,43:3.

[35] Pettersson M,Besnier F,Siegel P,et al.Replication and explorations of higher-order epistasis using a large advanced intercross line pedigree [J].PLoS Genet,2011,7(7):e1002180.

[36] Hirschhorn J N, Daly M J.Genome-wide association studies for common diseases and complex traits [J].Nat Rev Genet,2005,6(2):95-108.

[37] Klein R J,Zeiss C,Chew E Y,et al.Complement factor H polymorphism in age-related macular degeneration [J].Science,2005,308(5720):385-389.

[38] Atwell S,Huang Y S,Vilhjalmsson B J,et al.Genome-wide association study of 107 phenotypes inArabidopsisthalianainbred lines [J].Nature,2010,465(7298):627-631.

[39] Zhao K,Tung C W,Eizenga G C,et al.Genome-wide association mapping reveals a rich genetic architecture of complex traits inOryzasativa[J].Nat Commun,2011,2:467.

[40] Cordell H J.Detecting gene-gene interactions that underlie human diseases [J].Nat Rev Genet,2009,10(6):392-404.

[41] Wang Y,Liu G,Feng M,et al.An empirical comparison of several recent epistatic interaction detection methods [J].Bioinformatics,2011,27(21):2936-2943.

[42] Ma L,Runesha H B,Dvorkin D,et al.Parallel and serial computing tools for testing single-locus and epistatic SNP effects of quantitative traits in genome-wide association studies [J].BMC Bioinformatics,2008,9:315.

[43] Schüpbach T,Xenarios I,Bergmann S,et al.FastEpistasis:A high performance computing solution for quantitative trait epistasis [J].Bioinformatics,2010,26(11):1468-1469.

[44] Yang C,He Z,Wan X,et al.SNPHarvester:A filtering-based approach for detecting epistatic interactions in genome-wide association studies [J].Bioinformatics,2009,25(4):504-511.

[45] Zhang X,Huang S,Zou F,et al.TEAM:Efficient two-locus epistasis tests in human genome-wide association study [J].Bioinformatics,2010,26(12):217-227.

[46] Wan X,Yang C,Yang Q,et al.BOOST:A fast approach to detecting gene-gene interactions in genome-wide case-control studies [J].Am J Hum Genet,2010,87(3):325-340.

[47] Wan X,Yang C,Yang Q,et al.Predictive rule inference for epistatic interaction detection in genome-wide association studies [J].Bioinformatics,2010,26(1):30-37.

[48] Wu J,Devlin B,Ringquist S,et al.Screen and clean:A tool for identifying interactions in genome-wide association studies [J].Genet Epidemiol,2010,34(3):275-285.

[49] Xu S,Jia Z.Genome wide analysis of epistatic effects for quantitative traits in barley [J].Genetics,2007,175(4):1955-1963.

[50] Hemani G,Theocharidis A,Wei W,et al.EpiGPU:Exhaustive pairwise epistasis scans parallelized on consumer level graphics cards [J].Bioinformatics,2011,27(11):1462-1465.

[51] Hemani G,Shakhbazov K,Westra H J,et al.Detection and replication of epistasis influencing transcription in humans [J].Nature,2014,508(7495):249-253.

[52] Struchalin M V,Dehghan A,Witteman J C,et al.Variance he-terogeneity analysis for detection of potentially interacting genetic loci:Method and its limitations [J].BMC Genet,2010,13(11):92.

[53] R?nneg?rd L,Valdar W.Recent developments in statistical me-thods for detecting genetic loci affecting phenotypic variability [J].BMC Genet,2012,13:63.

[54] Struchalin M V,Amin N,Eilers P H,et al.An R package “VariABEL” for genome-wide searching of potentially interacting loci by testing genotypic variance heterogeneity [J].BMC Genet,2012,13:4.

[55] Shen X,Carlborg ?.Beware of risk for increased false positive rates in genome-wide association studies for phenotypic variability [J].Front Genet,2013,4:93.

[56] Shen X,R?nneg?rd L.Issues with data transformation in genome-wide association studies for phenotypic variability [J].F1000Res,2013,2:200.

[57] Shen X,Pettersson M,R?nneg?rd L,et al.Inheritance beyond plain heritability:Variance-controlling genes inArabidopsisthaliana[J].PLoS Genet,2012,8(8):e1002839.

[58] R?nneg?rd L,Xia S,Moudud A.hglm:A package for fitting hierarchical generalized linear models [J].The R Journal,2010,2:20-28.

[59] Shen X,Alam M,Fikse F,et al.A novel generalized ridge regression method for quantitative genetics [J].Genetics,2013,193(4):1255-1268.

[60] Laird N M,Lange C.Family-based designs in the age of large-scale gene-association studies [J].Nat Rev Genet,2006,7(5):385-394.

[61] R?nneg?rd L,Valdar W.Detecting major genetic loci controlling phenotypic variability in experimental crosses [J].Genetics,2011,188(2):435-447.

[62] R?nneg?rd L,Felleki M,Fikse W F,et al.Variance component and breeding value estimation for genetic heterogeneity of residual variance in Swedish Holstein dairy cattle [J].J Dairy Sci,2013,96(4):2627-2636.

[63] Sonesson A K,Odeg?rd J,R?nneg?rd L.Genetic heterogeneity of within-family variance of body weight in Atlantic salmon (Salmosalar) [J].Genet Sel Evol,2013,45:41.

[64] Mulder H A,R?nneg?rd L,Fikse W F.Estimation of genetic variance for macro- and micro-environmental sensitivity using double hierarchical generalized linear models [J].Genet Sel Evol,2013,45:23.

[65] Wang G,Yang E,Brinkmeyer-Langford C L,et al.Additive,epistatic,and environmental effects through the lens of expression variability QTL in a Twin Cohort [J].Genetics,2014,196(2):413-425.

[66] Le Rouzic A.Estimating directional epistasis [J].Front Genet,2014,5:198.

[67] Joseph B,Corwin J A,Kliebenstein D J.Genetic variation in the nuclear and organellar genomes modulates stochastic variation in the metabolome,growth,and defense [J].PLoS Genet,2015,11(1):e1004779.

[68] Jimenez-Gomez J M,Corwin J A,Joseph B,et al.Genomic analysis of QTLs and genes altering natural variation in stochastic noise [J].PLoS Genet,2011,7(9):e1002295.

Advances in statistical approaches for detection of epistatic genetic loci for genome-wide association study of quantitative traits

GUO Jia-zhong1,WANG Xiao-long2,ZHONG Tao1,LIU Hai-feng1

(1CollegeofAnimalScienceandTechnology,SichuanAgriculturalUniversity,Chengdu,Sichuan611130,China; 2CollegeofAnimalScienceandTechnology,NorthwestA&FUniversity,Yangling,Shaanxi712100,China)

The controversy on the relative importance between additive effects and epistasis in genetics research of quantitative traits has existed for a long time,although phenotypic variations for such traits are generally believed to be governed by polygenic genes and many environmental factors.With the recent advancement of genome-wide association study of quantitative traits in humans and domesticated animals,the identification of epistasis or genetic interaction in the framework of genome-wide association study attracted increasing attention.With the issue of missing heritability as the starting point,we firstly reviewed and clarified the conventional approaches for detection of epistatic genetic loci in marker-QTL linkage analyses and genome-wide association studies.Then,we summarized the methods of homogeneity tests,the generalized linear mixed model for both phenotypic variance of quantitative traits,and adjustment of confounding factors.The paper would provide reference for genome-wide epistatic QTL studies on quantitative traits.

quantitative traits;epistasis;genome-wide association study;variance homogeneity

時間:2015-09-09 15:41

10.13207/j.cnki.jnwafu.2015.10.002

2014-03-21

四川省教育廳重點項目(13ZA0264);教育部留學回國人員科研啟動基金項目

郭家中(1982-),男,江蘇徐州人,講師,博士,主要從事動物遺傳育種研究。E-mail:jiazhongguo2003@gmail.com

劉海峰(1974-),男,四川巴中人,副教授,博士,主要從事動物遺傳育種研究。E-mail:liuhf0-1@126.com

S813.1

A

1671-9387(2015)10-0007-07

網絡出版地址:http://www.cnki.net/kcms/detail/61.1390.S.20150909.1541.004.html

猜你喜歡
上位表型方差
概率與統計(2)——離散型隨機變量的期望與方差
方差越小越好?
計算方差用哪個公式
特斯拉 風云之老阿姨上位
建蘭、寒蘭花表型分析
方差生活秀
“三扶”齊上位 決戰必打贏
基于ZigBee和VC上位機的教室智能監測管理系統
GABABR2基因遺傳變異與肥胖及代謝相關表型的關系
慢性乙型肝炎患者HBV基因表型與血清學測定的臨床意義
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合