?

玉米莖稈營養品質性狀全基因組關聯分析及候選基因篩選

2023-12-29 03:41王幫太楊美麗王志紅鹿紅衛程建梅秦貴文陳甲法
北方農業學報 2023年5期
關鍵詞:自交系莖稈關聯

王幫太,楊美麗,郭 華,王 靜,王志紅,鹿紅衛,程建梅,秦貴文,陳甲法

(1.鶴壁市農業科學院,河南鶴壁 458031;2.河南省玉米良種培育工程技術研究中心,河南鶴壁 458031;3.河南農業大學生命科學院,河南鄭州 450002)

玉米是世界上主要的糧飼作物之一,優質的青貯玉米具備較高的淀粉、蛋白質含量和較低的纖維含量等特征[1]。玉米莖稈占整株產量的50%以上,是玉米個體的重要器官。青貯玉米莖稈營養品質性狀主要包括中性洗滌纖維(NDF)、酸性洗滌纖維(ADF)、粗蛋白(CP)、脂肪含量(FAT)、消化率(IVDMD)和可溶性糖(WSC)等主要指標。

1997 年,LüBBERSTEDT 等[2]利用測交群體開始對青貯玉米主要營養品質性狀進行QTL 定位研究,檢測到4 個粗蛋白產量和10 個粗蛋白含量QTL信息,可解釋表型變異在48.3%~85.3%;MéCHIN等[3]在青貯玉米重組自交系群體中定位到28 個與中性洗滌纖維、酸性洗滌木質素和消化率等性狀的QTL,分布在1、4、6、7 號染色體上,可解釋9.8%~13.9%變型變異;CARDINAL 等[4]同樣以重組自交系群體在玉米葉鞘和莖稈中定位到31 個和23 個與NDF、ADF 含量相關的QTL;BARRIèRE 等[5-7]重點對木質素含量QTL 進行研究,發現其主要分布在bin1.02(76~80 cM)、bin1.07(228~230 cM)和bin8.07(134~142 cM)區域,在bin2.04 區域發現解釋表型變異43%的真實性木質素QTL;隨著玉米全基因組關聯分析技術在性狀顯著性發掘和應用,WANG等[8]以368 份自交系作為關聯群體,利用全基因組關聯分析技術,檢測到73 個ADF 顯著性SNP、41 個NDF 顯著性SNP 和82 個IVDMD 顯著性SNP,解釋變異4.2%~6.2%,篩選到56 個候選基因與青貯品質相關。李燦[9]以338 份玉米自交系為材料,對ADF、NDF、IVDMD 和CP 等主要營養品質性狀進行關聯分析,發掘4 個ADF、10 個NDF、3 個CP 和3 個IVDMD 顯著性SNP,并在顯著位點附近篩選到12 個相關性狀候選基因。李坤[10]在7 個環境條件下,以368 份玉米自交系為材料,檢測到64 個和69個分別與細胞壁組分和消化品質性狀顯著關聯位點,并在關聯的候選基因中發現了ZmC3H2 與多個性狀顯著關聯,直接參與木質素合成途徑。林淼等[1,11]以341 份玉米自交系為材料,分別對青貯玉米秸稈消化率和中性洗滌纖維含量進行全基因組關聯分析,檢測到153 個IVDMD 顯著性SNP,69 個NDF顯著性SNP,共發掘38 個和IVDMD 關聯的候選基因,10 個和NDF 關聯的候選基因,主要涉及細胞生長發育、脅迫應答和信號轉導等生物學功能。前人對玉米莖稈營養品質性狀進行全基因組關聯分析研究多集中在一年時間和固定生育期,還未見兩年時間和多個生育周期研究報道。

本研究以381 份玉米自交系組成自然群體,遺傳基礎豐富,采用基因型與玉米莖稈營養品質相關性狀表型數據進行關聯分析,在不同年份玉米不同生育期中找到控制玉米莖稈營養品質相關性狀的顯著SNP 信息,進而挖掘出相關候選基因,以期為培育優質的青貯玉米品種提供理論參考。

1 材料和方法

1.1 試驗材料及設計

選擇381 份玉米自交系組成供試群體材料,包含國內骨干自交系和國際主要的優勢群,群體材料由墨西哥國際玉米小麥改良中心(CIMMYT)收集提供。381 份材料含有普通玉米自交系235 份、爆裂玉米自交系58 份、糯玉米自交系材料88 份。2016 年、2017 年兩年時間,將381 份群體材料種植于鶴壁市農業科學院試驗園區,采用隨機區組設計,每個自交系材料種植2 行,行長5.0 m,行距0.6 m,株距0.2 m,3 個重復,田間生長按照正常農業生產進行管理。

1.2 表型數據測定方法和統計方法

在玉米抽雄期、灌漿期、成熟期對莖稈營養品質性狀中性洗滌纖維(NDF)、酸性洗滌纖維(ADF)、消化率(IVDMD)進行測定,編號分別為2016 年NDF(16NDF1)、灌漿期(16NDF2)、成熟期(16NDF3),2016 年、2017 年其他性狀編號類同。每份供試自交系各生育期選取生長一致的3 棵植株,在第3 節上下莖節處剪斷取樣后在105 ℃鼓風干燥箱內進行殺青30 min,65 ℃烘至恒重,用錘式粉碎機混合粉碎樣品,過0.5 mm 網篩,存放備用。利用近紅外光譜分析儀(BRUCK FT-NIR)對樣品NDF、ADF 和IVDMD進行測定,將樣品放于直徑50 mm 的樣品測定杯中,每份樣品掃描3 次,取平均值。采用Excel 2007、DPS 7.05 軟件進行數據統計相關分析及遺傳力計算。利用R 語言“CMplot”軟件包進行相關性狀關聯圖的繪制(https://github.com/YinLiLin/CMplot)。

1.3 基因型測定與全基因組關聯分析

2021 年,挑選儲存于-80 ℃超低溫冰箱中群體材料葉片236 份,采用磁珠法提取基因組DNA,完成DNA 濃度、純度和完整性檢測。由河北渥太華公司利用Maize SNP50 基因芯片進行基因分型,該芯片包括500 000 個SNP 標記,質控后獲得461 053 個高質量SNP 標記進行全基因組關聯分析(圖1)。

圖1 包含461 053 個SNP 標記的染色體密度圖Figure 1 The chromosome density map with 461 053 SNP markers

為充分挖掘玉米莖稈營養品質性狀顯著性SNP信息,篩選更為真實性顯著SNP 位點,在考慮群體結構和親緣關系的情況下,利用TASSEL V5.0 軟件[12]的廣義線性模型(GLM)和混合線性模型(MLM)2 種模型對不同年份玉米不同生育期莖稈營養品質性狀NDF、ADF 和IVDMD 進行關聯分析,以群體結構-主成分分析(principle component analysis,PCA)為固定效應,親緣關系(kinship)作為隨機效應。根據發表的相同關聯群體[9-11]Bonferroni 校正閾值GLM 模型選擇P<0.05/n,MLM 模型選擇P<1/n,n=標記數量[13],因此,本研究的閾值GLM 模型閾值為P<1.08×10-7,MLM 模型閾值為P<2.17×10-6。

1.4 候選基因的預測

以公共數據庫MaizeGDB(https://www.maizegdb.org/genome/)B73 參考基因組(B73 RefGenv4)序列信息為參考,獲取顯著關聯SNP 的上、下游1 kb 范圍內基因作為玉米第3 節莖稈相關性狀候選基因。在Uniprot 蛋白質數據庫對候選基因進行注釋和功能預測(https://www.uniprot.org/uniprotkb/)。

2 結果與分析

2.1 玉米莖稈營養品質性狀表型分析

2016 年和2017 年玉米不同生育時期莖稈營養品質性狀基本描述統計和頻率分布圖見表1、圖2~圖7。由表1、圖2~圖7 可知,各性狀變異范圍較大,變異系數除16IVDMD3 和17IVDMD2 外均小于15%,表型多樣性較為豐富。各性狀偏度和峰度絕對值均小于1,結合性狀分布頻率直方圖,基本呈現正態分布態勢,符合典型的數量性狀特征。不同年份各生育期玉米莖稈營養品質性狀的廣義遺傳力除16NDF 外均大于40%,說明這些性狀主要受遺傳因素影響。結合方差分析結果可知,年度內不同性狀之間存在極顯著差異,各性狀也受部分環境因素的影響。

表1 年份間玉米不同生育時期莖稈營養品質性狀統計分析Table 1 Statistical analysis of maize stem nutritional quality traits in different growth stages between years

圖2 2016 年莖稈營養品質性狀(ADF)頻率分布圖Figure 2 Frequency distribution of stem nutritional quality traits(ADF)in 2016

圖3 2016 年莖稈營養品質性狀(NDF)頻率分布圖Figure 3 Frequency distribution of stem nutritional quality traits(NDF)in 2016

圖4 2016 年莖稈營養品質性狀(IVDMD)頻率分布圖Figure 4 Frequency distribution of stem nutritional quality traits(IVDMD)in 2016

圖5 2017 年莖稈營養品質性狀(ADF)頻率分布圖Figure 5 Frequency distribution of stem nutritional quality traits(ADF)in 2017

圖6 2017 年莖稈營養品質性狀(NDF)頻率分布圖Figure 6 Frequency distribution of stem nutritional quality traits(NDF)in 2017

圖7 2017 年莖稈營養品質性狀(IVDMD)頻率分布圖Figure 7 Frequency distribution of stem nutritional quality traits(IVDMD)in 2017

2.2 玉米不同生育期莖稈營養品質性狀全基因組關聯分析

利用Tassel 5.0 軟件對測序的236 份玉米自交系兩年不同生育期的莖稈營養品質性狀分別進行全基因組關聯分析,繪制曼哈頓圖和QQ 圖(圖8、圖9),利用GLM 模型分別對兩年不同生育期玉米莖稈營養品質性狀進行分析,2016 年在玉米10 條染色體上共檢測出207 個顯著關聯的SNP 位點,第1 號~第10 號染色體分別檢測出31、7、20、11、1、17、92、9、10 和9 個。檢測到的顯著性SNP 數ADF 為61 個(ADF1:60 個,ADF3:1 個)、NDF 為35 個(NDF1:35 個)、IVDMD 為111 個(IVDMD1:110 個,IVDMD3:1 個),表型變異解釋率9.69%~17.23%,其中表型解釋率最高的位點為8 號染色體的115 738 055,與IVDMD1 顯著關聯。2017 年在玉米10 條染色體上共檢測出185 個顯著關聯的SNPs 位點,第1 號~第10 號染色體分別檢測出36、15、13、24、6、13、45、15、7 和11 個。檢測到的顯著性SNP 數ADF 為39 個(ADF1:30 個,ADF2:9 個)、NDF 為85 個(NDF1:85 個)、IVDMD 為61 個(IVDMD1:59 個,IVDMD2:1 個,IVDMD3:1 個),表型變異解釋率10.40%~17.34%,其中表型解釋率最高的位點為1 號染色體的78 928 972,與IVDMD1 顯著關聯。

圖8 利用GLM 模型2016 年、2017 年玉米莖稈營養品質性狀曼哈頓圖和QQ 圖Figure 8 The Manhattan map and QQ map of maize stem nutritional quality traits with GLM model in 2016 and 2017

利用MLM 模型(PCA+K)對兩年不同生育期玉米莖稈營養品質性狀進行關聯分析,2016 年在玉米10 條染色體上共檢測出11 個顯著關聯的SNPs 位點,分布在第1、4、5、6、7、9 號染色體上,檢測到的SNP 個數ADF 為2 個(ADF1:1 個,ADF3:1 個)、NDF 為2 個(NDF1:1 個,NDF3:1 個)、IVDMD 為7 個(IVDMD1:1 個,IVDMD2:4 個,IVDMD3:2 個),表型變異解釋率9.82%~11.94%,其中表型解釋率最高的位點為1 號染色體的101 479 365,與IVDMD2 顯著關聯。2017 年在玉米10 條染色體上共檢測出246 個顯著關聯的SNP 位點,第1 號~第10 號染色體分別檢測出23、20、16、56、36、21、20、12、7 和35 個。檢測到的顯著性SNP 數ADF 為2 個(ADF1:1 個,ADF3:1 個)、NDF 為242 個(NDF1:241 個,NDF2:1 個)、IVDMD 為2 個(IVDMD1:2 個),解釋表型變異為10.80%~20.20%,其中表型解釋率最高的位點為6 號染色體的156 196 975,與NDF1顯著關聯。

利用GLM 和MLM 模型進一步分析發現,2 次以上獨立關聯分析檢測的玉米莖稈營養品質性狀顯著性SNP 分別有97 個和17 個(表2),推測這些位點攜帶可在不同環境下穩定調控玉米莖稈營養品質性狀的重要基因;相同玉米莖稈營養品質性狀不同生育期發現到2 次以上獨立關聯分析檢測到的SNP分別有9 個,推測這些位點可能攜帶玉米莖稈營養品質相關性狀生長過程中重要基因,在多個生育期都持續表達,發揮作用;不同模型下相同玉米莖稈營養品質性狀生育期發現到2 次以上獨立關聯分析檢測到的SNP 有14 個,推測這些位點攜帶的候選基因更能夠在玉米莖稈營養品質相關性狀穩定表達。同時還發現不同玉米莖稈營養品質性狀有76 個相同顯著性SNP,這些位點可能為一因多效顯著性位點。這些SNP 針對玉米莖稈營養品質相關性狀可被多次顯著關聯,屬于高可信度(high confidence,HC)SNP。其中,HC-SNP 位點2_61970473利用不同模型在兩年間不同生育期內檢測到11 次與ADF、NDF、IVDMD 顯著相關,1_78928972 位點檢測到7次與ADF、NDF、IVDMD 顯著相關,并且檢測到7_147043382~7_148071053 區段內聚集著不同模型發掘的48 個與莖稈營養品質性狀顯著SNP,這個區段可能為玉米莖稈營養品質性狀相關基因富集區域。

表2 利用模型分析2 次以上獨立關聯分析檢測到的顯著性SNP 信息Table 2 Significant SNP information detected by more than 2 independent association analyses using model analysis

2.3 玉米莖稈相關性狀關聯基因分析

基于2 種模型關聯的649 個玉米莖稈營養品質相關性狀顯著性SNP 位點上下游1 kb 范圍內進行候選基因的篩選預測,結合基因功能注釋共鑒定出159 個候選基因(表3),其中有43 個候選基因被2 次以上重復檢測到,這些基因可能為玉米莖稈營養品質性狀的高可信度關聯基因。利用GLM 模型共獲得77 個候選基因,它們大多數編碼酶類、信號轉導蛋白和轉錄因子。利用MLM 模型共獲得82 個候選基因,其中與GLM 模型候選基因重合的有10 個,它們大多數編碼產物為合成蛋白、激酶參與無機離子的轉運與代謝。同時本研究還發現29 個未知功能基因為 Zm00001d026565、Zm00001d023185、Zm00001d024649、Zm00001d024650、Zm00001d023970、Zm00001d023676、Zm00001d048287、Zm00001d008080、Zm00001d009180、Zm00001d021293、Zm00001d019026、Zm00001d019024、Zm00001d019023、Zm00001d019013、Zm00001d001384、Zm00001d001641、Zm00001d001606、Zm00001d014857、Zm00001d014501、Zm00001d013952、Zm00001d054036、Zm00001d027026、Zm00001d053669、Zm00001d027025、Zm00001d050766、Zm00001d041952、Zm00001d000471、Zm00001d005084、Zm00001d029912。

2.4 高可信度關聯基因鑒定和功能分析

利用2 種模型共有43 個候選基因被2 次以上重復檢測到,其中,Zm00001d021261 在多個位點發現31 次與不同年份ADF、NDF 和IVDMD 相關聯,其編碼產物為ATP 結合蛋白,葉綠體傳感器激酶,在成熟期葉片中表達量最高;Zm00001d021255 在2 個位點發現10 次與玉米莖稈營養品質性狀相關聯,其編碼產物為富半胱氨酸受體樣蛋白激酶25,只在發育節間和雌穗中表達;Zm00001d029606 在位點1_78912383 發現6 次與玉米莖稈營養品質性狀相關聯,其編碼產物為激酶類,參與MAPK 通路細胞信號調節作用,與病原體攻擊和其他應激的反應有關;Zm00001d021291 在位點7_148071053 發現6 次與玉米莖稈營養品質性狀相關聯,其為調節器APRR9 響應基因;Zm00001d026568,Zm00001d02-6569 同時在位點10_148732794 發現5 次與玉米莖稈營養品質相關性狀相關聯,其編碼產物為三角狀五肽重復的蛋白質和酰胺激酶,在葉片中表達量最高。Zm00001d041780,Zm00001d000617 同時在位點3_137592942 發現4 次與玉米ADF 和NDF性狀相關聯,其編碼產物為鋅指同源域蛋白4;Zm00001d039507 在位點3_6124686 發現4 次與玉米莖稈營養品質性狀相關聯,其編碼產物為富半胱氨酸受體樣蛋白激酶26;Zm00001d033937 在位點1_279122467 發現4 次與玉米莖稈營養品質性狀相關聯,在玉米胚乳中表達量最高。

3 討論

3.1 玉米莖稈營養品質性狀顯著SNP 位點比較分析

采用GLM 和MLM 兩種模型關聯到包括98 個HC-SNP,通過比較國內外玉米莖稈相關性狀遺傳定位結果進行比較分析。李燦[9]在位點2_61856982、10_132526605 關聯到玉米莖稈ADF 性狀與本研究在位點2_ 61970473、10_136566105 關聯到兩年玉米莖稈ADF 性狀位點相近;李坤[10]在位點4_212042636、5_214950148、9_154310517 與本研究在位點4_223568479、5_209142766、9_157236166 關聯到的玉米莖稈ADF 性狀位點相近,在位點1_289067501、4_238963925、5_208726501、6_11214-0579、6_165811525、7_15004700 與本研究在位點1_286593168、4_239700521、5_209142766、6_10295-0077、6_167554233、7_15377961 關聯到的玉米莖稈IVDMD 性狀位點相近,在位點1_210484552、4_150890717、5_151630980、5_179270149、6_14896-1496、6_155653406、6_159384518 與本研究在位點1_212493921、4_153166802、5_155920231、5_18313-8128、6_151315534、6_155681347、6_160117741 關聯到的玉米莖稈NDF 性狀位點相近;林淼等[11]在位點1_253292068、2_192262471、5_168240423 與本研究在位點1_253671539、2_199745298、5_164599381 關聯到的玉米莖稈NDF 性狀位點相近;WANG 等[12]在位點6_155653406、4_104075114 關聯到的玉米莖稈NDF 與本研究在位點6_155681347、4_100978305 關聯到的玉米莖稈NDF 性狀位點相近;本研究中定位到的玉米莖稈營養品質性狀顯著性SNP 區間與以往前人研究的相關性狀有較多的重合,這證明定位到的玉米莖稈營養品質相關性狀的結果可靠性較高,適合進一步對玉米莖稈相關性狀關鍵基因的挖掘[13]。另外,本研究檢測到的與以往研究不同的新的顯著性SNP 位點,特別是一些高可信度顯著SNP 位點以及表型解釋率在15%以上的高效顯著SNP,對于發掘出玉米莖稈營養品質相關性狀新的顯著性位點,進而挖掘一些新的關聯基因具有重要意義。

3.2 玉米莖稈相關性狀關聯基因分析

在本研究中,IVDMD 的遺傳力估計值相對較高,兩年均大于50%,揭示了IVDMD 性狀的強大遺傳基礎。2016 年,ADF 與NDF 之間存在極顯著的正相關(r=0.97),ADF、NDF 與IVDMD 之間存在極顯著負相關(ADF:r=-0.93,NDF:r=-0.90),2017 年,ADF 與NDF 之間存在極顯著的正相關(r=0.92),ADF、NDF 與IVDMD 之間存在極顯著負相關(ADF:r=-0.89,NDF:r=-0.90),這表明高纖維含量的基因型種質材料將難以消化[14]。

中性洗滌纖維組成成分包括全部的半纖維素、纖維素、木質素及少量硅酸鹽等雜質[15],酸性洗滌纖維組成成分包括全部的纖維素、木質素和少量的酸不溶灰分等成分[16],纖維素是植物細胞壁主要成分,而細胞壁作為一種復雜的基質,多種酶家族會直接影響細胞壁物質代謝和合成[17],另外,脂肪酸代謝和脂質代謝可能也會影響細胞壁合成。細胞壁結構還受動態的細胞骨架和細胞壁聚合物多種運輸途徑的調節和組織影響[18]。玉米莖稈構成主要有纖維素,還有少量糖類、無機鹽和水分,莖的側生分生組織開始分裂,束中形成層生長分化,莖稈開始加粗和伸長[19]。

本研究顯著性SNP 標記重復關聯到的高可信度候選基因Zm00001d017867、Zm00001d048496、Zm00001d053713、Zm00001d0537、Zm00001d017867、Zm00001d038950、Zm00001d019075、Zm00001d038-570、Zm00001d016492 在前人的研究中都得到驗證,與莖稈營養品質性狀相關,參與調控代謝物質、細胞壁形成和物質運輸等,進一步可影響莖的分化和皮層發育。另外,本研究還發現了一些與莖稈相關性狀關聯的新的基因信息,在維持組織細胞結構、參與根莖的生長調節因子和輔酶家族的調控,特別提出的是Zm00001d029606 基因編碼產物為激酶類,參與MAPK 通路細胞信號調節作用,該蛋白激酶與對病原體攻擊和其他應激的反應有關[20];Zm00001d021291 基因為調節器APRR9 響應基因[20-25];Zm00001d041780,Zm00001d000617 基因編碼產物為鋅指同源域蛋白4[26-27]。

4 結論

本研究利用461 053 個高質量SNP 對236 份玉米自交系莖稈營養品質相關性狀ADF、NDF 和IVDMD 進行全基因組關聯分析。兩年環境下采用GLM 和MLM 兩種模型分別關聯到392 個和257 個莖稈營養品質相關性狀顯著性SNPs,表型變異解釋率為9.69%~20.20%。其中,2 種模型分別有97 個和17 個位點相同性狀各生育期發現到2 次以上獨立關聯分析顯著SNP,屬于HC-SNP。發現位點7_147043382~7_148071053 區段內聚集著不同模型發現的48 個與莖稈營養品質性狀顯著SNP,該區段屬于莖稈營養品質相關性狀關聯基因富集區域。結合基因功能注釋共鑒定出159 個候選關聯基因,其中有43 個候選基因被2 次以上重復檢測到。采用GLM和MLM 兩種模型可以快速、有效地關聯到與莖稈營養品質相關性狀顯著性位點,通過重復性顯著位點篩選出HC-SNP,進而挖掘出關聯基因富集區域。

猜你喜歡
自交系莖稈關聯
水稻莖稈接觸物理參數測定與離散元仿真標定
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“一帶一路”遞進,關聯民生更緊
谷子莖稈切割力學特性試驗與分析
玉米自交系京92遺傳改良研究
施肥量與施肥頻率對紫花苜蓿莖稈直徑及長度的影響
奇趣搭配
不同來源玉米自交系穗粒性狀的多樣性分析與改良
智趣
SRAP結合SSR標記分析油菜自交系的遺傳多樣性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合