?

彩色馬蹄蓮轉錄組測序及其特性分析

2020-07-10 10:07張永春蔡友銘楊柳燕
上海農業學報 2020年3期
關鍵詞:馬蹄蓮密碼子彩色

周 琳,張永春,蔡友銘,楊柳燕

(上海市農業科學院林木果樹研究所,上海市設施園藝技術重點實驗室,上海 201403)

彩色馬蹄蓮(Zantedeschiahybrida)為天南星科(Araceae)馬蹄蓮屬(Zantedeschia)的多年生球根花卉[1],因其品種豐富且佛焰苞和葉型多樣,可作為觀賞價值較高的切花或觀葉植物,備受國內外消費者青睞[2]。近年來,國內外在彩色馬蹄蓮組織培養[3]、種球培育和儲藏技術[4]、矮化與促花調控[5]以及抗病育種[6]方面開展了大量工作;然而,相對于其他球根花卉,彩色馬蹄蓮品種的表型差異(如佛焰苞、葉型、葉耳等多樣性)形成機理尚缺乏較為深入的研究。

近年來,測序技術快速發展,且測序成本逐年降低,轉錄組測序(RNA-Seq)可全面地揭示植物在特定時刻和組織的表達基因及其表達量,能夠在整體水平上研究基因功能以及基因結構,揭示特定生物學過程及生長發育過程中的分子機理[7]。目前,轉錄組測序已廣泛應用于植物葉色突變[8]、花色[9]、抗病性[10]等性狀差異機理研究;此外,基于轉錄組數據挖掘的SSR標記(Simple Sequence Repeats,簡單重復序列標記)和SNP標記(Single Nucleotide Polymorphism,單核苷酸多態性標記)也應用于品種鑒定、親緣關系分析、遺傳多樣性評價等研究[11]。

上海市農業科學院通過雜交育種和分子標記輔助選育,獲得了彩色馬蹄蓮切花新品種‘金絲絨’(滬農品認花卉2010第004號)和‘夢幻’(滬農品認花卉2010第003號)?!鸾z絨’株高70—80 cm,株幅50—60 cm,佛焰苞金黃色,周徑(16—18 cm)花枝數為3—5支,葉片為箭形且無葉耳,抗病性較強;‘夢幻’株高60—70 cm,株幅40—45 cm,佛焰苞紫色,同等周徑(16—18 cm)花枝數為4—6支,葉片為戟形且有葉耳,抗病性強。兩個彩色馬蹄蓮品種在株高、株輻、佛焰苞、葉型、花期以及抗性等方面均存在較大差異,可作為表型差異機理研究的材料。本研究以‘金絲絨’和‘夢幻’為材料,采用高通量測序技術,初步篩選與彩色馬蹄蓮表型相關基因,并進行密碼子使用偏好性分析,以期為闡明其表型差異提供依據。

1 材料與方法

1.1 材料

選擇彩色馬蹄蓮(Zantedeschiahybrida)育成品種‘金絲絨’和‘夢幻’直徑為5—6 cm的種球為試驗材料。供試材料選擇標準、赤霉素處理、種植、灌溉和水肥管理等參照楊柳燕等[12]的方法。種植1個月后,選取2個品種球莖、根系和葉片組織,稱重后立即放入液氮中冷凍30 min,隨后放入-80℃冰箱保存。

1.2 方法

1.2.1 RNA提取、文庫構建與檢測

RNA提取、濃度和純度檢測參照李青竹等[13]的方法。將2個彩色馬蹄蓮品種高質量球莖、根系、葉片的RNA等量混合,交由廣州基迪奧生物科技有限公司完成文庫構建和轉錄組測序(Illumina HiSeqTM4000系統)。

1.2.2 轉錄組數據組裝、序列注釋和功能分類

轉錄組測序得到原始數據,數據過濾條件參照陳赫等[14]的方法;使用Trinity軟件[15]進行從頭組裝獲得unigene(非重復序列基因)。將2個彩色馬蹄蓮品種的所有unigene與蛋白序列數據庫Nr(Non-Redundant Protein Sequence Database,非冗余蛋白庫)、Swiss-Prot(Swiss-Prot Protein Sequence Database,Swiss-Prot數據庫)、KOG(Clusters of Orthologous Groups for Eukaryotic Complete Genomes,真核生物蛋白相鄰類的聚簇)以及核酸數據庫KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書)進行比對,比對方法參照李青竹等[13];隨后,進行基因功能注釋、預測其功能分類和參與的生物學途徑。

1.2.3 SSR位點預測和轉錄因子分析

使用MISA軟件(MIcroSAtellite identification tool,version 1.0)進行SSR標記的搜索,具體參數參照李青竹等[13]的設置。轉錄因子(Transcription factors,TF)分析通過將預測的蛋白序列與相應的 TF 數據庫(plant TFdb/animal TFdb)進行hmmscan比對獲得。

1.2.4 密碼子使用偏好性分析

參照賴瑞聯等[16]的方法從轉錄組數據中篩選并提取滿足條件的編碼序列用于后續分析。隨后,利用CodonW 1.4.4軟件(https://sourceforge.net/projects/codonw/files/)對彩色馬蹄蓮轉錄組數據密碼子組成進行分析,包括彩色馬蹄蓮轉錄組中總的GC含量、密碼子的第1、2、3位含量(GC1、GC2、GC3)、有效密碼子數(Effective number of codon,ENC)、同義密碼子第3位GC含量(GC3s)、以及同義密碼子相對使用頻率(Relative synonymous codon usage,RFSC)。最后,依據RFSC結果,參照林濤等[17]的方法鑒定彩色馬蹄蓮基因高頻密碼子。

2 結果與分析

2.1 轉錄組數據統計、組裝

‘金絲絨’和‘夢幻’球莖、根和葉片的RNA各混合樣品,通過Illumina HiSeqTM4000測序平臺獲得原始數據(raw reads)后,先進行數據過濾,即除去含接頭、含N比例大于10%以及低質量的原始讀數序列,以獲得高質量純凈序列(clean reads),測序數據量、GC含量等統計結果見表1。2個材料的clean data均為7 Gb 以上,堿基質量大于Q30的比例分別為95.98%和96.02%,GC含量分別為52.65%和52.44%,表明測序組裝效果較好,滿足開展后續基因注釋和功能分類等要求。利用Trinity軟件對上述獲得的clean reads進行從頭(de novo)組裝,共獲得76 060條非冗余unigene序列,長度范圍為200—17 366 bp,其中多數集中于200—500 bp,平均序列長997 bp,N50為1 938 bp。此外,大于3 000 bp的unigene有5 381條,占總數的7.07%。

表1 轉錄組測序數據質量分析

2.2 基因功能注釋結果

使用BLAST 軟件將unigene與常用的各大數據庫進行比對分析,獲得注釋的unigene共有30 321條(39.86%)。如表2所示,4個數據庫中以Nr和Swiss-Prot數據庫得到的條目較多,分別占全部條目總數的39.78%和24.61%;而KEGG數據庫僅有10 083條(13.26%)unigene得到了注釋,注釋信息最少。

表2 unigene注釋的統計

2.3 unigene功能分類

2.3.1 GO(基因本體,Gene Ontology)分類

在轉錄本中,能夠被注釋到GO分類的unigene僅有2 669條,分別參與到3個GO類別(生物學過程、分子功能和細胞組分)的40個亞類(圖1)。生物學過程的17個亞類中,代謝過程和細胞過程涉及的unigene較多,分別有1 544條和1 277條;分子功能中包括11個亞類,其中催化活性相關基因豐度最高,為1 550條;細胞組分中包括12個亞類,其中細胞和細胞片段包含unigene數量最多,均為844條,其次為細胞器,有619條。

2.3.2 KOG分類

彩色馬蹄蓮76 060條unigene中僅有17 183條(22.59%)注釋到KOG數據庫的25個功能分類(圖2)。注釋數量排名前5的組依次是:通用功能預測(7 736條,45.02%)、蛋白質翻譯后修飾與運轉及分子伴侶(2 943條,17.13%)、信號轉導機制(2 504條,14.57%)、RNA加工和修飾(1 410條,8.21%)、轉錄(1 380條,8.03%);此外,有1 115條(6.49%)注釋到功能未知。

2.3.3 KEGG分類

注釋到KEGG數據庫的10 083條unigene中有5 358條(53.14%)參與了132條代謝通路;所涉及的代謝通路包括:代謝(9 252條,73.18%)、遺傳信息處理(2 233條,17.66%)、細胞過程(497條,3.93%)、環境信息處理(394條,3.12%)和有機系統(266條,2.10%)。在最大的類別,即代謝途徑中,代謝途徑和次生代謝產物的生物合成途徑是unigene最為富集的2個途徑,分別有2 125條和1 108條unigene。

2.4 SSR標記和轉錄因子分析

2.4.1 SSR標記分析

從彩色馬蹄蓮所有的unigene中進行SSR位點檢索,最終從9 721條unigene序列中檢索到13 206個SSR位點,其中有2 429條unigene含有2個或2個以上的EST-SSR位點。SSR的5種重復類型所占比例存在顯著差異,二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重復所占比例分別為61.31%、31.02%、4.24%、1.79%和1.64%。彩色馬蹄蓮所有SSR 基序中,AG/CT(47.8%)比率最高,其次為AC/GT、AAG/CTT和AGG/CCT,分別占7.8%、6.7%和6.3%,所占比例均顯著低于AG/CT;此外,AAAG/CTTT、AAAT/ATTT和AGAT、ATCT所占比例均低于1%。

2.4.2 轉錄因子分析

基于彩色馬蹄蓮轉錄組數據,預測出54個TF家族,共有1 115個TF的unigene,其中數量最多的前10個TF類型為bHLH、ERF、MYB、MYB_related、bZIP、NAC、C2HA、WRKY、C3H和Trihelix(圖3),分別占總預測量的8.25%、7.00%、5.92%、5.83%、5.47%、5.20%、5.11%、4.84%、4.13%和3.41%。54個TF家族在植物的信號轉導、生長發育(花和花粉發育、光周期反應、碳氮代謝以及次生代謝產物合成)、抗逆性等方面發揮重要作用。這些TF的發現將為后續研究彩色馬蹄蓮生長發育過程提供新思路。

2.5 轉錄組密碼子使用偏好性分析

2.5.1 GC含量及有效密碼子數分析

從2個彩色馬蹄蓮76 060條unigene中共篩選出33 090條高置信蛋白編碼基因CDS 序列。彩色馬蹄蓮轉錄組密碼子使用偏好性分析結果顯示,unigene 平均總GC含量為50.67%;GC1、GC2和GC3分別為54.29%、43.23%和54.48%,而GC3s則為53.00%。彩色馬蹄蓮GC3s略低于GC3含量,這與模式植物(擬南芥)[18]、木本植物(枳[19]、楊梅[20]和黃皮[21])的GC3s與GC3比較結果相一致。彩色馬蹄蓮ENC分布范圍為20.61—61.00,雖然其中有3 473條unigene的ENC值小于35,但ENC平均值為57.59,參照密碼子使用偏好性對ENC值的設定范圍,表明彩色馬蹄蓮轉錄組數據中密碼子不存在明顯的使用偏好性。

2.5.2 彩色馬蹄蓮的RFSC和HF

對篩選獲得的33 090條表達基因的密碼子進行同義密碼子相對使用頻率(RFSC)分析表明(表4),彩色馬蹄蓮表達基因的密碼子RFSC差異較大。根據高頻密碼子篩選法[17],彩色馬蹄蓮轉錄組中高頻使用密碼子僅有3個,分別為AGG(編碼精氨酸)、CAG(編碼谷氨酰胺)和AAG(編碼賴氨酸)。

表4 彩色馬蹄蓮表達基因的同義密碼子相對使用頻率(RFSC)和高頻密碼子(HF)

Table 4 The relative frequency of synonymous codon(RFSC)and high-frequency codons(HF) of coding sequences inZantedeschiahybrida

3 結論與討論

本研究通過彩色馬蹄蓮‘金絲絨’和‘夢幻’2個品種的轉錄組測序,獲得到了高質量的測序數據,為彩色馬蹄蓮后續基因功能研究提供了豐富的序列信息。經組裝共得到76 060條unigene,基于四大公共數據庫,共注釋到30 321條unigene,仍有45 739條unigene未獲得注釋。這是由于球根花卉整體基因組較大,相對基因組測序進展落后,同時與彩色馬蹄蓮轉錄組和基因克隆研究工作相對滯后于其他球根花卉有關。

彩色馬蹄蓮品種間株高、株輻、佛焰苞顏色、肉穗花序顏色、喉斑、葉型以及葉片斑點等存在較大差異。本研究從2個彩色馬蹄蓮切花品種的轉錄組數據中挖掘到大量的unigene,這些unigene參與到馬蹄蓮生長的各個重要代謝途徑。KOG分類表明,有7 736條unigene注釋到通用功能預測。由代謝通路分析結果可見,有9 252條unigene參與代謝通路,其中代謝途徑和次生代謝產物的生物合成途徑最為富集。這些對比結果為彩色馬蹄蓮性狀相關基因克隆、表達分析、功能驗證等提供了理論基礎。

基于轉錄組數據,從彩色馬蹄蓮的9 721條unigene中挖掘出13 206個SSR位點,其中二核苷酸重復最多,占60%以上,Wei等[22]在彩色馬蹄蓮品種‘Rehmannii’不同組織轉錄組數據中挖掘的SSR位點與本研究結果一致。利用轉錄組挖掘SSR標記時,品種間基序類型和比例的結果存在較大差異,本研究基于‘金絲絨’和‘夢幻’轉錄組挖掘的SSR中,AG/CT、AC/GT、AAG/CTT和AGG/CCT出現頻率最高,而Wei等[22]研究‘Rehmannii’的轉錄組數據中出現頻率最高的4類基序則為AG/CT、AT/TA、GAA/CTT和AAG/CTT。這可能與彩色馬蹄蓮栽培品種間在株型、葉型、花色等方面差異較大有關。彩色馬蹄蓮分子標記的開發先前主要集中于簡單重復序列間擴增(ISSR)和隨機擴增多態性DNA標記(RAPD),并用于品種鑒定和遺傳多樣性評估[23-25];近年來,Wei等[22]基于單個品種不同組織的轉錄組數據挖掘了9 933個SSR標記和7 162個SNP標記,并通過21個彩色馬蹄蓮種質從200對SSR引物中篩選出58個穩定且具多態性的引物。本研究中‘金絲絨’和‘夢幻’作為2個性狀差異顯著的彩色馬蹄蓮品種,從其轉錄組數據中挖掘的SSR標記,將有助于彩色馬蹄蓮親緣關系和遺傳多樣性的分析,對于彩色馬蹄蓮分類及指導育種具有重要意義。此外,彩色馬蹄蓮中數量較多的轉錄因子如bHLH、ERF、MYB和bZIP,在信號轉導、生長發育、次生代謝、非生物脅和生物脅迫應答方面發揮重要作用[26-28],為彩色馬蹄蓮生長發育研究尤其是表型差異研究提供了重要的線索和依據。

通過對彩色馬蹄蓮33 090條CDS序列的密碼子使用偏好性分析,發現彩色馬蹄蓮密碼子不存在明顯的使用偏好性,但在同義密碼子相對使用頻率分析中,發現彩色馬蹄蓮表達基因中不同密碼子的RFSC差異較大。此外,本研究發現2個彩色馬蹄蓮品種高頻使用密碼子僅有3個,分別為AGG、CAG和AAG,這與已報道的物種存在較大差異;如草莓[29]、川貝母[30]、石榴[31]和黃皮[21]分別有21個、15個、19個、11個高頻密碼子。其可能原因是物種間、器官間、細胞核基因和細胞器基因間、基因家族成員間均存在密碼子使用偏好性[16],導致彩色馬蹄蓮密碼子使用偏好性與其他研究結果差異較大。

綜上,本研究利用轉錄組測序技術,獲取了‘金絲絨’和‘夢幻’彩色馬蹄蓮品種的unigene,并利用四大數據庫對unigene進行了功能注釋、功能分類、代謝途徑預測、SSR標記挖掘以及密碼子使用偏好性分析等研究,有助于深入了解彩色馬蹄蓮表型差異機理,并為其分子育種奠定基礎。

猜你喜歡
馬蹄蓮密碼子彩色
鐮翅羊耳蒜葉綠體基因組密碼子偏好性分析
有那樣一抹彩色
新型密碼子、反密碼子、氨基酸對應盤
彩色的風
對“翻譯”過程中幾個問題的探討
白色馬蹄蓮
2種果蠅(Drosophila melanogaster與D.sechellia)線粒體及NADH dehydrogenase subunit基因的密碼子偏好性分析
被折彎的馬蹄蓮
彩色手表
馬蹄蓮
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合