?

煙草甲線粒體基因組序列測定與分析

2020-12-22 13:58夏麗媛孫為偉崔淼伍祎
煙草科技 2020年12期
關鍵詞:偏度密碼子線粒體

夏麗媛,孫為偉,崔淼,伍祎*

1.國家糧食和物資儲備局科學研究院,北京市西城區百萬莊大街11號100037

2.河南糧食作物協同創新中心,鄭州市金水區紅專路13號北90米450002

3.江蘇省現代糧食流通與安全協同創新中心,南京市玄武區光華路1號210023

煙草甲Lasioderma serricorne,又稱煙甲蟲,鞘翅目竊蠹科,于1848年在法國被首次報道[1],目前已廣泛分布于世界各地[2],在我國的絕大多數省區煙草甲均有發生[3-4]。在煙草工業中,煙草甲是世界煙草儲藏的頭號害蟲[5-6],每年引起的煙草損失約占煙草總量的0.7%~1%[7-8]。害蟲的基礎研究是有效防治的前提和基礎,前期對煙草甲的研究主要集中在生物學特性和生態學層面[9-11],然而分子水平的研究還較為缺乏。隨著分子生物技術中二代測序技術(Next-generation sequencing,NGS)的發展,線粒體全基因組信息在昆蟲分子系統發育學、種群遺傳學和分子診斷等方面的應用越來越多[12-14],基因序列特別是線粒體基因組信息可為煙草甲的分類鑒定、系統發育和種群遺傳等研究提供重要支撐[15]。

昆蟲線粒體基因組是一個雙鏈閉合的環狀分子,大小一般為15~18 kb,含有37個基因,其中蛋白質編碼基因(Protein-coding genes,PCGs)13個(包括3個細胞色素氧化酶亞基基因cox1、cox2、cox3,7個NADH脫 氫 酶 亞 基 基 因nad1~nad6、nad4l,2個ATP合 成 酶 亞 基 基 因atp8、atp6和1個細胞色素b還原酶亞基基因cob)、轉運RNA基因(tRNAs)22個、核糖體RNA基因(rRNA)2個和控制區(又名非編碼區或AT富含區)1個,結構排列高度緊湊[16],且具有種間多態性大和進化速率較快的優勢,其結構簡單、基因重組少并易于PCR擴增,含有豐富的遺傳進化信息[17]。然而煙草甲作為一種重要的倉儲害蟲,目前僅被報道了3條線粒體基因組序列,其基因組有待進一步研究。為此,基于二代測序的技術與方法,測定煙草甲基因組全序列,分析基因的組成及排列順序,以期為煙草甲分類鑒定、系統發育和種群遺傳等方面的深入研究奠定基礎。

1 材料與方法

1.1 樣品及DNA提取

煙草甲成蟲樣品由國家糧食和物資儲備局科學研究院提供,2014年采集于四川綿陽,根據形態特征鑒定[18]后確認為煙草甲,飼養于26℃、75% RH全黑暗人工氣候箱中。

實驗材料為整頭煙草甲成蟲,使用PureLink基因組DNA動物組織和細胞提取試劑盒[賽默飛世爾科技(中國)有限公司],根據操作說明提取煙草甲基因組DNA,利用Quawell Q5000超微量紫外分光光度計(美國Quawell公司)檢測總DNA質量。

1.2 序列測定及組裝

委托北京貝瑞和康生物技術有限公司對煙草甲DNA基因組樣品進行建庫和測序,采用全基因組鳥槍法(Whole genome shotgun,WGS)策略構建文庫,二代測序獲取煙草甲線粒體基因序列,基于Illumina Hiseq2500測序平臺,對這些文庫進行雙末端(Paired-end,PE)測序。將獲得的原始序列進行質量剪切,去除讀長(Reads)接頭序列,去掉測序質量較低的讀長(測序質量值小于Q20),并去除長度小于25 bp的片段,獲得clean data數據集。

序列的組裝運用Genious 11.0軟件[19],采用“Map to reference”原則,即以線粒體上一段已知序列為組裝的起始序列,通過重疊堿基將線粒體基因組進行組裝,在組裝過程中利用迭代的方法得到煙草甲的線粒體全基因組。Genious 11.0可從來自全基因組的高通量Clean data數據中重新獲得線粒體基因組,其精確度超過99%。將煙草甲的Clean data數據集導入Genious 11.0軟件中,用GenBank上已知煙草甲線粒體COI基因(GenBank登錄號:KU494127)為參考作為錨定片段,組裝線粒體基因組序列(k=50、10次重復),獲得的重疊序列群采用99%可靠度,輸出一致性序列。組裝完成后與GenBank上已知的煙草甲rrnS和rrnL基因比對,確認為煙草甲線粒體,最終獲得煙草甲線粒體基因組序列。

1.3 序列注釋和分析

通過線上軟件MITOS Web Server(http://mitos.bioinf.uni-leipzig.de/index.py),對煙草甲線粒體基因組的37個基因進行注釋,確定各基因的位置,并用Genious 11.0軟件導出注釋結果,參考NCBI中已報道的藥材甲的線粒體基因組注釋結果進行人工校正。使用MEGA 7.0軟件[20]對煙草甲線粒體基因組的堿基組成、密碼子使用度和同義密碼子使用相對頻率進行分析,線粒體基因組堿基組成偏向性計算公式為:AT-skew=(A-T)/(A+T),GC-skew=(G-C)/(G+C)。

2 結果與分析

2.1 線粒體基因組結構

煙草甲線粒體基因組全長15 009 bp(GenBank登 錄 號:MT254408)。共 有37個 基因,包 括13個PCGs、22個tRNA基 因 和2個rRNA基因,以及1個非編碼區(圖1)。37個基因在兩條鏈的排列情況為:14個基因位于N鏈,包括4個蛋白質編碼基因(nad5,nad4,nad4l,nad1)、8個tRNA基 因(tRNAGln,tRNACys,tRNATyr,tRNAPhe,tRNAHis,tRNAPro,tRNALeu,tRNAVal)以及2個rRNA基因(rrnl,rrns),其余23個基因位于J鏈(表1)。

圖1煙草甲線粒體基因組結構Fig.1 Structure of mitochondrial genome of Lasioderma serricorn

煙草甲線粒體基因結構排列緊密,存在基因間隔及重疊現象(表1)?;蜷g隔共7處,總長為30 bp,其中最長一處位于tRNASer和nad1之間,長度為17 bp,其次是tRNAMet和nad2之間,間隔序列長度為6 bp?;蛑丿B有16處,共70 bp,nad5和tRNAHis之間重疊最長,為18 bp,其次為tRNATrp和tRNACys之間以及tRNATyr和cox1之間,均重疊8 bp。既無重疊又無間隔的區域有15處。

表1煙草甲線粒體基因組注釋結果Tab.1 Annotation of mitochondrial genome of Lasioderma serricorne

表1(續)

2.2 線粒體基因組堿基組成及分析

如表2所示,煙草甲線粒體呈現AT堿基偏向性,全基因組中4種核苷酸的含量分別為:A:38.3%;T:40.4%;G:11.1%;C:10.2%。A+T含量為78.7%,明顯高于G+C含量,且AT偏度為-0.027,GC偏度為-0.043,表明整個基因組更偏好使用T和C堿基。13個PCGs、22個tRNA基因和2個rRNA基因的A+T含量分別為77.6%,79.1%,82.8%,80.7%,其中PCGs和tRNA基因具有明顯的AT堿基偏向性,蛋白質編碼基因的AT偏度為-0.151,GC偏度為0.045,表明蛋白質編碼基因更偏好使用T和G堿基,而轉運RNA基因的AT偏度為0.005,GC偏度為0.169,偏好使用A和G堿 基。

將本研究結果與NCBI報道的煙草甲(GenBank登 錄 號:MF417629.1)和 藥 材 甲(GenBank登錄號:MK947052.1)進行相似度比較分析,結果如表3所示。兩條煙草甲的15個基因序列相似度在79.40%~100%之間,其中,rrns基因相似度最低,為79.40%;其次為atp8和nad5,分別為97.50%和98.33%;煙草甲兩條線粒體基因組中,nad4l和nad6,相似度100%。本研究中的煙草甲與藥材甲15個基因的相似度在59.75%~83.85%之間,rrns基因相似度最低,為79.40%;相似度最高的是3個細胞色素氧化酶亞基基因,cox1、cox2和cox3,分別為83.85%、80.83%和78.53%。

表2煙草甲線粒體基因組核苷酸組成Tab.2 Nucleotide compositions of mitochondrial genome of Lasioderma serricorne

表3煙草甲與藥材甲15個基因相似度分析Tab.3 Similarity analysis of 15 genes between Lasioderma serricorne and Stegobium paniceum (%)

2.3 線粒體基因組PCGs基因

煙草甲線粒體基因組蛋白質編碼基因序列共11 094 bp,占總基因組的73.9%。13個PCGs除cox2基因的起始密碼子是TTG外,其余蛋白質編碼基因的起始密碼子均為通用密碼子ATN,其中nad3以ATC作 為 起 始 密 碼 子,nad6和nad1以ATA作為起始密碼子,ATT和ATG分別是4個基因(nad2、cox1、atp8、nad5)和5個 基 因(atp6、cox3、nad4、nad4l、cob)的 起 始 密 碼子;13個蛋白質編碼基因除cox3、nad5和nad4以不完全的T作為終止密碼子外,其余均以典型的TAA或TAG作為終止密碼子(表1)。

煙草甲線粒體基因組13個蛋白質的編碼基因共編碼3 699個密碼子(含終止密碼子),編碼最頻繁的氨基酸是絲氨酸(Leu)、異亮氨酸(Ile)和苯丙氨酸(Phe),其所占比例分別為14.7%、11.2%和10.1%。相對同義密碼子使用情況表明在編碼相同氨基酸時,各密碼子的RSCU(相對同義密碼子使用度,Relative Synonymous Codon Usage)值相差較大,煙草甲線粒體基因組中密碼子使用頻率具有明顯的偏向性(圖2)。

圖2煙草甲線粒體基因組相對同義密碼子使用頻率(RSCU)Fig.2 Relative synonymous codon usage(RSCU)in Lasioderma serricorne mitochondrial genome

2.4 線粒體基因組tRNA基因及rRNA基因

煙草甲線粒體基因組含有22個tRNA基因,總長度為1 417 bp,單個tRNA基因序列長度在61~71 bp之間。與其他鞘翅目昆蟲tRNA基因的二級結構類似,煙草甲22個tRNA均能折疊成三葉草結構(圖3),但tRNAAsp、tRNALeu和tRNAHis的二級結構中缺少TψC環,tRNAser(AGN)的DHU臂缺失,故該4個tRNA不能形成典型的三葉草式二級結構。常見的A-U和G-C配對存在于22個tRNA基因的二級結構中,此外,非標準及其他錯配共25處,包括17處G-U錯配,6處U-U錯配,A-A和A-G錯配各1處。G-U錯配最多,主要發生在tRNAAla、tRNAArg和tRNAAsp上;U-U錯配發 生 在tRNASer(UGA)和tRNALeu(UUR)上 各 有2處,tRNASer(UCU)和tRNAIle上各有1處;A-A錯配和A-G錯配分別位于tRNASer(UCU)上和tRNATrp上。

煙草甲線粒體基因組2個rRNA基因均在N鏈上,大小為758 bp(rrns)和1 261 bp(rrnl),分別位于tRNALeu和控制區之間,tRNAVal基因將其隔開。

圖3煙草甲線粒體基因組tRNA基因的二級結構Fig.3 Secondary structures of tRNA genes in mitochondrial genome of Lasioderma serricorne

3 討論

線粒體基因組大小與多種因素有關,包括間隔區及基因重疊等。煙草甲線粒體基因間隔總長為30 bp,而基因重疊共70 bp,整個線粒體基因排列緊密,這與鞘翅目其他儲糧害蟲不同,例如在花斑皮蠹Trogoderma variabileBallion中nad4和nad5基因之間存在一段較長的基因間隔區,長度為345 bp[21],在 小 露 尾 甲Carpophilus pilosellusMotschulsky的trnW和nad2基因之間存在一段長為190 bp的基因間隔區[22]。煙草甲線粒體基因組緊縮容量的凈化選擇是動物線粒體基因組進化上的一個特點,有利于縮短整個基因組的復制時間,導致煙草甲在自然選擇中可能更占優勢。

煙草甲和藥材甲Stegobium paniceumL.是近似種,二者均為世界性的儲藏物害蟲,很難從形態上區分鑒定,同時基于分子數據的種群遺傳結構和分布擴散趨勢數據缺乏,通過13個PCGs基因和2個rRNA基因在同種和同屬之間的序列相似度分析比較,煙草甲和藥材甲中13種蛋白編碼基因可以作為煙草甲與近緣種藥材甲種間鑒定的參考指標;在2個rRNA基因中,rrns基因相似度低,表明rrns基因可作為煙草甲不同種群遺傳差異研究的參考基因。但是,比較僅限于3條基因組序列,有一定的局限性,還需進一步豐富這兩種重要倉儲害蟲線粒體的基因組數據。

4 結論

通過測定和分析重要倉儲害蟲煙草甲的線粒體全基因組序列及結構,顯示煙草甲線粒體基因組是一個典型的雙鏈閉合的環狀分子,大小為15 009 bp,含有37個基因,A+T含量為78.7%,呈現AT堿基偏向性,同時基因組中密碼子使用頻率也具有明顯的偏向性。22個tRNA基因中,除tRNAAsp、tRNALeu、tRNAHis和tRNAser(AGN)缺少TψC環或DHU臂,其他均能形成典型的三葉草二級結構。

猜你喜歡
偏度密碼子線粒體
線粒體自噬在纖維化疾病中作用的研究進展
棘皮動物線粒體基因組研究進展
線粒體自噬與帕金森病的研究進展
密碼子與反密碼子的本質與拓展
新型密碼子、反密碼子、氨基酸對應盤
10種藏藥材ccmFN基因片段密碼子偏好性分析
中山港區表層沉積物特征分析
基于偏度的滾動軸承聲信號故障分析方法
正態分布在高校成績分析中的應用
基于線性回歸的試題和試卷質量評價研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合