姚雪,李輝,張凱鑫,周懷谷,羅亞平△
(1.中國人民公安大學刑事科學技術學院,北京 100038;2.上海市刑事科學技術研究院,上海 200083)
人類皮膚微生物組指所有在人類皮膚上的微小生物,如細菌、真菌和病毒等[1]。針對細菌的分析主要是基于16S rRNA基因的測序結果,而這種分析方法存在一定的劣勢。首先,該基因并非單拷貝基因,因此,其測序結果總體上來說僅僅是半定量的[2],會影響微生物群落的α多樣性及β多樣性的測度時,導致分析結果與實際情況間存在偏差;其次,16S rRNA基因的可變區變異程度不夠大,在區分同一屬內不同種時存在困難。已有的研究顯示,與宏基因組shotgun測序相比,實驗16S rRNA基因的V1-V3區測序獲得的微生物群落結構分析結果與之相似,而V4區測序獲得的微生物群落結構分析結果卻不盡人意[3]。為了彌補16S rRNA基因存在的這些問題,開發新的管家基因引物是必需的。
在綜合分析人類皮膚微生物群落組成的文獻[4-6]的基礎上,選擇了4個最為普遍存在的屬的細菌,從NCBI的Genome數據庫中下載了這四個屬60種細菌的全基因組并對其進行了分析,具體包括:Corynebacterium屬24種細菌,Lactobacillus屬12種細菌,Staphylococcus屬8種細菌,Streptococcus屬16種細菌。在對這些屬的基因組分析的基礎上,篩選出一些普遍存在的單拷貝功能基因[7],并針對其保守區域設計了一些具有通用擴增能力的引物。將這些引物成功地應用在分析不同年齡階段、不同性別的36名志愿者的皮膚微生物群落結構特征分析上。結果證明這些新設計的引物對的擴增產物測序結果經分析,能夠成功將細菌鑒定到種,在分析皮膚微生物群落方向具有良好的應用前景。
2.1.1供試樣品 試驗樣品采集自36名志愿者的雙手手掌面,所有志愿者按年齡不同分為3個組別(15至24歲;25至34歲;35歲及以上),每個組別中男女數目各半。
2.1.2主要試劑及儀器 High Pure PCR Template Preparation Kit (Roche Diagnostics GMbH,德國),Q5 HighFidelity 2X Master Mix,(New England Biolabs,美國),JY88-II DN 超聲波信號發生器(南京新辰生物科技有限公司,中國),Gene Amp PCR System 9700(Applied Biosystems,美國),Hiseq 2500測序儀(Illumina,美國)。
2.2.1樣品采集及DNA提取 使用尖頭棉簽蘸取0.1% Tween 20+0.15M NaCl,在志愿者手掌面上反復擦拭,將棉簽頭部剪入1.5 ml離心管中(含500 μL 0.1% Tween 20+0.15 M NaCl),渦旋震蕩2 min。超聲處理5 min(超聲2 s,間隔3 s,功率18%)后使用Roche High Pure PCR Template Preparation Kit試劑盒提取DNA,最終使用100 μL ddH2O溶解DNA。(樣品編號中L、R分別表示左手、右手,1、2、3、4、5、6、7、8等數字分別表示志愿者編號。)
2.2.2PCR擴增 PCR體系均為50μL體系:Q5 High-Fidelity 2X Master Mix 25 μL,上下游引物(每個處理所用引物均在5’端帶有4bp barcode,引物濃度為10pMol)各1μL,溶解有DNA的ddH2O 23 μL。
rpsL基因引物對序列為rpslf (5’-ATGCCAACCATTAACCAATT-3’)(正向引物), rpslr (5’-GCAGTATCAAGGGCACCACG-3’)(反向引物)。PCR條件:預變性95℃ 5 min;變性95℃ 30 s,退火60℃ 30 s,延伸72℃ 30 s(35個循環);延伸7 min。
rpsH基因引物對序列為rpshf (5’-ATGGCTATGACTGATCCAAT-3’)(正向引物),rpshr (5’-TTACCAAACGTAGGCAATTACTTC-3’)(反向引物)。PCR條件:預變性95℃ 5 min;變性95℃ 30 s,退火50℃ 30 s,延伸72℃ 30 s(35個循環);延伸7 min。
dnaK基因引物對序列為dnakf (5’-TACTTCAACGATGCTCAACGTCAAGC-3’)(正向引物),dnakr (5’-TCCTTCTTAGCCTTTTCAGCAGCATC-3’)(反向引物)。PCR條件:預變性95℃ 5 min;變性95℃ 30 s,退火55℃ 30 s,延伸72℃ 30 s(35個循環);延伸7 min。
16S rRNA基因引物序列為F27(5’-AGAGTTTGATCCTGGCTCAG-3’)(正向引物),R338(5’-TGCTGCCTCCCGTAGGAGT-3’)(反向引物)。PCR條件:預變性95℃ 5 min;變性95℃ 30 s,退火55℃ 30 s,延伸72℃ 30 s(35個循環);延伸7 min。
2.2.3測序及數據分析 PCR產物使用Illumina Hiseq 2 500測序儀測序,測序結果使用QIIME 1.8.0軟件分析[8]。選擇質量>20且長度>200 bp的序列進行分析,先用FLASH軟件根據overlap將雙端序列合并成單端序列,得到完整的基因目標區域序列,然后根據barcode及引物進行分樣,將測序數目少于1 000條的樣品排除,不參與后續的分析運算;分樣后使用QIIME 1.8.0軟件包中的pick_otu.py中的uclust方法進行OTU聚類,之后在每個OTU中挑選一條代表序列,用blastx與對應功能基因的蛋白序列庫進行比對,得到每個代表序列的物種信息,也就得到了對應的OTU的物種信息;根據每個OTU包含的序列數及對應的物種信息,可以計算出每個物種的豐度,并通過序列抽樣的方法得到相關多樣性指數的稀疏曲線(α多樣性分析),通過計算樣品間的距離(功能基因使用bray-curtis距離,16S rRNA基因使用weighted UniFrac 距離),對所有樣品進行β多樣性分析。
質量篩選后共得到871,953條序列(來自39只手掌面的皮膚),均一化后每個樣品得到的OTU數目在61種至198種之間,含量最高的四個種分別是Streptococcus mitis,Lactobacillus crispatus,Abiotrophia defectiva 及 Streptococcus salivarius。由α多樣性指數計算結果可見,參與實驗的志愿者手掌面皮膚表面微生物群落的shannon指數在1.779到5.341之間,simpson指數在0.363到0.936之間。不同樣品物種豐度聚類熱圖見圖1,不同樣品間的UPGMA建樹見圖2。
圖1 不同樣品物種豐度聚類熱圖(rpsH gene)
圖2 不同樣品間基于bray-curtis距離的UPGMA建樹(rpsH gene)
質量篩選后共得到11,879,298條序列(來自62只手掌面的皮膚),均一化后每個樣品得到的OTU數目在104種至632種之間,含量最高的四個種分別是Staphylococcus epidermidis,Streptococcus pneumoniae,Staphylococcus capitis及Staphylococcus hominis。由α多樣性指數計算結果可見,參與實驗的志愿者手掌面皮膚表面微生物群落的shannon指數在2.078到5.602之間,simpson指數在0.424到0.929之間。不同樣品物種豐度聚類熱圖見圖3,不同樣品間的UPGMA建樹見圖4。
圖3 不同樣品物種豐度聚類熱圖(rpsL gene)
圖4 不同樣品間基于bray-curtis距離的UPGMA建樹 (rpsL gene)
質量篩選后共得到6,633,964條序列(來自54只手掌面的皮膚),均一化后每個樣品得到的OTU數目在39種至305種之間,含量最高的四個種分別是Prevotella sp. oral taxon 473, Bacillus subtilis,Streptococcus pneumoniae及Streptococcus sanguinis。由α多樣性指數計算結果可見,參與實驗的志愿者手掌面皮膚表面微生物群落的shannon指數在2.219到7.540之間,simpson指數在0.431 到0.983之間。不同樣品物種豐度聚類熱圖見圖5,不同樣品間的UPGMA建樹見圖6。
圖5 不同樣品物種豐度聚類熱圖(dnaK gene)
圖6 不同樣品間基于bray-curtis距離的UPGMA建樹(dnaK gene)
圖7 不同樣品物種豐度聚類熱圖(16S rRNAgene)
圖8 不同樣品間基于bray-curtis距離的UPGMA建樹(16S rRNAgene)
質量篩選后共得到3,292,545條序列(來自48只手掌面的皮膚),均一化后每個樣品得到的OTU數目在120 種到 251種之間,含量最高的四個屬分別是Propionibacterium, Corynebacterium,Staphylococcus和Paracoccus。由α多樣性指數計算結果可見,參與實驗的志愿者手掌面皮膚表面微生物群落的shannon指數在 4.016 到 6.992之間,simpson指數在0.794 到 0.980之間。不同樣品物種豐度聚類熱圖見圖7,不同樣品間的UPGMA建樹見圖8。
由16S rRNA基因測序結果統計得出的所有樣品中含量最高的細菌分別是Propionibacterium,Corynebacterium和Staphylococcus等,該結論與Leung等人的研究結果相一致[4]。由其他三個功能基因的測序結果統計得出的含量較高的細菌的種類的結果存在差異,主要原因是不同的引物對針對不同的種屬其擴增能力存在差異造成。雖然這些新設計的引物對的通用擴增能力不及16S rRNA基因的引物,但其鑒定能力更強,不僅能夠將細菌準確地鑒定到種這一層級,而且也能實現對不同樣品間的微生物群落結構特征進行比較。所以這些新設計的引物在皮膚微生物群落的分析中有較好的應用前景。