?

醫學論文中人類基因符號及相應蛋白符號的正確書寫

2016-07-19 10:08黃靜怡沈志超
同濟大學學報(醫學版) 2016年6期
關鍵詞:人類基因醫學論文命名

黃靜怡, 曹 靜, 韓 丹, 鄭 芹, 沈志超

(1. 第二軍醫大學免疫學研究所 中國腫瘤生物治療雜志編輯部,上海 200433; 2. 中華醫學超聲雜志(電子版)編輯部,北京 100710)

?

·科技寫作·

醫學論文中人類基因符號及相應蛋白符號的正確書寫

黃靜怡1, 曹 靜2, 韓 丹1, 鄭 芹1, 沈志超1

(1. 第二軍醫大學免疫學研究所 中國腫瘤生物治療雜志編輯部,上海 200433; 2. 中華醫學超聲雜志(電子版)編輯部,北京 100710)

隨著生物醫學科技的高速發展,基因符號(即基因名稱的縮寫)在生物醫學研究論文中使用頻率越來越高,但由于許多作者對基因命名、書寫規則缺乏足夠的了解,目前醫學論文中基因和蛋白符號書寫不規范的現象頻頻出現,如沒寫成斜體、使用希臘字母和羅馬數字及大小寫混亂等。針對這些問題,本研究根據國際人類基因命名委員會(Human Gene Nomenclature Committee, HGNC)頒布的“人類基因命名指南”(guideline for human gene nomenclature, HGNG)最新版本(2014年2月網絡版)的內容,簡要介紹人類基因及其相應蛋白符號的書寫規則,對常見的書寫不規范現象做出疏理和分析,并提出改進意見,以期幫助作者和讀者正確使用基因和蛋白符號,提高醫學論文的規范化質量,促進我國醫學研究成果的國際交流。

基因名稱; 基因符號; 蛋白符號; 醫學論文

隨著生物醫學科技的高速發展,基因名稱及其符號在生物醫學論文中出現的頻率越來越高。

基因名稱是基因的全稱,基因名稱的縮寫則是基因符號?;蚍柵c其他科技學術名詞和學術符號一樣,具有鮮明的專業性、規范性和國際性。在生物醫學論文中,只有規范地使用和書寫基因符號,才能提高論文規范化質量,促進高質量的學術交流和我國科技創新成果的國際宣傳;對于學術期刊來說,正確使用基因符號是期刊規范化建設的基本要求之一[1-2]。因此,我國廣大生物醫學工作者應熟悉、掌握和正確使用基因符號的書寫。

國際上相關學術組織歷來都十分重視基因的命名工作,把該工作視為基因相關專業和學科發展中重要的基礎性工作[3]。國際人類基因命名委員會(Human Gene Nomenclature Committee, HGNC)專門負責人類基因命名規則的制定和“人類基因命名指南”(quidelines for human gene nomenclature, HGNG)的發布。自1979年始,HGNC在Genomics雜志上先后發布過5個版本的HGNG[4];2002年首次發布了網絡版HGNG,至2014年2月,該網絡版共經歷了14次修改更新[5]。

面對當前我國醫學論文中不規范書寫基因符號的現象,根據HGNG最新網絡版(http:∥www.genenames.org/quidelines.html)[5]的內容,對人類基因符號及其相應蛋白符號的書寫規則作一簡要介紹。

1 人類基因名稱的書寫規則

1.1 基本原則

基因名稱應正體書寫、首字母小寫,但當該基因名稱首字母涉及姓名或縮寫或在句首時應大寫。例如,生存素基因應寫成survivin;Allan-Herndon-Dudley綜合征基因,其基因名稱為“Allan-Herndon-Dudley syndrome”,基因符號為AHDS;ATP結合盒亞家族A1號成員基因,其名稱為“ATP binding cassette, sub-familly A, member 1”,基因符號為ABCA1。

1.2 描述、限制性詞寫法

基因名稱中描述性、限制性的形容詞應置于名稱主干詞的后面,以逗號分開。例如可溶性順烏頭酸酶1基因,其基因名稱為“aconitase 1, soluble”,基因符號為ACO1。

1.3 別名寫法

基因名稱的別名應置于該名稱后面的括號中。例如艾杜糖醛酸2-硫酸酯酶(Hunter綜合征)基因,其基因名稱為“iduronate 2-sulfatase(Hunter syndrome)”,基因符號為IDS。

1.4 物種名寫法

與其他物種基因同源的人類基因名稱,在需要寫出物種名時,可將該物種名置于基因名稱后面的括號中。例如,肌動蛋白結合蛋白基因(小片段同源,果蠅),其基因名稱為anillin,actin binding protein(scraps homolog, Drosphila),基因符號為ANLN。

2 人類基因符號的命名和書寫總則

2.1 組成和寫法

基因符號由斜體的大寫拉丁字母和阿拉伯數字組成,符號的第一字符必須是字母,且與基因名稱首字母相同。

2.2 字符單一

基因符號不含有希臘字母和羅馬數字。早期命名的基因符號中的希臘字母應轉換成對應的拉丁字母,如原在基因符號前綴上的希臘字母轉換成拉丁字母后應置于符號的末尾;早期命名的符號中的羅馬數字應改為對應的阿拉伯數字。

2.3 符號簡練

基因符號字符數一般不超過6個;基因符號中無標點、不含上下標、不含字母“G”(gene)或“H/h”(Human),也不使用由某些字母或字母組合組成的前綴和后綴。

2.4 內涵專一

基因符號僅表示基因本身的特性,不代表其他擴展的信息,例如基因在染色體上的位置、組織特異性和分子大小等。

2.5 符號唯一

人類基因符號具有唯一性,它不與已知的其他人類基因符號重復,也不涉及其他物種。

3 某些特殊類型基因符號的書寫細則

3.1 基因家族符號

以基因符號為主干,將家庭成員以單個大寫字母或阿拉伯數字或其兩者的組合置于主干符號的后面。例如,G蛋白偶聯受體基因1,2,3,其基因名稱為“G protein-coupled receptor 1,2,3”,基因符號為GPR1、GPR2、GPR3;細胞色素P450基因超家族1A1、1A2、2A1、2A2,其基因名稱為“cytochrome P450 superfamily 1A1,1A2,2A1,2A2”,基因符號應寫成CYP1A1、CYP1A2、CYP2A1、CYP2A2。

3.2 等位基因符號

由原基因突變后產生的等位基因,應以少于3個字符的大寫字母或數字或其兩者組合來表示,并置于主干基因符號的后面,中間以“*”相隔。例如,PGM1*1;D3S22*A1。

3.3 序列相似的基因符號

通過交叉雜交方法或從數據庫中找到一新基因,它與某已知基因的序列相似,但暫時不了解其相關功能的信息,該新基因為某已知基因的“序列相似基因”。該基因符號可在已知基因符號的末尾加上“L”。例如,?;被崴饷?基因(aminoacylase 1,ACY1)的相似基因,其相似基因符號可寫成ACY1L。

3.4 假基因符號

某些基因與已知功能基因高度同源,但自身既不能轉錄又不能翻譯,它們被稱為假基因。假基因符號可以在已知功能的基因符號末尾加上序號和“P”(pseudo)來表示。例如,嗅覺受體家族5亞家族B第12號假基因,其基因名稱為“olfactory receptor, family 5, subfamily B, memebe 12 pseudogene”,基因符號為OR5B12P。

3.5 同源基因符號

(1) 不同脊椎動物中的同源基因應使用相同的名稱和基因符號,尤其人類和小鼠間存在著許多同源基因;(2) 當有必要說明同源基因的來源物種時,可將種屬名稱或其縮寫符號放在括號中置于基因符號的前面。例如,起源于人類的同源基因ABCA1,可以寫成(HUMAN)ABCA1;起源于小鼠的同源基因Abca1,可以寫成(MOUSE)Abca1。

3.6 重組基因符號

(1) 兩個人類基因通過重組產生一個融合基因時,該融合基因符號應把此兩個(或更多)的基因符號連起來,但要做一些刪節。例如,POM121基因和透明帶糖蛋白3(zona pellucida glycoprotein 3,ZP3)基因重組形成的融合基因符號應為POMZP3;(2) 人 類基因或其DNA片段和小鼠DNA片段雜交后產生的重組基因符號,可在人類基因符號前加上人類縮寫符號“H”,再加上由小鼠染色體縮寫符號“C”和其序號組成的前綴。例如,人類基因D21S56和小鼠第16號染色體DNA片段雜交產生的重組基因,其符號可寫成C16HD21S56。

3.7 癌基因符號

癌基因分為兩大類,一類存在于逆轉錄病毒中的稱為病毒癌基因(viral oncogene, v-onc),另一類存在于細胞中的稱為細胞癌基因(cellular oncogene, c-onc)或原癌基因(proto-oncogene)。過去命名的癌基因符號在兩類基因符號的前綴部分分別寫上“v-”或“c-”,而新的命名規則規定基因符號不應有前綴,故癌基因符號中應取消這兩個前綴。

3.8 疾病或癥狀相關的基因符號

3.8.1 疾病名稱有關的基因符號 臨床疾病相關基因首次發現時,往往以疾病或癥狀名稱命名;但在深入認識了該基因的編碼產物及其功能后,HGNC根據這些功能特性重新命名其名稱和符號。最新命名規則規定,應將確切反映該基因特性的名稱和符號作為規范的名稱和符號。例如,軟骨發育不全(achondroplasia,又稱致死性侏儒癥)基因的早期命名基因符號為ACH,后來認識到該基因是成纖維細胞生長因子受體3(fibroblast growth factor receptor 3)基因,故將該基因符號正式改為FGFR3。

3.8.2 涉及多個基因的臨床綜合征有關的基因符號 臨床綜合征常涉及某一染色體區域的多個基因缺失或重復,故臨床綜合征相關基因名稱應寫成“綜合征名+染色體區域(CR)+變異的候選基因序列號”。例如貓眼綜合征染色體區域候選基因1,其基因名稱為cat eye syndrome chromosome region, candidate 1,其基因符號應寫為CECR1。

3.9 某些不遵守HGNG規則的特殊情況

(1) 編碼某些酶蛋白、血漿蛋白和一些特殊蛋白的基因符號,它們應遵照國際生物化學和分子生物學聯盟命名委員會制定的規則書寫。例如,葉酸多聚谷氨酸合成酶(folylpolyglutamase)的基因符號寫成FPGS;血色素alpha1(hemoglobin, alpha 1)的基因符號應寫成HBA1。

(2) HLA的基因符號遵照WHO命名委員會關于HLA系統的命名規則書寫,免疫球蛋白和T細胞受體基因符號遵照國際免疫遺傳學命名委員會的規則書寫。這幾類基因符號中可以有標點符號。

(3) 出版物基因目錄中的基因符號不必用斜體。

4 人類基因符號對應蛋白符號的書寫規則

人類基因的表型產物主要是指基因編碼的蛋白,基因符號和其對應的蛋白符號兩者的字符組成和大小寫完全相同,不同的是蛋白符號用正體書寫。例如基因符號KRT1、TP53、CDKN2A,其對應的蛋白符號為KRT1、TP53、CDKN2A。

但也有些特殊情況,如等位基因對應的蛋白符號,書寫時應去掉基因主干字符和等位基因字符間的“*”號,留一空隙,例如3.2中介紹的等位基因D3S22*A1,其相對應的蛋白符號為D3S22 A1。

5 人類與其他常見物種基因與蛋白符號書寫規則的區別

基因符號及其相應蛋白符號的書寫涉及所有生物物種,品種繁多、數量浩瀚。早期,各物種基因的命名由多個國際學術組織、各種國際命名小組和某些工作小組各自獨立進行,后來經過協商,各物種基因的命名工作歸由某物種所屬國際學術組織中專門的遺傳命名委員會承擔[3]。從此,各物種基因的命名工作進入了全球化、專業化和規范化的發展階段。

全球各物種基因的命名和書寫,既必須遵循生物遺傳命名普遍性基本規則,又必須體現各物種相應的特性,所以各物種的基因和蛋白符號既復雜多樣,又能保持各種基因和蛋白符號的獨特性。醫學論文中涉及最多的無疑是人類基因符號,故這里以人RAS基因[該基因與大鼠肉瘤病毒基因(rat sarcoma causing gene,Ras)同源]為例,列出了人類與醫學論文中較常見物種基因與蛋白符號書寫規則的主要區別點[3-7],見表1。

表1 常見物種基因和蛋白符號書寫規則的主要區別點

6 基因及其蛋白符號書寫不規范的常見問題

6.1 基因名稱未寫成正體、首字母未寫成小寫

通常情況下醫學論文中使用的多為基因符號,但某些特殊基因,例如survivin、凋亡抑制因子基因livin,由于其名稱很短小,所以沒有縮寫符號,使用時直接書寫基因全稱,HGNG要求其正體書寫、首字母小寫。

6.2 基因符號未斜體書寫

基因符號應以斜體書寫,以便于基因符號與其對應的蛋白符號相區分。如血管內皮生長因子(vascular endothelial growth factor)的基因符號為VEGF,蛋白符號為VEGF。

6.3 基因符號中阿拉伯數字用正體

構成基因符號的拉丁字母與阿拉伯數字作為一個整體,均應斜體書寫。如尾側同源盒基因CDX2(caudal type homeobox transcription factor 2),不應寫為CDX2。

6.4 基因符號中出現希臘字母和羅馬數字

基因符號中的希臘字母應翻譯為拉丁字母,羅馬數字應翻譯為阿拉伯數字。如銜接蛋白復合物2的α亞基(adaptor protein complex 2, alpha subunit)的基因符號應寫為AP-2alpha,而不是AP-2α。

6.5 大小寫混亂

多見于不同物種的同源基因,如在書寫人類基因符號時使用了其他低等物種(菌類、大小鼠等)的基因符號書寫格式。早期對基因的研究多從菌類和果蠅開始,人們對菌類和果蠅基因符號的認識最早,且記憶較為深刻,因而在書寫與其同源的人類基因符號時沒有與時俱進,往往會把菌類基因符號誤用作人類基因符號,造成大小寫混亂;同時,大小鼠基因在醫學研究中廣泛應用,其與人類的同源基因也最多,故在書寫時容易發生大小寫混淆(表1)。如人抑癌基因P53、P16常見寫成p53、p16,人RAS基因寫成Ras或ras的不規范形式。

6.6 人類蛋白符號未全大寫

應注意不同物種對于基因符號和蛋白符號書寫的要求,人類蛋白符號應采用全大寫、正體的格式,如人肺耐藥相關蛋白(lung resistance-related protein)的蛋白符號應寫為LRP,而非Lrp或lrp。

7 常用的基因符號查詢網站

了解基因符號的命名和書寫規則能夠幫助廣大讀者、作者更加高效準確地進行科技論文的閱讀和寫作,提高醫學論文的國際規范水平。但要完全掌握所有基因符號的命名及書寫規則顯然是難以做到的,也沒有必要。在使用某個基因時,可以利用網絡工具查詢其規范的名稱及基因符號,以下提供2個權威網站供作者、讀者查詢: (1) 國際人類基因命名委員會網站,http:∥www.genenames.org;(2) Entrez Gene網站,http:∥www.ncbi.nlm.nih.gov/gene[1]。

8 結 語

本文簡要介紹了人類基因符號及其相應蛋白符號的書寫規則,并對常見基因及其蛋白符號書寫錯誤進行分析,以期幫助生物醫學論文作者在寫作中正確書寫基因、蛋白符號,增加論文的科學性、規范性、可讀性;也可幫助讀者在閱讀論文過程中快速正確地獲取相關信息,避免發生基因和蛋白誤判,有利于科研成果的傳播。同時,在生物醫學科技期刊的編校、出版過程中規范人類基因和蛋白符號的書寫規則,有利于促進我國生物醫學科技期刊的規范化建設,推動學術期刊的專業化、國際化發展。

[1] 劉華,李秀普.Entrez Gene數據庫及其基因書寫規范中的應用[J].中國科技期刊研究,2010,21(4): 539-540.

[2] 張翠英.基因及蛋白質符號的規范編排[J].編輯學報,2004,16(4): 262-263.DOI: 10.3969/j.issn.1001-4314.2004.04.013.

[3] 王金發,陳中健,楊琳,等譯.遺傳學進展(英)編輯部.TIG遺傳命名指南[M].北京: 科學出版社,2002.

[4] 方福德,向若蘭,楊燕麗.如何命名和書寫基因——最新國際人類基因命名和書寫規則[J].中國醫學科學院學報,2005,27(1): 128-134.

[5] 方福德.人類基因的命名和書寫[J].基礎醫學與臨床,2010,30(10): 1010.

[6] Wain HW, Bruford EA, Lovering RC, et al. Guidelines for human gene nomenclature[J/OL]. Genomics, 2002,79(4): 464-470.(2014-02)[2016-04-15].http:∥www.genenames.org/quidlines.htm.

[7] International committee on standardized genetic nomencluture for mice, Rat genome and nomenclature committee. Guidelines for nomenclature of genes, genetic markers, alleles, and mutations in mouse and rat[EB/OL].(2014-08)[2016-04-15].http:∥www.informatics.jax.org./mgihome/nomen/gene.shtm.

Correct writing of gene and corresponding protein symbols in medical articles

HUANGJing-yi1,CAOJing2,HANDan1,ZHENGQin1,SHENZhi-chao1

(1. The Editorial Office of Chinese Journal of Cancer Biotherapy, Second Military Medical University, Shanghai 200433, China; 2. Editorial Office of Chinese Journal of Medical Ultrasound(Electronic Edition), Beijing 100710, China)

The gene and corresponding protein symbols(abbreviations of gene names) are widely used in biomedical research articles, but incorrect writing frequently appears in the literature,e.g. not using italic, using Greek letters and Rome digitals and being inappropriately case-sensitive. This article introduces theGuidelinesforHumanGeneNomenclature(HGNG, online edition, February 2014) of Human Gene Nomenclature Committee(HGNC), and also analyzes common mistakes appearing in Chinese medical papers and makes suggestions for authors to correctly write the gene and protein names and symbols.

gene name; gene symbol; protein symbol; medical article

10.16118/j.1008-0392.2016.06.025

2016-06-02

中國科協精品科技期刊工程項目(2015KJQK003-1)

黃靜怡(1987—),女,中級編輯,碩士.E-mail: cjcbhjy@126.com

沈志超.E-mail: shen_smmu@163.com

R 735.9

A

1008-0392(2016)06-0126-05

猜你喜歡
人類基因醫學論文命名
醫學論文中引言的寫法
醫學論文中引言的寫法
諾貝爾獎得主斯萬特·佩博發現人類基因中存在著尼安德特人基因
醫學論文中引言的寫法
命名——助力有機化學的學習
醫學論文中引言的寫法
有一種男人以“暖”命名
為一條河命名——在白河源
人類基因編輯有了基本原則
淺析國際人類基因的法律保護
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合