?

DNA:精準實驗的力量

2016-10-10 01:07艾倫奧爾AllenOrr
國外社會科學前沿 2016年9期
關鍵詞:克里克生物學家堿基

H.·艾倫·奧爾(H.Allen Orr)

游憶/譯

DNA:精準實驗的力量

H.·艾倫·奧爾(H.Allen Orr)

游憶/譯

《生命最大的秘密:破解基因密碼的競賽》(Life's Greatest Secret: The Race to Crack the Genetic Code)作者:馬修·科布(Matthew Cobb)

美國基礎圖書出版社,434頁,29.99美元

蘭迪·萊芬韋爾(Randy Leffingwell)

DNA(脫氧核糖核酸)分子有兩種功能。第一,承載遺傳信息,代代相傳。第二,在相當大的程度上指導身體構造的形成,告訴細胞制造什么分子,指引我們從單細胞的受精卵發育成為一個完整的成年人。這兩種功能無疑是相互聯系的。構造出最好的軀體的DNA序列更有可能傳給下一代,因為更好的軀體更有可能生存和繁殖。這是達爾文(Darwin)有關于DNA語言的自然選擇學說。

1953年,弗朗西斯·克里克(Francis Crick)和詹姆斯·沃森(James Watson)在加利福尼亞的圣地亞哥發現了DNA分子的雙螺旋結構。在1984年大家都知道了DNA是遺傳物質。眾所周知,20世紀中期,美國人詹姆斯·沃森和英國人弗朗西斯·克里克發現了DNA的分子結構為雙螺旋結構。就是這種雙螺旋結構構成了我們的基因。這些基因打包進入卵子或者精子,遺傳給我們的孩子,所以孩子們才長得像我們。

生物學家研究DNA如何幫助指導身體運行的故事并不為人所知。DNA以某種方式給細胞傳達信息,指導細胞制造血紅蛋白、膠原質以及成百上千的其他分子,并且生產出的是人類的分子,而不是,比如說,貓的分子。這稍有些不同。細胞如何解讀DNA中編制的那些決定身體中不同分子結構的信息?大體來說,這取決于基因如何編碼。這些編碼的方式在20世紀50—60年代被破解,成為生物學史上影響最深遠和最精彩的事件。

馬修·科布在他的新書《生命最大的秘密》中講述了這個故事??撇际锹鼜厮固卮髮W(University of Manchester)的動物學教授、一位遺傳學工作者。他還學習科學史。寫了好幾部有關于生物學史的書?!渡畲蟮拿孛堋芬粫槍Φ氖菍ι飳W只有基本了解的大眾讀者,這本書對DNA運作的分子力學細節講解較少,是對生物技術發展形成的基因介入的新世界感興趣的人的初級讀物。此外,專業的科學家也會對科布這本書感興趣,因為本書記錄了科學史上具有轉變意義的重大事件:分子生命研究的興起。

雖然這本書側重史學描述,但它依然非常有趣,有時還驚險刺激。在這場破解基因密碼的大賽中,有許多戲劇性事件,科布一一為大家詳述。

你也許沒有注意到我用了“語言信息”一詞來討論DNA。被“編錄”進DNA的“信息”被細胞“讀取”。你可能沒有注意到是因為現在我們講到DNA都是用這些詞,甚至通俗文學也這么用。顯而易見,DNA儲存信息,例如卷發或藍眼睛,就像硬盤和電腦儲存信息一樣。然而,科布的主要觀點之一就是,這是生物學的最新思潮。

這種新的思維方式和二戰期間及之后其他科學領域的發展息息相關。在此期間,出現了有關信息的兩大科學??藙诘隆は戕r信息理論(Claude Shannon)和其他鏈式信息理論,為信息流在傳達過程中(例如電子通信)信息量的確定提供理論基礎。以及諾伯特·維納(Norbert Weiner)在其控制論中提出的反饋環理論,尤其是負反饋環。(恒溫器就使用到反饋環:恒溫器控制空間內的溫度,溫度又控制恒溫器,就是這樣一個回路。)

隨著這些理論的發展,一些科學家對這些領域的數學抽象對生命研究提供的新方法的前景表現出極大興趣。有機體可能不能像數學公式那樣準確描述一個信息流,但是新科學顯示有機體也有可能做到??撇挤Q,信息思維是解決“編碼問題”(coding problem,20世紀50—60年代生物學的主要問題)的重要手段。

為了理解編碼問題,我們首先應該明白遺傳信息DNA是一個由兩條鏈子互相螺旋狀纏繞的長分子。1953年沃森和克里克將其命名為雙螺旋結構。每條單鏈都有四種化學元素:腺嘌呤、胸腺嘧啶、鳥嘌呤、胞嘧啶,縮寫分別為A、T、G、C。原則上來說,這四個DNA字母(又叫堿基)在單鏈上的順序是隨機的,例如AAGCTG。與之相對應的那條單鏈DNA上的字母順序是相匹配的:A相對應的是T,G相對應的是C。所以,在這個例子中另外一條單鏈DNA的堿基順序應該是TTCGAC。人類的基因組,所有的基因信息都是由這些DNA堿基組成。

我們身體大部分成分不是DNA,而是多種不同蛋白質。例如,紅細胞中的β-珠蛋白(血紅蛋白成分之一),以及皮膚中的膠原質都是蛋白質。根據科布的調查,20世紀30—40年代間,有大量的研究證明我們的基因在某種程度上可以指定生產蛋白質。大體上來說,每一段基因——有幾千個堿基長度的DNA片段——都描寫了某種蛋白質。因此,人類基因組的無數基因以某種方式編碼了不同的蛋白質,構成了我們的軀體。

那么,什么是蛋白質呢?蛋白質是由許多獨立鏈接的氨基酸組成的長分子鏈。生物體的構成有20種氨基酸。你身體中的β-珠蛋白就是146個氨基酸按照特定順序排列而成。如果用另一種氨基酸替換掉其中任何一個氨基酸,事情會變得完全不同??撇贾赋?,正常紅細胞和鐮狀紅細胞形成的β-珠蛋白只差一個氨基酸,但是后者卻能導致鐮狀細胞性貧血。

我們現在可以清楚地闡述編碼問題:DNA的A、T、G、和C堿基順序如何決定蛋白質中氨基酸的排列?無論這個編碼順序如何,都決定了生命形式。它將我們從父母那里獲得的遺傳物質和我們身體的構造形式緊密聯系起來。

編碼問題在DNA結構發現之后很快就被解開了。沃森和克里克發現雙螺旋結構兩周之后,發表在《自然》(Nature)雜志之前,克里克在給其兒子的信中寫道:

我們認為DNA是一種密碼。堿基的順序將基因互相區分(就像一頁一頁的書一樣)。

克里克這封信在2013年拍賣到了600萬美元。

沃森和克里克發表雙螺旋結構的論文幾周之后,他們寫道:“堿基的準確順序就是基因的信息?!?957年,克里克指出“信息”就是“蛋白質中氨基酸順序的具體描述”??撇颊J為,這是生物學家最早使用的信息語言來描述遺傳物質。[物理學家埃爾溫·薛定諤(Erwin Schr?dinger)早前使用過類似的語言。]

更重要的是,破解編碼的比賽悄然開始。

生物學家很快意識到,我們可以闡明編碼問題,并不意味著我們能夠解決編碼的問題??撇紩写蟛糠痔岬搅藘煞N解決方法:理論和實驗。

沃森和克里克提出雙螺旋結構之后,許多數學家和物理學家開始提供可能的解碼方案。解決方法的根本屬于組合學。DNA四個堿基的組合方式需要闡述20種氨基酸構成蛋白質的方式。這就幫理論學家們排除了某些編碼方案。很明顯,比如說單個堿基無法描述蛋白質,因為這段基因只能編碼四種氨基酸。也不能幫助理論學家找到正確的編碼方式。但這沒有降低理論家的熱情。

例如,物理學家喬治·伽莫夫(George Gamow)給生物學家寫信提出“菱形”結構。DNA圍繞成一個柱面,相鄰DNA螺旋結構上的鄰近堿基形成菱形空穴。公式顯示這種組合恰好能夠編碼20種氨基酸。如果你不能想象出伽莫夫的菱形模型,別擔心,這個組合以及理論學家提出的其他組合,不僅是絕妙的,還有點異想天開??死锟俗约阂蔡岢隽艘粋€巧妙的模型,可以編碼20種氨基酸,但是后來證明是錯誤的。

幸運的是,有關于編碼的猜測也有經驗主義的參與。例如一些可能的編碼方案,限制了蛋白質中相鄰氨基酸的相互作用。但是生物學家將蛋白質分類標記時卻發現一種氨基酸后面可以跟隨任何一種氨基酸。

此外,人們越來越清楚DNA不是構造蛋白質的物理模型。DNA甚至和其編碼的蛋白質沒有直接互動。而是涉及到一個中間分子。這個中間分子后來被證實為RNA(核糖核酸),和DNA相伴而生。RNA和DNA有所不同,其中之一就是有不同的化學成分——縮寫為U——取代了T,并且是單鏈,而DNA是雙鏈。生物學家很快發現DNA片段的雙螺旋結構中單鏈的堿基順序和RNA的順序是匹配的。如果DNA順序是AAGCTG,那么相應的RNA順序應該是UUCGAC。就是這段RNA順序決定了蛋白質上氨基酸的順序。

所以到了20世紀50年代中期,生物學家有了重大發現:生物體的遺傳信息從DNA轉到RNA再轉到蛋白質??死锟藢⑦@個說法認定為生物學的“中心法則”。遺傳信息只能從DNA轉到蛋白質,別無他法。由此,中心法則成為19世紀早期法國博物學家讓·巴蒂斯特·拉馬克(Jean-Baptiste Lamarck )觀點的重要論據:獲得性遺傳。你生命中所經歷的事情可能對身體有影響,卻沒有辦法將這些影響產生的蛋白質轉變成DNA,再遺傳給后代。

雖然研究獲得進展,但是基因編碼仍然沒有破解。但是我們能否知道DNA編碼的堿基指代哪個氨基酸?生物學家在發現雙螺旋結構之后沒有新的進展。1959年克里克遺憾地表示編碼問題陷入“謎團”。

謎團很快就會解開。但是解決方法并不是理論學家突出的巧妙的算法,也不是通常人們認為的人——由克里克領導一群優秀的生物學家。解開謎團的是一個不為人知的團隊:馬里蘭州貝塞斯達國立衛生研究院的馬歇爾·尼倫伯格(Marshall Nirenberg)和約翰·馬特哈伊(Heinrich Matthaei)。尼倫伯格是兩人中年長的一位,他太默默無聞了,以至于1961年申請參加一個有關基因編碼的會議時還被拒絕了。按照科布的說法是:“諷刺的是,分子生物學的偉人和佼佼者在討論基因編碼的時候,尼倫伯格和馬特哈伊卻在實實在在地破解編碼?!?/p>

尼倫伯格和馬特哈伊的破解方法非常巧妙,也很簡單直接。他們使用人造RNA序列——UUUUUUU……——研究生產出來的蛋白質的組成(這些是在實驗室完成的,最后生產出來的蛋白質不需要是自然界的一種。)實驗的結果是,利用UUUUUUU……這個RNA序列生產出來的蛋白質只含有苯基丙氨酸,沒有其他物質。所以,編碼就這樣被破解了。

克里克和悉尼·布倫納(Sydney Brenner)一起設計了一個特別巧妙的實驗,其他更多的實驗很快證明編碼是“三個一組的”。DNA每三個堿基指定一種氨基酸。1967年,由尼倫伯格、馬特哈伊、塞韋羅·奧喬亞(Severo Ochoa)、哥林德·科拉那(Gorind Khorana)以及其他學者共同操作,根據尼倫伯格的實驗衍生出的實驗——盡管充滿技術不足和很多錯誤——使得實驗主義者能夠破解整個基因編碼。

最后,只要有一段DNA的堿基順序,生物學家就能準確地判斷其生產的蛋白質。尼倫伯格在1968年因此獲得諾貝爾獎。獎項宣布后,他的實驗室掛了一條慶祝橫幅:“馬歇爾干得漂亮(UUU are great Marshall)?!?/p>

“以上是馬修·科布新書《生命最大的秘密》中基因編碼在蛋白質合成過程中如何運作的大綱示意圖?!备鶕撇嫉恼f法,密碼子是“DNA或RNA分子為氨基酸進行編碼的三個堿基序列”;核糖體是“蛋白質合成的初始地點,一種存在于所有細胞中的復雜的RNA結構”;多肽則是一種氨基酸長鏈。

《生命最大的秘密》最后1/3講的是分子遺傳學的發展近況?;蚓幋a破解之后,人們有更多的發現。最重要的發現可能是基因編碼方式幾乎對所有生物通用(只有少許變化)。這些發現具有革命性意義。所有生物——細菌、真菌、植物和人類——使用同一套編碼,因為幾十億年前我們的共同祖先就是用這一套編碼。

這也清楚地解釋了為什么這么長時間基因編碼的方式都沒有變化。如果要變化,比如說GCA編碼生產的不是丙氨酸這樣的普通氨基酸,成千上萬的蛋白質結構都要發生變化,任何發生該變化的生物體都會面臨一定災難。然而并沒有明確的物理和化學原因說明為什么某些特定的DNA堿基編碼出特定氨基酸,而且發生任何變化都會有災難性后果??死锟朔Q之為“凍結機遇”假說。

過去幾十年的研究發現,不是所有的DNA編碼都是蛋白質。人體內98%的基因屬于“非編碼”DNA。這類DNA中有些看起來好像沒有任何功效。其他非編碼DNA起基因調節作用,也即是幫助決定何時哪個細胞來生產這個蛋白質。此外,包括人類在內的許多物種都有割裂基因:一段DNA可能為某種蛋白質的一部分編碼,后面接著的一段DNA可能是沒有意義的,緊接著又一段DNA為同一種蛋白質的其他部分編碼。

科布在《生命最大的秘密》一書最后一部分闡述了基因編碼破譯以及分子遺傳學的發展帶來的社會意義。有兩個重大事件:轉基因(GM)農作物的產生和人類遺傳病的治療。

生物學家在利用DNA技術創造能生產理想蛋白質的農作物方面獲得了巨大成功。這些實驗生產出來的蛋白質在抵抗害蟲、除草劑以及增產方面有明顯改善。盡管大眾對“轉基因食物”仍有擔憂,尤其在歐洲,但是在美國轉基因農作物已經是大勢所趨??撇贾赋觯骸?014年,94%的美國大豆作物都是轉基因的,玉米作物轉基因的比例是93%,甜菜作物是95%,棉花是96%?!?/p>

相比之下,內科醫生在使用基因技術治療人類遺傳病方面取得成功(這種療法一般都是注射一段正常健康的基因到患者病變的組織中,例如肝臟,而不是卵子或精子。按照科布的話,基因修飾不會對后代產生影響)。不過到目前為止,基因技術對醫學界的改變還沒達到對農業改變的程度。

但這個情況可能即將改變。雖然這個話題飽受爭議——但是你們還記得20世紀90年代時我們說過人類基因組計劃(the Human Genome Project)將會改變醫學界嗎?——我們有理由相信新的“基因剪輯”技術可能為遺傳病治療打開新的大門。這里說的新技術一般指的是成簇的、規律間隔的短回文重復序列(CRISPR,發音同crisper),或更準確的是Cas9核酸酶靶向基因編輯技術(CRISPR-Cas9 system)。

這個CRISPR基因編輯技術本質上非常復雜,涉及到的基因技術包括識別生物體中特定的DNA序列(例如一段突變基因),將其從生物體的基因雙螺旋結構中剪切出來,然后使用一段DNA序列(例如一段正常的健康的基因)將其替換。CRISPR基因編輯技術已經成功高效地運用到許多物種??撇紡娬{:“雖然仍然存在一些障礙,但近期(過去5年中)發現的新技術可能給醫療界帶來重大改變?!?/p>

雖然分子遺傳學的新進展具有重要意義,但是科布新書的后1/3和之前的部分比起來就沒那么精彩。后面的章節有點枯燥,讀起來有點像教科書,比不上前面的史學驚險小說?!渡畲蟮拿孛堋芬粫绻麤]有這部分可能會更精彩。但是如果全都是講故事又有些掉檔次。整體來說,科布給我們呈現的是一個精彩的故事,這本書讀起來也很有趣。這本書包裝精美,注重細節,尤其對一個科學實踐工作者來說是一本難得的好作品。雖然我自認為自己對基因發展史和生物變革史非常了解,但是讀到科布這本書里的故事時也收獲了許多驚喜。

《生命最大的秘密》有幾個主題。第一個主題是信息理論和控制論對生物學的影響。據科布總結,這些科目雖然對20世紀生物學有重大影響,“但并不是以這些零散的理論研究群體希望的方式”。最后,信息科學為生物學家提供的是粗略但實用的比擬和模擬方法,為科學家提供了一種新的思考和表達方式。這種高性能的數學運算方法在生物學界發揮的作用卻不大。例如沒人使用香農的算式來解釋生物體的有趣現象(香農本身并不驚訝,他對自己的理論的實用性都抱有質疑)??茖W史和其他歷史一樣具有許多玄妙之處。其中一個玄妙之處就是信息科學在某種意義上對現代生物學有重要意義,但是從另一種意義上來說卻又是沒有意義的。

第二個主題是生物學中各種理論對實驗的影響。在20世紀60年代早期,數學家信心滿滿地說:“在實驗主義者解開編碼問題之前,看數學家們能夠提出多少種最終解決方案,整件事情將會很有趣?!笨撇己髞砜偨Y說:“結果很明顯,一個都沒有?!?/p>

所以這里有一個有趣的問題,為什么理論在生物學界失效了呢?部分原因就如科布說的,有關克里克提出的凍結機遇假說?;蚓幋a看起來至少有部分是隨機的。在自然選擇粗略地篩選和修改之后,編碼呈現出某些規律。一旦規律穩定下來,不能再改善或條理化。在這種情況下,理論就失效了。

我認為還有另一個相關原因,那就是理論對破解編碼問題幾乎沒有貢獻。因為實際上,要解決的問題的本質和生物學理論的本質并不相同。生物學界成功的理論和其他科學界例如物理學界理論所發揮的功效并不相同。生物學界的理論一般都是引導思維方式,或者培養直覺,或者表明某種和自然界相近的模型。生物學理論很少像物理學理論那樣提供一個完全準確的答案(生物學的近似答案,甚至是經驗法則,往往比精確的結果更有用)。這種寬泛的理論并不能解決編碼這樣精確的問題。

用一個簡單的比較來解釋。數學理論可能會告訴你有關于密碼鎖的一些有趣又普遍的現象:例如,它們需要有一組3個或3個以上的數字來防止小偷隨便幾下就打開密碼箱。但是如果設置一個特定的組合,即便是一個理論學家也不比我們一般人厲害。

最后,可能《生命最大的秘密》最想強調的是巧妙的科學實驗的力量。雖然科布對這個話題的關注不夠多,但是他自己研究的這段科學史正是生物學實驗百花齊放的黃金時期。當時的生物學家——UUU實驗的尼倫伯格,三個一組密碼子實驗的克里克和布倫納,以及其他生物學家馬修·梅瑟生(Matthew Meselson)、富蘭克林·斯特爾(Franklin Stahl)和喬舒亞·萊德伯格(Joshua Lederberg)——都是這類實驗的大師。通過對實驗進行簡單的改變,給過去看起來無解的問題帶來突破性進展,得出幾乎精確的答案。這樣的實驗體現了一種智力的藝術,只有科學家這個小圈子才懂得欣賞的一種藝術。

諷刺的是,基因編碼的破解,以及其他進展,將生物學帶偏,進入一個完全不同的大數據時代。由自動化器械排序的從無數物種中取得的整個基因組的DNA和蛋白質序列充斥著各大電腦。許多生物學家使用復雜的統計學來推算這些數據。間接地,越來越多的生物學家開始接受這樣的方式,越來越少的人注意到巧妙設計實驗的迷人之處。這樣間接的方法明顯缺乏有價值的見解,但是毫無疑問他們會持續這么做下去。大數據為生物學和醫學研究提供了新的重要的工具。但是《生命最大的秘密》一書告訴我們一個更大道理,當科學家尋求一個明確的答案,而不只是一種建議性的模型時,他們需要的是精準的實驗,如果順利的話,結果會非常漂亮。

原文標題:DNA,“The Power of the Beautiful Experiment”

猜你喜歡
克里克生物學家堿基
應用思維進階構建模型 例談培養學生創造性思維
電影攝影機
中國科學家創建出新型糖基化酶堿基編輯器
生命“字母表”迎來新成員
生命“字母表”迎來4名新成員
命懸一線
異同
通過生物學家的故事 培養學生的創新能力
略論柏孜克里克石窟新發現的漢文《金剛經》殘卷
克里克的“通用謝絕書”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合