人類的基因到底有多少個? 最新研究1.9萬個
時間:2014-07-09 09:36:18 來源:轉化醫(yī)學網 點擊:
目前,由西班牙國家癌癥中心(CNIO)基礎研究副主任和結構計算生物學團隊負責人Alfonso Valencia帶領的一項研究,將人類蛋白質編碼基因數目更新到了19,000個;比最近注釋的基因少1700個,遠低于最初估計的100,000個。相關研究結果發(fā)表在最近的國際著名學術期刊《人類分子遺傳學》(Human Molecular Genetics),得出結論認為,幾乎所有這些基因,都有早于5000萬年前靈長類動物出現的祖先。
“縮小人類基因組”,這就是Valencia描述多年來他們對人類基因組中蛋白質編碼基因數目的不斷修正,最終在當前的研究中縮減到大約19,000個人類基因。他補充說:“基因組的編碼部分(產生蛋白質)是不斷活動的。幾年前沒有人能想象,這么小數量的基因,能制造出如此復雜的東西。”
科學家們首先分析蛋白質組學實驗;蛋白質組學是檢測蛋白質分子最有力的工具。為了確定人類蛋白質圖,研究人員整合了來自七項大規(guī)模質譜研究、50多份人體組織的數據。Valencia說:“這樣做,是為了驗證哪個基因真正產生蛋白質。”
少于10個基因能區(qū)分人和小鼠
研究發(fā)現了稍多于12,000個蛋白質,研究人員將這些蛋白質定位到基因組上的相應位置。他們分析了人類基因組中被注釋的幾千個基因,但是這并未出現在蛋白質組學分析中,Tress得出結論:“其中1,700個我們認為會產生蛋白質的基因,因為各種原因沒有產生蛋白質,或者是因為它們沒有表現出任何蛋白質編碼特征,或者是因為它們閱讀框的保守性不支持蛋白質編碼功能。”
來自研究的一個假設是,超過90%的人類基因會產生蛋白質,這些蛋白質起源于億萬年前動物王國的后生動物或多細胞生物;對于那些起源早于5000萬年前靈長類動物出現的基因來說,這個數字超過了99%。
研究人員稱:“我們的數據表明,人類和靈長類動物在基因和蛋白質水平上的差異非常小。”本文共同作者、Valencia 實驗室的研究人員David Juan稱:“將人和小鼠區(qū)分開的基因數目,甚至少于10個。”與500多個具有當前注釋中發(fā)現的靈長類起源的人類基因相反。研究人員得出結論:“靈長類動物之間的生理和發(fā)育差異,很可能是由基因調控引起,而不是問題蛋白質的基本功能差異造成的。”
以少勝多
人類復雜性的來源,更多地在于基因如何使用,而不是基因的數目,在于蛋白質中發(fā)生的成千上萬的化學變化,或者在于通過基因組非編碼區(qū)控制這些蛋白質的生產,這包括90%的全基因組,在最近的國際ENCODE項目中已經做出描述。
這項研究使人類基因的數目接近其他物種,如秀麗隱桿線蟲——只有1毫米長的蠕蟲。但是,Valencia不愿意作比較:“人類基因組是注釋最好的,但是我們仍然認為,這1700個基因可能要重新注釋。我們的研究表明,我們將不得不重新計算所有的基因組,不僅是人類基因組。”
這些研究結果是GENCODE項目的一部分,GENCODE是合并到ENCODE項目的一個財團,由世界各地的研究小組組成,包括Valencia研究小組,他們的任務是提供人類基因組中所有基因元件的注釋。
Valencia稱:“GENCODE正在討論我們的數據,以并入到新的注釋中。當這一切發(fā)生時,它將重新定義整個人類基因組圖,以及它如何用于宏項目,如癌癥基因組分析的項目。”