美國和(he)瑞典研(yan)究(jiu)人員使(shi)用一種新型脫氧核(he)糖(tang)核(he)酸(DNA)比較技術發現(xian),人類(lei)基因組中廣泛存(cun)在著大段DNA的缺失或(huo)增加現(xian)象。這一現(xian)象對人類(lei)遺傳多(duo)樣性和(he)癌(ai)癥等疾(ji)病(bing)的發生(sheng)有重要意義(yi)。
攜帶人(ren)(ren)(ren)體遺傳信(xin)息(xi)的(de)DNA由4個(ge)(ge)不(bu)同(tong)的(de)堿(jian)基組合而成(cheng)。不(bu)同(tong)人(ren)(ren)(ren)基因(yin)組之間(jian)的(de)堿(jian)基排(pai)列順序大部(bu)分相同(tong),但也存在(zai)(zai)極小的(de)差(cha)異,主要體現在(zai)(zai)DNA片(pian)斷上個(ge)(ge)別堿(jian)基的(de)不(bu)同(tong)。這(zhe)種(zhong)遺傳性(xing)(xing)(xing)變異被(bei)稱為“單核苷酸(suan)多(duo)態(tai)性(xing)(xing)(xing)”。而人(ren)(ren)(ren)體細胞中(zhong)大段DNA缺(que)失或增加的(de)現象,則被(bei)科學家稱為“副(fu)本數多(duo)態(tai)性(xing)(xing)(xing)”(CNP)。但這(zhe)種(zhong)多(duo)態(tai)性(xing)(xing)(xing)此前(qian)一(yi)直被(bei)認為只是個(ge)(ge)別現象,不(bu)具有代表性(xing)(xing)(xing)。
在新一期《科學》雜志上,美國紐(niu)約科德(de)斯(si)普(pu)林港實驗室(shi)和(he)瑞典卡羅林斯(si)卡醫學院等機(ji)構的研(yan)究人員報告說,“副本數(shu)多態(tai)性(xing)”實際在人類基(ji)因(yin)組中廣泛而(er)普(pu)遍地存(cun)在。研(yan)究人員原本想尋找正(zheng)常人體細胞(bao)(bao)和(he)癌細胞(bao)(bao)之間的基(ji)因(yin)差異,但他(ta)們在比較(jiao)正(zheng)常人體細胞(bao)(bao)時發現,正(zheng)常細胞(bao)(bao)的基(ji)因(yin)間也存(cun)在著(zhu)很大差異。
研究人員(yuan)使用的(de)(de)是一種(zhong)高效(xiao)的(de)(de)“代(dai)表(biao)性寡核(he)苷(gan)酸陣列分析(ROMA)”技術,對(dui)來自不同地域的(de)(de)20名實驗對(dui)象(xiang)的(de)(de)血液(ye)及(ji)組(zu)織樣本進(jin)行了(le)分析。他們發現,所有志(zhi)愿者體細胞中有70個基(ji)因存在76處(chu)“副本數多態性”,表(biao)現為大段(duan)DNA序(xu)列的(de)(de)缺失或增加。
研究人員說,“副本數(shu)多態(tai)性”的(de)(de)存(cun)在規模遠(yuan)遠(yuan)超過了(le)早先的(de)(de)想(xiang)象,而且缺失或(huo)增加的(de)(de)DNA片斷(duan)與(yu)(yu)很多疾病的(de)(de)發(fa)生有(you)(you)關,如白血病、乳腺癌、肥胖癥等。此外,這(zhe)些(xie)DNA片斷(duan)與(yu)(yu)人體神經(jing)系統功能(neng)的(de)(de)發(fa)育、某些(xie)細胞生長的(de)(de)調控(kong)也有(you)(you)一(yi)定關系。
曾發起(qi)人類基(ji)因(yin)組項目的美國科學家(jia)克雷(lei)格·文特爾評論說,這一發現很(hen)(hen)重要。它也(ye)許能夠解釋(shi),為(wei)什么人類的基(ji)因(yin)序列差別很(hen)(hen)小,而人與人之間卻有很(hen)(hen)大(da)的不同。
人類基因組計劃很長,看后面。
目前已經發現和定位了26000多個功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶占10.28%,核酸酶占7.5%,信號傳導占12.2%,轉錄因子占6.0%,信號分子占1.2%,受體分子占5.3%,選擇性調節分子占3.2%,等。發現并了解這些功能基因的作用對于基因功能和新藥的篩選都具有重要的意義。
至于蛋白數量,肯定不同,因為一條基因頂多對應一條mRNA,至于mRNA翻譯前剪切和連接就會形成很多,然后翻譯成肽鏈,經過折疊,修飾和不同亞基組合后,種類就更多了。有的蛋白肽鏈相同,活性金屬不同也會成為不同的蛋白。所以,蛋白數是遠遠大于基因數的。
人類基因組計劃簡介
人類基因組計劃(human genome project, HGP)是由美國科學家于1985年率先提出,于1990年正式啟動的。美國、英國、法蘭西共和國、德意志聯邦共和國、日本和我國科學家共同參與了這一價值達30億美元的人類基因組計劃。按照這個計劃的設想,在2005年,要把人體內約10萬個基因的密碼全部解開,同時繪制出人類基因的譜圖。換句話說,就是要揭開組成人體10萬個基因的30億個堿基對的秘密。人類基因組計劃與曼哈頓原子彈計劃和阿波羅計劃并稱為三大科學計劃。
1986年,諾貝爾獎獲得者Renato Dulbecco發表短文《腫瘤研究的轉折點:人類基因組測序》(Science, 231: 1055-1056)。文中指出:如果我們想更多地了解腫瘤,我們從現在起必須關注細胞的基因組。…… 從哪個物種著手努力?如果我們想理解人類腫瘤,那就應從人類開始。……人類腫瘤研究將因對DNA的詳細知識而得到巨大推動。”
什么是基因組(Genome)?基因組就是一個物種中所有基因的整體組成。人類基因組有兩層意義:遺傳信息和遺傳物質。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結構與功能、基因之間的相互關系。
人類基因組計劃的目的
為什么選擇人類的基因組進行研究?因為人類是在“進化”歷程上最高級的生物,對它的研究有助于認識自身、掌握生老病死規律、疾病的診斷和治療、了解生命的起源。
測出人類基因組DNA的30億個堿基對的序列,發現所有人類基因,找出它們在染色體上的位置,破譯人類全部遺傳信息。
在人類基因組計劃中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種“模式生物”。
HGP的目的是解碼生命、了解生命的起源、了解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。
[編輯本段]HGP的誕生和啟動
對人類基因組的研究在70年代已具有一定的雛形,在80年代在許多國家已形成一定規模。
1984年在Utah州的Alta,White R and Mendelsonhn M受美國能源部(DOE)的委托主持召開了一個小型專業會議討論測定人類整個基因組的DNA序列的意義和前景(Cook Deegan RM,1989)
1985年5月在加州Santa Cruz由美國DOE的Sinsheimer RL主持的會議上提出了測定人類基因組全序列的動議,形成了美國能源部的“人類基因組計劃”草案。
1986年3月,在新墨西哥州的Santa Fe討論了這一計劃的可行性,隨后DOE宣布實施這一計劃。
1986年遺傳學家McKusick V提出從整個基因組的層次研究遺傳的科學稱為“基因組學”
1987年初,美國能源部和國立衛生研究院為HGP下撥了啟動經費約550萬美元(全年1.66億美元)
1988年,美國成立了“國家人類基因組研究中心”由Watson J出任第一任主任
1990年10月1日,經美國國會批準美國HGP正式啟動,總體計劃在15年內投入至少30億美元進行人類全基因組的分析。
1987年,意大利共和國國家研究委員會開始HGP研究,其特點是技術多樣(YAC,雜種細胞,cDNA等)、區域集中(基本上限于Xq24-qter區域)
1989年2月英國開始HGP,特點是:帝國癌癥研究基金會與國家醫學研究委員會(ICRP-MRC)共同負責全國協調與資金調控,劍橋附近的Sanger中心注重首先在線蟲基因組上積累經驗,改進大規模DNA測序技術;同時建立了YAC庫的篩選與克隆、特異細胞系、DNA探針、基因組DNA、cDNA文庫、比較生物基因組DNA序列、信息分析等的“英國人類基因組資源中心”。可謂“資源集中、全國協調”。
1990年6月法蘭西共和國的HGP啟動。科學研究部委托國家醫學科學院制定HGP,主要特點是注重整體基因組、cDNA和自動化。建立了人類多態性研究中心(CEPH),在全基因組YAC重疊群、微衛星標記(遺傳圖)的構建以及馳名世界的用作基因組研究的經典材料CEPH家系(80個3代多個體家系)方面產生了巨大影響。
1995年德意志聯邦共和國開始HGP,來勢迅猛,先后成立了資源中心和基因掃描定位中心,并開始對21號染色體的大規模測序工作。
1990年6月歐共體通過了“歐洲人類基因組研究計劃”,主要資助23個實驗室重點用于“資源中心”的建立和運轉。還有丹麥王國、俄羅斯聯邦、日本、大韓民國、澳大利亞等。
1994年,我國HGP在吳旻、強伯勤、陳竺、楊煥明的倡導下啟動,最初由國家自然科學基金會和863高科技計劃的支持下,先后啟動了“中華民族基因組中若干位點基因結構的研究”和“重大疾病相關基因的定位、克隆、結構和功能研究”,1998年在國家科技部的領導和牽線下,1998年在上海成立了南方基因中心,1999年在北京成立了北方人類基因組中心,1998年,組建了中科院遺傳所。1999年7月在國際人類基因組注冊,得到完成人類3號染色體短臂上一個約30Mb區域的測序任務,該區域約占人類整個基因組的1%。
人類基因組計劃(Human genome project)由美國于1987年啟動,我國于1999年9月積極參加到這項研究計劃中的,承擔其中1%的任務,即人類3號染色體上約3000萬個堿基對的測序任務。我國因此成為參加這項研究計劃的唯一的發展中國家。2000年6月26日人類基因組工作草圖完成。由于人類基因測序和基因專利可能會帶來巨大的商業價值,各國政府和一些企業都在積極地投入該項研究,如1997年AMGE公司轉讓了一個與中樞神經疾病有關的基因而獲利3.92億美元。
[編輯本段]HGP的研究內容
HGP的主要任務是人類的DNA測序,包括下圖所示的四張譜圖,此外還有測序技術、人類基因組序列變異、功能基因組技術、比較基因組學、社會、法律、倫理研究、生物信息學和計算生物學、教育培訓等目的。
1、遺傳圖譜(genetic map)
又稱連鎖圖譜(linkage map),它是以具有遺傳多態性(在一個遺傳位點上具有一個以上的等位基因,在群體中的出現頻率皆高于1%)的遺傳標記為“路標”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。遺傳圖譜的建立為基因識別和完成基因定位創造了條件。意義:6000多個遺傳標記已經能夠把人的基因組分成6000多個區域,使得連鎖分析法可以找到某一致病的或表現型的基因與某一標記鄰近(緊密連鎖)的證據,這樣可把這一基因定位于這一已知區域,再對基因進行分離和研究。對于疾病而言,找基因和分析基因是個關鍵。
第1代標記:經典的遺傳標記,例如ABO血型位點標記,HLA位點標記。70年中后期,限制性片段長度多態性(RFLP),位點數目大與105,用限制性內切酶特異性切割DNA鏈,由于DNA的一個“點”上的變異所造成的能切與不能切兩種狀況,可產生不同長度的片段(等位片段),可用凝膠電泳顯示多態性,從片段多態性的信息與疾病表型間的關系進行連鎖分析,找到致病基因。如Huntington癥。但每次酶切2-3個片段,信息量有限。
第2代標記:1985年,小衛星中心(minisatellite core)、可變串聯重復VNTR(variable number of tandem repeats)可提供不同長度的片段,其重復單位長度為6至12個核苷酸 ,1989年微衛星標記(microsatellite marker)系統被發現和建立,重復單位長度為2~6個核苷酸,又稱簡短串聯重復(STR)。
第3代標記:1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遺傳標記系統。對每一核苷酸突變率為10-9,雙等位型標記,在人類基因組中可達到300萬個,平均約每1250個堿基對就會有一個。3~4個相鄰的標記構成的單倍型(haplotype)就可有8~16種。
2、物理圖譜(physical map)
物理圖譜是指有關構成基因組的全部基因的排列和間距的信息,它是通過對構成基因組的DNA分子進行測定而繪制的。繪制物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。DNA物理圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位。因限制性內切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經酶切后就會產生不同長度的DNA片段,由此而構成獨特的酶切圖譜。因此,DNA物理圖譜是DNA分子結構的特征之一。DNA是很大的分子,由限制酶產生的用于測序反應的DNA片段只是其中的極小部分,這些片段在DNA鏈中所處的位置關系是應該首先解決的問題,故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。廣義地說,DNA測序從物理圖譜制作開始,它是測序工作的第一步。制作DNA物理圖譜的方法有多種,這里選擇一種常用的簡便方法——標記片段的部分酶解法,來說明圖譜制作原理。
用部分酶解法測定DNA物理圖譜包括二個基本步驟:
(1)完全降解:選擇合適的限制性內切酶將待測DNA鏈(已經標記放射性同位素)完全降解,降解產物經凝膠電泳分離后進行自顯影,獲得的圖譜即為組成該DNA鏈的酶切片段的數目和大小。
(2)部分降解:以末端標記使待測DNA的一條鏈帶上示蹤同位素,然后用上述相同酶部分降解該DNA鏈,即通過控制反應條件使DNA鏈上該酶的切口隨機斷裂,而避免所有切口斷裂的完全降解發生。部分酶解產物同樣進行電泳分離及自顯影。比較上述二步的自顯影圖譜,根據片段大小及彼此間的差異即可排出酶切片段在DNA鏈上的位置。下面是測定某組蛋白基因DNA物理圖譜的詳細說明。
完整的物理圖譜應包括人類基因組的不同載體DNA克隆片段重疊群圖,大片段限制性內切酶切點圖,DNA片段或一特異DNA序列(STS)的路標圖,以及基因組中廣泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的標記圖,人類基因組的細胞遺傳學圖(即染色體的區、帶、亞帶,或以染色體長度的百分率定標記),最終在分子水平上與序列圖的統一。
基本原理是把龐大的無從下手的DNA先“敲碎”,再拼接。以Mb、kb、bp作為圖距,以DNA探針的STS(sequence tags site)序列為路標。1998 年完成了具有52,000個序列標簽位點(STS),并覆蓋人類基因組大部分區域的連續克隆系的物理圖譜。構建物理圖的一個主要內容是把含有STS對應序列的DNA的克隆片段連接成相互重疊的“片段重疊群(contig)”。用“酵母人工染色體(YAC)作為載體的載有人DNA片段的文庫已包含了構建總體覆蓋率為100%、具有高度代表性的片段重疊群”,近幾年來又發展了可靠性更高的BAC、PAC庫或cosmid庫等。
3、序列圖譜
隨著遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。DNA序列分析技術是一個包括制備DNA片段化及堿基分析、DNA信息翻譯的多階段的過程。通過測序得到基因組的序列圖譜。
大規模測序基本策略
逐個克隆法:對連續克隆系中排定的BAC克隆逐個進行亞克隆測序并進行組裝(公共領域測序計劃)。
全基因組鳥槍法:在一定作圖信息基礎上,繞過大片段連續克隆系的構建而直接將基因組分解成小片段隨機測序,利用超級計算機進行組裝(美國Celera公司)。
4、基因圖譜
基因圖譜是在識別基因組所包含的蛋白質編碼序列的基礎上繪制的結合有關基因序列、位置及表達模式等信息的圖譜。在人類基因組中鑒別出占具2%~5%長度的全部基因的位置、結構與功能,最主要的方法是通過基因的表達產物mRNA反追到染色體的位置。
其原理是:所有生物性狀和疾病都是由結構或功能蛋白質決定的,而已知的所有蛋白質都是由mRNA編碼的,這樣可以把mRNA通過反轉錄酶合成cDNA或稱作EST的部分的cDNA片段,也可根據mRNA的信息人工合成cDNA或cDNA片段,然后,再用這種穩定的cDNA或EST作為“探針”進行分子雜交,鑒別出與轉錄有關的基因。用PolyA互補的寡聚T或克隆載體的相關序列作為引物對mRNA雙端尾側的幾百個bp進行測序得到EST(表達序列標簽)。2000年6月,EMBL中EST數量已有4,229,786。
基因圖譜的意義:在于它能有效地反應在正常或受控條件中表達的全基因的時空圖。通過這張圖可以了解某一基因在不同時間不同組織、不同水平的表達;也可以了解一種組織中不同時間、不同基因中不同水平的表達,還可以了解某一特定時間、不同組織中的不同基因不同水平的表達。
人類(lei)基(ji)因(yin)組(zu)是(shi)一個國(guo)際合作項目:表(biao)征(zheng)人類(lei)基(ji)因(yin)組(zu),選擇的模式生物(wu)的DNA測序和(he)作圖,發展(zhan)基(ji)因(yin)組(zu)研究(jiu)的新技術(shu),完善(shan)人類(lei)基(ji)因(yin)組(zu)研究(jiu)涉及的倫(lun)理(li)、法律和(he)社會(hui)問(wen)題,培(pei)訓能利用(yong)HGP發展(zhan)起(qi)來的這些技術(shu)和(he)資源進行生物(wu)學(xue)研究(jiu)的科學(xue)家,促進人類(lei)健康。
本文地址://n85e38t.cn/zhongyizatan/71868.html.
聲明: 我(wo)(wo)們致(zhi)力于(yu)(yu)保護(hu)作(zuo)者(zhe)版(ban)權(quan),注重(zhong)分享,被刊用文(wen)(wen)章因無法核實真實出處(chu)(chu),未能及時與(yu)作(zuo)者(zhe)取得聯(lian)系,或(huo)有(you)版(ban)權(quan)異議的(de),請聯(lian)系管理員,我(wo)(wo)們會立即處(chu)(chu)理,本(ben)站部(bu)分文(wen)(wen)字與(yu)圖片資源(yuan)來自于(yu)(yu)網絡,轉(zhuan)載是出于(yu)(yu)傳(chuan)遞更多信息之(zhi)目的(de),若有(you)來源(yuan)標(biao)注錯(cuo)誤或(huo)侵犯了您的(de)合法權(quan)益,請立即通知我(wo)(wo)們(管理員郵(you)箱:),情況屬實,我(wo)(wo)們會第一時間(jian)予(yu)以刪除(chu),并同時向您表示歉意,謝謝!
上一篇: 虛擬現實顯微鏡遠程診斷(duan)乳腺癌