联系我们

手机号曹教授:159-1537-7604

微信号微信公众号:华大干细胞

邮箱号邮箱:789456414@qq.com

公司网址官网:www.ttganxibao.com

地址地址:深圳市、广州市、北京市(所在地区全市服务)。

一、基因组学及其研究内容

    1986年美国科学家ThomasRoderick提出了基因组学(Genomics),指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structuralgenomics)和以基因功能鉴定为目标的功能基因组学(functionalgenomics),又被称为后基因组(postgenome)。结构基因组学代表基因组分析的早期阶段,是以建立生物体高分辨率遗传、物理和转录图谱为主的。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息相同地研究基因功能,它是以高通量、大规模实验方法及统计计算机分析为特征的。



二、 结构基因组学研究

结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。根据使用的标志和手段不同,作图有三种类型,即构建生物体基因组高分辨率的遗传图、物理图谱、转录本图。



1、遗传图谱

     通过遗传重组所得到的基因线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期(使用的多态性标志有RFLP(限制性酶切片段长度多态性);RAPD(随机引物扩增基因组DNA);AFLP(扩增片段长度多态性);80年代后出现的有STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性分析)。

    2、物理图谱

      物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列把片段连接成染色体,确定遗传标志之间物理距离碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例,它包括二层含义,一是获得分布于整个基因组30,000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因cDNA克隆,进行测序;确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作模板扩增;比较并纯化特异带;利用STS制备放射性探针与基因组进行原位杂交,使每个100kb就有一个标志;二是在此基础上构建覆盖每条染色体的大片段:首先是数百kb的YAC(酵母人工染色体),对YAC进行作图;得到重叠的YAC连续克隆系,被称为低精度物理作图;然后在几十个kb的DNA片段水平上进行,将YAC随机切割后装入粘粒,粘粒的作图称为高精度物理作图。

    3、转录图谱

     利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分cDNA的5’ 或3’ 端序列称为表达序列标签(EST),一般长300-500bp左右。一般说,mRNA的3’端非翻译区(3’-UTR)是代表每个基因的比较特异的序列,将对应于3’-UTR的EST序列进行RH定位,即可构成由基因组成的STS图。截止到1998年12月底,在美国国家生物技术信息中心(NCBI)数据库中公布的植物EST的数目总和已达几万条,所测定的人基因组的EST达180万条以上。这些EST不仅位基因组遗传图谱的了构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外,EST计划还为基因的鉴定提供了候选基因。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此为了弥补EST计划的不足,必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。

三、功能基因组学研究


功能基因组学(Functuionalgenomics)又被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等。采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析,新的技术应运而生,包括基因表达的系统分析(serialanalysis of gene expression,SAGE),cDNA微阵列(cDNA microarray),DNA 芯片(DNA chip)等。

      鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体(modelorganism)。比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种的进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。目前从模式生物基因组研究中的出一些规律:模式生物基因组一般比较小,但编码基因的比例较高,重复顺序和非编码顺序较少;其G+C%比较高;内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致;DNA 冗余,即重复;绝大多数的核心生物功能由相当数量的orthologous蛋白承担;Synteny连锁的同源基因在不同的基因组中有相同的连锁关系。模式生物基因组研究揭示了人类疾病基因的功能,利用基因顺序上的同源性克隆人类疾病基因,利用模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂性状,加深对基因组结构的认识。

     此外,可利用诱变技术测定未知基因;基因组多样性;生物信息学(Bioinformatics)的应用。

四、蛋白质组学研究




基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,它有自身的活动规律,因而仅仅从基因的角度来研究是远远不够的,必须研究由基因转录和翻译出蛋白质的过程,才能真正揭示生命的活动规律,由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科——蛋白质组学(protemics)。蛋白质组(proteome)是指全部基因表达的全部蛋白质及其存在方式,是一个基因、一个细胞或组织所表达的全部蛋白质成分,蛋白质组学是不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式,功能机理、调节控制、药物开发、新陈代谢途径等提供理论依据和基础。蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式(修饰形式)、结构、功能和相互作用方式等,它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性,复杂性,低表达蛋白质难以检测等,应该明确其研究的艰难性。总体上研究可以分为两个方面:对蛋白质表达模式(或蛋白质组成)研究,对蛋白质功能模式研究。对蛋白质组研究可以提供如下信息:从基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后被修饰的程度等。

      由于蛋白质数目小于基因组中开放阅读框(ORF,open reading forum)数目,因此提出在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质为功能蛋白质(Functionalproteome),功能蛋白质只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次,是细胞内与某个功能有关或某种条件下的一群蛋白质。

      对蛋白质组成分析鉴定,要求对蛋白质进行表征,即分离、鉴定图谱化,包括两个步骤:分离蛋白质;鉴定。双向凝胶电泳和质谱是主要的技术。近年来,有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳;蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三大关键是:双向凝胶电泳技术,质谱鉴定,计算机图像数据处理与蛋白质数据库。

五、与基因组学相关学科诞生


     
随着基因组学研究的不断深入,揭示生命物质世界的各种前所未知的规律,完全揭开生命之谜,进而驾驶生命使之为人类的社会经济服务。基因组研究和其它学科研究交叉,促进一些学科诞生,如营养基因组学(nutritionalgenomics),环境基因组学(environmentalgenomics),药物基因组学(phamarcogenomics),病理基因组学(pathogenomics),生殖基因组学(reproductivegenomics),群体基因组学(populationgenomics)等。其中,生物信息学正成为备受关注的新型产业的支撑点。

生物信息学是以生物大分子为研究,以计算机为工具,运用数学和信息系学的观点,理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质,以计算机为工具,研究各种学科交叉的生物信息学的研究方法,找出其规律性,进而发展出适合它的各种软件,对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括:序列对比,基因识别和DNA序列分析,蛋白质结构预测,分子进化,数据库中知识发现(KnowledgeDiscovery in database,KDD)。