hgm热恋上床,家长认可,秘密出轨的女人,发现真plswgs

【豆丁精品推荐】寒假志愿者社会实践报告
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
【豆丁精品推荐】寒假志愿者社会实践报告
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口丁香客App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香客App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:0 | 主题:20683
每发1个新帖可以获得0.5个丁当奖励
【讨论】基因组计划, 及后基因组时代
【讨论】基因组计划, 及后基因组时代
分享到哪里?
这个帖子发布于9年零351天前,其中的信息可能已发生改变或有所发展。
恭贺新子版成立第一贴 非常好的网页链接基因组计划, 及后基因组时代 (请大家发表有关看法 关于基因组的发展)科学报道:
zz人类基因组计划的竞争 人类基因组 重复碱基序列 单核苷的多态现象(SNP) 其他物种的基因组研究 遗传研究的历史 蛋白质组学 功能基因组学 信息生物学
::::人类基因组计划的完成::::基因组(genome), 由英文 “基因(gene)”和“全部”得来, 已成为21世纪每个人的日常熟语. 日, 历时10载耗资20亿美元的人类基因组计划最终完成, 并报道了99% 的人类基因组序列. 世纪初基本完成的这项工作堪与阿姆斯特朗和奥尔德林乘坐阿波罗11号宇宙飞船登月相媲美. 从这时起, 生物学被重新划分为前基因组和后基因组两部分, 我们正生活在后基因组时代.  DNA 由包含遗传信息的基因组构成. 四种碱基 A,T, G 和 C 组装成线性高分子, A-T, C-G 配对结合形成螺旋, 从而构成 DNA 链. 正如计算机系统采用二进制那样, DNA采用4进制储存信息. 遗传信息指导蛋白质的合成, 于是子代遗传了蛋白质的组成并产生了生理活性. 因此, 一旦我们已知了一个物种的DNA序列, 我们就可以推断它可以产生的所有蛋白质, 从而理论推测这个物种的所有生物特征. 有关蛋白质的遗传信息的单位称作基因, 一个生物的所有基因称作基因组. 由此创立了一个新兴的学科来研究基因组, 即基因组学(Genomics).
DNA 及 染色体结构
U.S. Department of Energy Human Genome Program&http://www.ornl.gov/hgmis&来自法国,德国,***,中国等六国的科学家自1990年组成了一个多国合作小组 开展人类DNA测序工作以揭开人类基因组之谜. 最初他们希望2005年前能够获得人类DNA序列的图谱, 但是到1997年, 在耗费了巨额资金和一半预定时间之后,多国合作小组仅完成了3%的测序工作. 与此同时, 遗传生物学家Craig Venter博士, 创立了一个名为“Celera Genomics”的风险投资公司并宣称他将在无政府投资条件下早于多国合作小组完成人类基因组计划. 尽管很多科学家表示怀疑, Celera采用了如“散弹枪”等一系列新的方法并很快真的追上了多国合作小组. 看到自己即将失利, 多国合作小组在Clinton总统的撮合下开始与Celera合作, 在2000年6月完成了90%, 2001年初完成了99%的人类基因组草图. 有意思的是多国合作小组在英国的自然(Nature)上而Celera在美国的科学(Science)上各自独立的在同一周发表论文, 在日的记者招待会上联合宣布人类基因组测序工作的完成. 也许是出于***原因,两大权威科学杂志均在没有100%检验并证实结论的情况下刊登了他们的论文, 而且两个小组由于竞争关于统一课题的成果都没有做足够的方差检验. 事实上他们的成果中大概有0.14%(大约400万碱基对)序列差异, 还需更完整的检验.Celera公司标志 和 Craig Venter博士&& &/venter.htm&
基因组学在线辞典:
▲ top ::::人类基因组::::人类基因组大约由30亿碱基对构成. 只有百分之一是含有与蛋白质合成相关基因的外显子(exon), 其余的99%是内含子(intron) 和 重复序列(repetitive sequence),具体功能尚待证实. 也就是说,基因仅占基因组的1%. 破译一个碱基需要一美元, 所以破译全基因组耗资30亿美元. 含核细胞中含有人类基因组, 基因片断可以表达蛋白质. 细胞不同以及处于不同发育阶段导致了蛋白质不同. 换句话说, 一个人的所有细胞含有相同的基因组, 但是每个细胞根据环境表达不同的蛋白质. 骨细胞产生骨发育有关的基因, 肌肉细胞为肌肉生产蛋白质. 人类基因数量曾被估计为约100,000, 但现在估计约为 30,000 ~ 40,000左右, 不到低等生物如线虫(C. elegans)或果蝇(drosophila)的基因数的两倍. 虽然没有确凿证据证明基因数量和现存生物中生命复杂程度之间的联系, 一场关于预估基因数的争论旋风仍然在进行. 因为如果研究者们不断研究已知基因的相似结构从而推断新的基因, 新的结构很可能被错过, 我们很可能看不到剩下的基因组的1%. 研究者们曾一度仅热衷于蛋白质在其上合成的基因. 从全基因组中利用mRNA的反合成仅破译基因的方法被广为使用, 在这一过程中基因表达蛋白质. mRNA可被用来合成相应的DNA链, 我们叫它cDNA, 或者 cDNA文库(library)因为一个细胞中的整个mRNA都被逆转录为cDNA. 一旦一个cDNA库渗透到大局杆菌(e.coli)中, 就可以培养含有cDNA的大局杆菌, 然后就可以进行测序. 通常读取首端及末端的几百个碱基序列, 然后把它们与已有数据库中的序列进行比较从而确定它们是新的还是已知基因. 国家卫生研究院(NIH)提供名位Blast的为此目的广泛使用的软件. Blast 软件:
有时并不是全序列都被转录, 而是仅一些部分被取出以做成表达序列标签(EST). 尽管EST是不完全片断, 它们可以被组合起来描述最初完整序列或者揭示一些基因出现的频率. 然而, 因为一些基因非常罕见甚至根本难以见到, 描述完整基因序列仍然是非常重要的. 当我们知道了全序列后我们同样可以在基因组上定位EST发现的基因. 根据注册的EST数量计算, 人类基因数量超过100,000*(* 排除重叠结果是120,000). 如果相同基因仅表现为一些EST片断, 计算值将高于真实值.
EST 数据库 (Entrez): 一个人类的基因组约有一米(稍逾3英尺). 如果可以把基因组列成一排成批破译, 人类基因组计划将是非常容易完成的. 然而解链DNS并将其列成一排非常难, 因为人类DNA包含相互折叠的46条染色体(chromosomes)-22对和一对XY(男性)或XX(女性)性染色体. 广泛应用的是一种替代方法,即用特定的 酶(enzymes)把DNA切成片断, 逐个分析然后得到全序列. DNA测序反应(Maxim-Gilbert, Sanger, 1977), PCR技术(K. Mullis, 1983), 及荧光自动测序法(Smith, 1986)是基因组计划的赖以进行的三种最重要的技术. 多国合作小组将30亿碱基对切成几个细菌人工染色体(BAC)片断, 然后切成更短的片断以便使用碱基序列分析仪. 普通BAC含有约150,000碱基对, 这就是说200,000个BAC就可以足够包含全人类基因组. 理论上说200,000个BAC足够了, 但事实上他们使用了300,000个BAC. 因为DNA自动测序仪可一次读取约500碱基. 他们随机截取BAC克隆体并读取首端和末端各500个碱基, 然后组合得到大于1000碱基的全序列. 通过比较重叠的片断, 连接然后重建序列. 多国合作小组通过分析5800万碱基的重叠读取了230亿碱基对序列, 这是人类基因组的八倍. 99%草图有400,000个片断. 其余的1%是将这些片断连接以及24条染色体(22对和X,Y), 尚待后续工作.
HGP 实验室 (350)Whitehead Institute for Biomedical Research: www-genome.wi.mit.edu Sanger Centre:
Washington University St. Luis Genome Center: genome.wustl.edu/gsc DOE JOINT GENOME INSTITUTE:
Bayor College of Medicine human Genome Center: Celera的进展略有不同. 他没有使用BAC克隆体而是将全基因组随机切成几千万片断, 读取每一片段的序列然后拼接它们. 尽管看上去更直接, 由于要比较几千万个序列信息并找到重叠部分, 这项工作需要大量的计算机工作. 为解决这个问题Celera的合作者们发明了高效的生物信息学(Bioinformatics)运算法则, 从而得以短期内赶上多国合作小组的工作. 两个小组都使用了荧光分析仪来读取500-1000个丙烯酰胺硅胶中末端使用了荧光物质的DNA片断, 并通过分子量的不同来分离. A, T, G和C. 碱基显示指定的不同的颜色, 这样就测定了DNA序列. ADAPTED FROM FIGURES PROVIDED BY E. GREENNATIONAL HUMAN GENOME RESEARCH INSTITUTE根据百慕大宣言, 多国合作小组的碱基序列信息可被任何人24小时免费使用. 这些网站相互交流且每日更新, 每个提供的都是最新信息. GeneBank:
DDBJ: 但是Celera仅允许大学及研究机构在其网站上免费使用100万碱基的信息. 如果需要更多或者进行商业研发, 你将需要填一份仅供纯研究目的使用的誓词. 也就是说, 商业使用需要付费. 同时Celera将对大约200个基因申请专利, 这些基因被认为是和疾病相关的, 尽管绝大部分基因将被公诸于众. ▲ top ::::重复碱基序列:::: 约有人类基因组的99%被称作垃圾DNA, 他们不作为基因表达. 低等动物(拟南芥11%, 线虫7%, 果蝇3%)的垃圾DNA相对较少且在全基因组中平均分布, 人类基因在广大的垃圾DNA中离散为几个小组. 估计有一个控制基因物理聚集形态的机能, 但迄今为止未被发现. 在重复序列中最常见的是Alu, 大约占10%. 通常重复序列含有大量AT碱基和相对较少GC碱基. 端粒(telomeres)或 着丝点(centromeres)中的其他重复序列被认为参与了染色体保护和细胞分裂. 端粒在细胞分裂中变短, 相对较短的端粒组织细胞分裂, 这可能跟衰老有关. 癌细胞有阻止端粒变短的机能, 所以细胞能无限复制. 世界上第一个成年哺乳动物克隆体多莉(Dolly)的衰老被饶有兴致的关注, 因为她是从母体细胞克隆而来, 端粒已经变短.
端粒和着丝点&http://www.esb.utexas.edu/dr325/genweb&&www.biokurs.de/skripten&  ▲ top  ::::单核苷的多态现象(SNP, Single Nucleotide Polymorphism):::: 尽管通过人类基因组计划(HGP)破译了人类基因组序列, 这才只是能够比较个体差异的单核苷多态现象(SNP)的开始. 已知每1000个序列中会有一个SNP, 这就是说个体遗传信息差异仅约有0.1%而其他99.9%都是相同的. 人类基因组计划估计人类基因组中大约有140万SNP位点. Celera估计大约有210万SNP位点. 如果碱基序列因SNP而存在差异, 相关氨基酸就会不同, 这会导致蛋白功能不同.如果SNP现象是随机的, 将会有大约2140万个. 幸运的是人们发现SNP位点通常聚集并行成单倍体基因型, 而且估计这些单倍体基因型约有10万对. 所以, 英国的Sanger Cetre联合会以及美国的Whitehead生物医学研究所正在完成一个实际约30万单倍体基因型的计划.
SNP联合会:
SNP, 或者单倍体基因型, 是一个有前途且重要的研究个体, 系谱, 和人种特征以及遗传疾病治疗的线索, 而且它可以用来鉴别一个个体是否患有某种疾病或者同种疾病患者应如何治疗. 所以, 如果能够收集SNP信息, 个人医药时代将会来临. 这些研究创立了新领域如比较基因组学(comparative genomics) 和药物基因组学(pharmacogenomics). 为了能够使用简单的仪器鉴别个体基因差异, 对中等价格的高速筛选法的需求被提出. 近期报道荧光活化细胞分选仪(FACS, Fluorescence Activated Cell Sorter)能够高速处理大量样品(Genomics 5-143). 另一方面, 比较基因组学的又一个例子, 如果黑猩猩的全基因组被破译, 有关黑猩猩模型的特定基因研究将成为可能. ▲ top ::::其他物种的基因组研究::::人类基因组序列当然不是第一个被研究的. 基因组远远短于人类的低等动物的研究早已进行, 如大肠杆菌Escherichia coli(460万碱基对), 酿酒酵母(S. cerevisiae)(120万), 线虫(1000万), and 果蝇(1400万). 自从1995年报道了微生物的基因组序列, 截至2001已破译了几十种动物的全基因组序列而且数量还在迅猛增长. 尽管小鼠(330亿碱基对)或者玉米(50亿)的基因组都比人类(30亿碱基对)的大, 并不是每种动物的基因数量与其基因组尺寸成正比. 总体上说高等动物的基因组大, 基因排列得也稀疏, 也就是意味着不必要的重复碱基序列和基因内区的比率更大. 所以大的基因组并不意味着更多的基因, 甚至高等动物并不一定比低等动物的基因多. 例如果蝇比较低等的线虫少5,000个基因. 而且, 被认为更高等更复杂的裂殖酵母(fission yeast)和裂变酵母(S. pombi)比芽殖酵母(budding yeast)和酿酒酵母少20%的基因. 这就是说, 基因功能比基因数量更重要. 所以裂殖酵母和裂变酵母含有恰好的核心基因和特异性裂殖酵母基因. 也正因此, 如果去掉与原核细胞共有的基因, 就可以发现真核细胞独有的决定其特异性的基因.一种叫生殖道支原体(Mycoplasma Genitalium)的微生物含有最少的基因(470). 由此事实得出, 理论上可以制造出仅由470个基因联结起来的人造生物. 事实上Craig Venter已宣布他可以制造人造生物. 如果能制出人造细菌, 就可被用于环境清洁或者药物输送(DDS, Drug Delivery System). 人造生物将是开启历史新纪元的工作. 在Craig Venter的遗传研究所(TIGR)这项研究正在进展之中. 他们正在寻找能够保持生物活性的基因这一步, 据他们说生殖道支原体的470个基因中有约300个是核心基因. 如果能够清楚的确认核心基因, 就可以将他们联结起来而制造出人造生物, 从来没有出现过的生物. 现在,***和美国正因***水稻和美国小麦而拥有植物供给上的国家尊严. 尽管看上去基因数量不相上下, 事实上小麦比水稻多出三倍的基因, 所以美国的负担较重. 而且, 国家生物工艺信息中心与Celera在人类基因组之后在小鼠基因组计划上又一次形成竞争. 根据2001年的最新报道, Celera正领导这项计划并宣称他们将对小鼠基因组信息收费.(Science, , 822-823): National Center for Biotechnology Information and
生物体基因组比较&http://biotech-adventure.okstate.edu/low/basics/genetics/genomes/& 小鼠及人类的基因比较 U.S. Department of Energy Human Genome Program&http://www.ornl.gov/hgmis& 由于遗传学的发展和DNA序列测定的加速, 大多数高等动物如人类等的遗传信息都将被破译. 对各种遗传疾病以及癌症的治疗方法的产生被寄予厚望. 但是也有不利影响. 人类一方面正在面对海量的信息, 研究目标的数量也在爆炸式的增长, 传统方法再也处理不了新信息;而与此同时, 基因组计划所提供的信息被少数几个国家投资发展并垄断, 因而产生了很多社会问题, 如专利权和患有遗传疾病的个体的额外医疗保险. 照现有势头发展下去, 如以人种基因来评价个体能力的故事将有可能成为现实.种群 物种 基因组尺寸(百万对) 基因数 序列测定完成时间 原核生物 支原体Mycoplasma 0.58 470 1995   大肠杆菌E. coli k12 4.6 4,300 1997   绿脓杆菌Pseudomonasaeruginosa 6.3 5,500 2001 真核生物(单细胞) 酿酒酵母S. cerevisiae 12 6,200 1996   裂变酵母S. pombi 14 4,900 2001   幽门螺杆菌Helicobacter pylori 1.7 1,500 2001 多细胞 线虫C. elegans 100 18,400 1998   果蝇drosophila 140 13,600 2000 脊椎动物 阵风鱼Fugu rubripes 400 30,000? ?   人类 3,000 40,000? 2003   小鼠 3,300 40,000? 2007 植物 拟南芥Arabidopsis 125 25,000 2000   水稻 560 30,000? 2005   玉米 5,000 30,000? ?   小麦 17,000 30,000? ?
2,900种物种的基因组尺寸信息 :
基因组信息网:NCBI site: Genome Web: Eukaryotes: Animal Genome size database:
Mouse Genome: Mouse Genome Informatics, Mouse Genome Sequencing, Mouse RH MapRice Genome: Rice Genome Research, Rice-ResearchYeast Genome: Stanford, ProteomeZebraFish:
物种基因可因突变和杂交而改变, 但是细菌的名为质体(lasmid)的基因可以独立扩增或在菌种内或种间进行交换. 当细菌具有了抗药性后, 这种特性可以通过质体而传播给其他细菌. 有趣的是多国合作小组报告中的113个基因被推测来源于细菌. 这些基因不存在于已完成基因组序列分析的酿酒酵母, 线虫和果蝇中, 而仅存在于细菌中. 所以这些基因要么自细菌移入脊椎动物, 要么被那些动物删除却仍存留于人体中. 无论怎样, 具体功能仍待研究, 但是关于基因平行传递的假说被强烈支持.就狂犬病来说, 为了得到优良血统的子代, 母犬的第一个雄性子代是非常重要的. 据说如果第一个雄性子代不良, 尽管其他雄性子代血统优良, 后代却表现出第一个雄性子代的特征. 是否最初进入的精子将会遗留雌性体内并影响其和其他雄性所产的后代?这只是一种假说, 但如果这是事实, 这将是有关处子之身的神话故事的生物学证据.▲ top  ::::遗传研究的历史::::遗传学始自19世纪中叶Mendel研究豆类特异性. 他在研究豆类特异性如形状和颜色的过程中, 发现了如显性和隐性等遗传规律, 提出了基因的概念. 1968年Johann Fridrich Miesher发现了DNA极其四碱基. 20世纪中叶Erwin Chargaff发现了DNA中A, T, C, G四种碱基, 这成为DNA以碱基对形式存在的证据. 1953年Watson和Crick首次发现了DNA双螺旋结构, 并继而揭示了基因的分子结构. Rosalind Franklin的X射线衍射技术对此也有贡献, 但他英年早逝并没有获诺贝尔奖. 后来Crick创立了现代生物学的核心理论, 即遗传信息由DNA传到RNA并指导合成蛋白质. Watson, Crick, and Franklin 20世纪60年代发现了限制酶(resteriction enzyme)可以切割DNA, 以及所有的氨基酸合成密码子. 70年代发明了利用限制酶和连接酶(ligase)的DNA重组技术, Gilbert和Sanger发展了DNA碱基序列分析技术. 80年代 Kary Mullis 发展了PCR技术(polymerase chain reaction)可以大量扩增DNA使研究少量DNA成为可能. 1990年多国合作小组启动了人类基因组计划, 1998年Celera开始与人类基因组竞争. 1999年12月和2000年5月, 染色体21和22的最短序列被完全破译. %的, %的全人类基因组序列被破译和报道. 科学报道: ▲ top ::::蛋白质组学::::蛋白质组学(Proteomics)是蛋白质的遗传学. 除了发生突变, 基因组结构保持不变, 但是蛋白却由于细胞种类及环境的不同动态表达为不同结构. 虽然只有部分DNA遗传信息通过mRNA被转录到蛋白质合成过程中, 但事实上细胞活动是在蛋白水上进行的. 所以蛋白质组学与基因组学同等重要, 甚至更为重要. 尽管重要, 与DNA能够识别互补序列而形成双螺旋链并通过PCR技术扩增相比, 蛋白质不能由序列选择性合成和被周围环境修正, 蛋白质组学刚刚起步. 最终目标将是代谢物组(matabolome)或生理组(physiolome)的靶物, 用以研究蛋白质的真正意义, 但是现在研究还仅停留在观测蛋白质是否被表达的阶段.最常使用的分离蛋白质的方法是采用二维凝胶(2D-Gel)(通常18 x 18 cm, 150mg蛋白质), 然后使用质谱法来确定蛋白质种类和表达水平. 通常一维坐标采用等电聚焦的pH值梯度, IEF垂直方向上的另一维采用聚丙烯酰胺凝胶电泳后的尺寸分布(SDS-PGE). 从凝胶中萃取的蛋白质以肽酶(如胰岛素)水解, 然后质谱分析, 例如基质辅助激光解吸飞行时间质谱(MALDI-TOF), 从而给出肽片断的部分序列, 最终通过数据检索给出蛋白质种类的信息. 偏向选用胰岛素的原因是它能切除C-末端的氨基酸如赖氨酸和精氨酸从而产生等量正电荷分配. 等量正电荷有利于正离子的质谱分析并利于粗略量化肽的数量. 在MALDI中矩阵中的有机分子吸收激光将电离能传递给被分析的肽, 所以温和的离子化有利于出现整个肽的峰而不是出现碎片峰. 如果肽样品处于液相色谱的溶液中甚至需要更温和的离子化方法, 如电喷雾液相色谱质谱(ESI-MS), 但是灵敏度将较MALDI降低. 由于多级MS离子阱质谱仪或准稳态注入渡越时间(QTOF)技术使提纯肽后能够观测小的肽碎片, 序列分析也成为可能. 像上面看到的, 二维凝胶是非常有用的工具, 但是也有一些局限. 首先, 熟练的分析员必须得到可重现的数据, 但很多情况下低表达率蛋白质达不到筛选标准. 尤其是蛋白质有强憎水性时(许多膜的蛋白质包裹引起了药物研究者的极大兴趣, 但它们在凝胶中不移动). 太大或太小的蛋白质也会产生问题. 为了增大溶解并简化分析, 蛋白质混合物可根据几种理化性质如电荷,体积,憎水性,粘度等预分离, 这是一种很好的解决办法. 根据细胞内有机物预分离应该有助于细胞分类和所给蛋白质的定位. 如DNA芯片一样, 二维凝胶问题的另一个解决方法, 抗体或蛋白质序列芯片应运而生. ***色谱如吸收检测多元毛细管电泳, 或HPLC也是一种可与二维凝胶竞争的方法, 但是溶解度仍然远低于二维凝胶, 而且需要强大的数据检索/分析支持. 有时基因组非预期的蛋白质会奇异般的产生在蛋白质组中. 这是我们没有完成蛋白质表达控制信息的直接标志. 最近报道“基因捕获法”发现了表达被遗漏了的新基因. 这种方法使用转位子在基因组中随机加入b-牛乳糖等标志蛋白然后筛选预期蛋白质(Nat. Biotechnol. ).
二维凝胶&www.bmskorea.co.kr/new01_39.htm& 蛋白质样品基本上是在两种条件下制备的, 在两块二维凝胶上的差异被用做研究. 因而结果必需可重现才能用于比较分离二维凝胶, 但这并不容易. 一种解决之道是在不同蛋白质上使用荧光染料或不同质量的示踪剂. 另一个问题是少量的蛋白质可能由于另一种蛋白质大量存在而被忽略. 这就需要可比较目标物, 例如常规细胞/癌细胞, 健康细胞/感染细胞, 愉悦的细胞/压力大的细胞, 通常在相关条件下扮演重要角色的蛋白质表现出不同的表达. 另外, 如果研究了高温沙漠中或高压海底的生物的蛋白质表达, 将有可能给出恶劣天气下植物繁殖的线索.蛋白质组学的另一个根本局限是与基因数量相对稳定相比, 蛋白质表达不稳定. 一种蛋白质在整个生命过程中可能只产生一次或者根本不产生. 所以, 如果有人试图研究所有可产生的蛋白质, 那将是长期而艰巨的工作. 但是确实有人在做这项工作. 技术日新月异, 与10年前一个科学家用一年时间发现2~3种蛋白质相比, 现在的蛋白质组学技术可以仅仅使用质谱来推断蛋白序列并使用遗传信息库鉴别蛋白种类. 有朝一日人类蛋白质组计划也将如基因组计划一样付诸实施. Oxford GlycoScience和Large Scale Biology是现在蛋白质组学研究的领袖. reference 蛋白质组学: Nature, , 715-720 蛋白质相互反应如蛋白质表达一样重要. 现今表面等离子体耦合(SPR)是研究蛋白质联接的常规技术. 当一个蛋白质与芯片相连后它们会在芯片的另一面发光从而可以用来检测散射, 反射角与联结的蛋白分子量成比例. 所以如果另一种蛋白质与芯片相连, 反射角是否增大, 可以反映蛋白质联结紧密程度. 通常在芯片上使用较小的配体而在其上联结大的蛋白质所以角度变化很大. 另外, 由于连续加入反应试剂, 可以分析联结速率和脱离速率. 芯片被植于金上, 使用化学键合法或链酶亲和素-生物素键合法在其上固定小配体. 现在Biacore是唯一的SPR经销商.
Bicore 3000 
蛋白质信息网:
▲ top ::::功能基因组学::::人类基因组计划已经破译了基因序列, 下一步将是由功能基因组学研究已破译基因的功能并控制它们. 正如千岁基因组公司(Millenium Pharmaceutical)的Robert Tepper说的那样, “现在我们知道了词典里面有什么, 我们需要知道每个词的意思.” 尽管基因序列的99%已经被破译, 只有10%的全部基因的机能是已知的. 一个方法是通过比较未知和已知基因来类推其机能. 数据库正在建设之中. 另一个方法是蛋白质组学, 但是首先必须能够制得一些溶液.在结构基因组学(功能基因组学的一个分支)中, 研究者采用NMR和X光来分析蛋白质的三维结构, 通过结构比较找出未知蛋白质, 这与传统的比较碱基序列的方法大相径庭. 对于一个成功的研究来说, 构效关系和高效蛋白质结构数据库的构建是关键. 蛋白质结构识别中的蛋白质结晶和数据处理曾经非常耗费时间和精力, 现在由于成功的高速筛选结晶法的应用使数据库中结构的数量成几何级增长. 截至2002年初, 蛋白质数据库(PDB,Protein Data Bank)中已注册约17,000个结构.使用DNA芯片做基因表达模式研究是现今蛋白质组学中一个非常热门的课题. DNA芯片技术不是研究蛋白质本身而是跟踪mRNA转录过程, 这一过程是合成蛋白质的中间步骤, 被称作转录本组系. DNA包含储存蛋白质遗传信息的外显子, 以及现今对其功能不甚了解的内含子. 外显子和内含子被转录为RNA, 然后去除基因内区仅剪接(splicing)外显子从而得到mRNA. 因此, 研究mRNA序列, 可以估计蛋白质翻译率. 斯坦福大学Affymetrix和Patrick Brown的DNA芯片利用cDNA与mRNA互补的性质跟踪了活细胞中mRNA的定量转化.
Affymetrix's CHIP Patrick Brown's Pin Array
科学 功能生物学网站: ▲ top   ::::信息生物学::::后基因组研究如基因组序列或功能分析以及基因交互识别等如果没有大量数据处理技术是无法进展的. 因此, 一个名为信息生物学(Bioinformatics), 藉由联合高性能计算机和高效数据处理运算法则的新研究领域出现了.首先它被用于计算人类基因组计划得出的遗传碱基序列, 从而得出蛋白质功能. 虽然已发现了大多数基因的碱基序列和氨基酸序列一级结构, 仅少量蛋白质的功能是已知的. 因此, 信息生物学通过使用基因碱基序列数据和比较已知及未知功能的基因, 从而类推未知的基因功能. 他们不仅简单比较序列, 而且试图根据蛋白质碎片结构模块化的事实通过重组每个模块来推断功能. 虽然只是一个模拟步骤, 但有传言说他们已经达到推断80~90%基因功能的水平.另一方面, DNA芯片关于全基因组研究的实验数据, 也需要数据处理技术来解释众多基因表达的生理意义. 基因表达模式研究将会成为新治疗和诊断的基础知识, 而且它将会提供基因互相影响的信息. 目前, 他们根据基因的表达速率或形式来建立群, 而且设想比较靠近的群中的基因物理上或生理上是相近的. 市面上已有几个专业的软件用来处理这些DNA芯片的实验数据.信息生物学也被用于解释蛋白质交互作用的网络. 最终, 可以通过输入从信息生物学得出的蛋白质功能和表达数据来建立一个虚拟细胞, 完美地模拟细胞功能. 如果虚拟细胞的研究进一步扩展, 可以创造虚拟的动物或病人, 这样新药物的研究就可以只需通过计算机(虚拟系统)而无须任何现实的或者活体的实验. 尽管现在数据不足不能完成所描绘的蓝图, 已经可以建立一些有趣的模型.
hbchh edited on
回复:【讨论】基因组计划, 及后基因组时代
分享到哪里?
to hbchh,提供一些有关海洋生物方面的基因组计划及后基因组时代方向的介绍吧!
关于丁香园

我要回帖

更多关于 王迅承认出轨 的文章

 

随机推荐