氨基酸肽键的作用
#生命的基石之一可以在太空中形成# 肽是最小的生物分子之一,是生命的关键组成部分之一。新的研究表明,它们可以在太空中的冰颗粒表面形成。这一发现证实了这样一种观点,即流星体、小行星或彗星可能通过撞击地球并提供生物积木而给地球上的生命一个开端。
肽是氨基酸的短链,而氨基酸是蛋白质的组成部分。当肽链连接在一起时,它们被称为多肽。长度超过50的多肽链就是蛋白质。有时缩氨酸被称为蛋白质的近亲。蛋白质是较大的生物分子,具有许多重要的生物作用,因此没有肽就没有蛋白质和生命。人体内的每个细胞和组织都含有缩氨酸。
埃米尔·费舍尔早在20世纪初就发现了肽和肽键。他获得了1902年诺贝尔化学奖。Fischer认为,总有一天科学家可以利用肽科学来合成蛋白质。现在我们生活在一个不断发现和合成肽的时代,导致了80多种新疗法,治疗各种疾病。肽是关键的,它们的用途广泛。他们的发现帮助我们进入了一个时代,这个时代标志着我们对生物过程的理解出现了突破。
他们在太空中的发现可能会对理解生命的起源起到同样的作用。
肽一定起源于某个地方。近年来,研究人员在太空中发现了氨基酸等其他构成元素。天文学家在坠落到地球的陨石中发现了氨基酸,他们还在一颗彗星中发现了甘氨酸以及铵盐和脂肪族化合物。现在看来,我们可以把缩氨酸添加到自然存在于太空中的有机构件列表中。
如果这项新研究是准确的,太空中的自然过程可以产生基本的生物积木。这表明生命出现的可能性是广泛的,任何肥沃的行星或卫星都可能被播种了这些基石。
这项研究来自耶拿大学和马克斯·普朗克天文研究所的科学家。论文题目是“通过碳原子的缩合在空间中生成缩氨酸的途径”。主要作者是塞尔日·克拉斯诺库茨基(Serge Krasnokutski),这篇论文发表在《自然天文学》杂志上。
在他们的论文中,研究人员指出,复杂的分子存在于星际介质(ISM)中。之前的研究人员已经在实验室模拟了ISM的条件,并产生了相同的复杂分子。但这类研究是有局限性的。他们解释说:“然而,到目前为止,只有相对较小的生物分子被证明在典型的空间条件下形成。”
这项研究的重点是灰尘颗粒的结冰表面,特别是碳或硅酸盐原子,它们存在于巨大的分子云(gmc)中。如果我们减去gmc中主要的氢和氦的数量,这些原子构成gmc中剩余质量的一半。碳原子和硅酸盐原子聚集在一起,形成直径不到百万分之一米的砾岩。它们在gmc中的位置至关重要,因为恒星,乃至行星,都是由gmc中的物质形成的。这是肽与地球或其他地方的生命之间潜在联系的开始。
这个发现很大程度上依赖于主要作者Serge Krasnokutski的科学努力。他对碳原子的化学性质很感兴趣,尤其是在太空中发现的冷碳原子。克拉斯诺库茨基开发了一种生产冷碳原子的方法,并获得了专利,这种方法可以在实验室中复制空间条件。现在世界各地的实验室都在使用这种方法。
2020年,Krasnokutski发表的研究结果显示,在冷碳原子的帮助下,甘氨酸(最简单的氨基酸)可以在尘埃颗粒的表面形成。他证明这些化学反应不需要紫外线光子作为能量来源。
找到答案的唯一方法就是设计并进行正确的实验。研究小组需要复制太空中冷碳原子的关键条件。他们使用了一种之前由耶拿大学MPIA实验室天体物理学小组开发的方法。该方法以超高真空(UHV)室为中心,可以产生ISM分子云中的真空。
在特高压内,研究人员模拟了冰尘颗粒的表面,并在其表面沉积了原子和分子。他们发现氨酮是在冷的表面形成的。氨基酮是甘氨酸的前体,甘氨酸是最简单的氨基酸。他们还发现了肽带的证据,肽带是一种化学键,在肽短链和蛋白质长链中将氨基酸连接在一起。
当研究小组将样本加热到分子云内部温度以上时,这些肽带才会出现。因此,当一颗新恒星形成时,或者当尘埃颗粒沉积在一颗恒星的宜居带的行星表面时,它们可能会自然发生。新闻稿总结说:“低温化学形成氨基酮和预热让氨基酮分子结合形成肽可以在星际尘埃颗粒上创造肽。”
研究小组已经发现了一种形成肽的新途径。它比其他途径需要更少的能量,这意味着它可以在寒冷的外太空自然发生。它还需要C原子、一氧化碳和氨,这是ISM中最丰富的分子种类。
碳是这一切的中心,就像它在所有生命中一样。单碳原子引发了丰富多样的化学反应。即使在外太空发现的条件下,这种化学物质对生命出现的需求也比以前认为的要大得多。
比DeepMind更厉害,MIT:给我氨基酸序列,就能告诉你蛋白质功能
晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI
DeepMind去年公布了生物学界的AlphaGo——AlphaFold,只要知道蛋白质的氨基酸序列,就可以预测蛋白质分子的三维折叠结构。
△AlphaFold预测蛋白质结构
现在MIT把AI的预测能力又推进了一步,直接通过氨基酸序列预测蛋白质分子的生物学功能,跳过AlphaFold预测蛋白质立体结构的步骤。
他们的论文《Learning protein sequence embeddings using information from structure》将在今年5月的ICLR学术会议上公布。
如何预测蛋白质功能
研究人员先让模型学习一些特定蛋白质的功能,将蛋白质结构编码成表示,用不同蛋白质结构相似性来监督模型。
他们根据蛋白质结构分类数据库(SCOP),对数千各类别、大约22,000种蛋白质进行模型训练。然后,将蛋白质结构与氨基酸序列编码成嵌入(embedding)这种数字表示,随机组对送入模型中。
这种嵌入与NLP中的上下文表示类似,两种嵌入越相似,单词出现在同一个句子中的概率就越大。
像单词对语义的影响一样,氨基酸是蛋白质的“单词”,蛋白质就是整个“句子”,嵌入包含着每个氨基酸序列与另一个氨基酸序列的相似性信息,机器学习模型可以根据嵌入预测每个氨基酸对整个蛋白质功能的影响。
而且该模型还能预测蛋白质的接触图(contact map),即每个氨基酸与其他氨基酸之间的距离,与来自SCOP已知的接触图进行比较。
这有助于模型更好地了解氨基酸在蛋白质结构中的确切位置,从而进一步预测每种氨基酸对功能的影响。
总的来说,对于某个氨基酸序列,该模型将为3D结构中的每个氨基酸位置产生一个嵌入表示。机器学习模型根据这些嵌入,基于接触图准确预测每个氨基酸的功能。
研究人员使用该模型预测哪些蛋白质可以通过细胞膜,所得结果的准确性已经超过之前最先进的模型。
用于药物研发和基因治疗
蛋白质是氨基酸通过肽键组成的线性链,却能折叠成极其复杂的三维结构,其具体的结构取决于氨基酸序列和它们之间的物理相互作用。而这种结构又决定了蛋白质的生物学功能。
尽管人类已经研究了几十年蛋白质,发明了很多探测手段,但是真正能准确测量出结构的蛋白质只有很小一部分,已经的几百万种蛋白质中,我们只知道其中几万个的结构,研究每个结构都需要花费数万美元。
过去我们需要知道蛋白质的结构才能研究它的功能,MIT希望利用这项技术让预测蛋白质结构的研究边缘化,即使只知道氨基酸序列也能给出蛋白质的功能。
所幸的是,知道蛋白质的氨基酸序列是一件相对比较容易的事情,我们只要给DNA分子测序就能得到。
掌握了蛋白质的功能,我们就能知道它会和药物发生怎样的反应,帮助我们进行药物研发。
此外,某些基因突变会改变蛋白质的结构,这项工作还可以用于基因组学,来检测破坏蛋白质结构的有害突变。
论文地址:
https://arxiv.org/abs/1902.08661
开源代码与数据集:
https://github.com/tbepler/protein-sequence-embedding-iclr2019
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
?’?’ ? 追踪AI技术和产品新动态
比DeepMind更厉害,MIT:给我氨基酸序列,就能告诉你蛋白质功能
#我要上微头条# #南阳上头条# #黄酒# “我在南阳说黄酒”
[来看我]
黄酒以大米、黍米①为原料,一般乙醇(酒精)含量为14%-20%,属于低度酿造酒。
优质黄酒中含有17种氨基酸,其中7种是人体必需的。且酒中的营养物质多以低分子的糖类和肽②、氨基酸的浸出物③状态存在,极易为人体消化吸收。所以说,黄酒也有健胃消食的功效。
名词解释:
①黍米-我国最古老的一种农作物,被列为五谷之一;
②肽-有机化合物,一个氨基酸的氨基与另一个氨基酸的羧基可以缩合成肽,形成的酰胺基在蛋白质化学中称为肽键。
③浸出物-是指除蛋白质、盐类、维生素外能溶于水的浸出性物质,包括含氮浸出物和无氮浸出物。
看看这些
你有木有觉得优质的黄酒
浑身是宝?
主题测试文章,只做测试使用。发布者:氨基酸肥料,转转请注明出处:https://www.028aohe.com/27241.html