氨基酸疏水性计算
生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。
结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而是万里挑一的密码系统。
天然的三联基因密码的第一个字母都有特定的对应方式。举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。所有由α-酮戊二酸所合成的氨基酸,其三联密码第一个字母都是C;所有由草酰乙酸合成的氨基酸,第一个字母都是A;最后,几种简单前体通过单一步骤所合成的氨基酸,第一个字母都是G。
三联密码的第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。
三联密码的第三个字母不含任何信息,不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C。
第三个字母的随机性暗示了一些有趣的事情。二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子)这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。
第一个字母和氨基酸前体之间的关系直截了当,第二个字母和氨基酸的疏水性相关,第三个字母可以随机选择。这套密码系统除了可以忍受突变,还可以降低灾难发生时造成的损失,同时可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。
dna和蛋白质序列数据分析工具pdf

蛋白质是生物体中重要的大分子,构成生命活动的最基本的物质之一,组成蛋白质的氨基酸按一定的组成和数目进行排列即为其一级结构。蛋白质的一级结构是理解蛋白质结构、作用机制一级与其同源蛋白质生理功能的必要基础。下面我们介绍下四个蛋白质序列分析的在线工具。
蛋白质疏水性分析
氨基酸的疏水性(Hydrophobicity)反映蛋白质的折叠情况,在潜在的跨膜区域会出现疏水区,并且在保持蛋白质的三级结构上(比如维持生物膜的结构)起重要作用。蛋白的亲疏水性(Hydropathicity/ Hydrophobicity)图谱可为蛋白跨膜区域的鉴定提供参考。利用ExPasy Proteomics Server 网站上面ExPASy Proteomics tools 中的软件ProtScale对某蛋白各个氨基酸的疏水性进行分析,结果如图所示。说明蛋白序列中并不存在明显的疏水区或亲水区。

蛋白的亚细胞定位
利用在线软件PSORT II prediction 可对蛋白进行亚细胞定位预测分析。这是第一个广泛使用的程序,用于预测革兰氏阴性细菌中的蛋白质亚细胞定位位点。要预测目标蛋白质的亚细胞定位,只需将蛋白质的氨基酸序列(单字母代码)粘贴到PSORT 窗口中,然后单击提交。

信号肽及跨膜结构域分析
SignalP是一个信号肽预测服务器,它的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切位点及其所在,原核生物和真核生物都可以进行预测。目前服务器提供的是SignalP 4.0版本。在线服务器网址:http://www.cbs.dtu.dk/services/SignalP/直接输入FASTA格式的氨基酸序列,可以是一条也可以是多条。然后根据你预测的蛋白质来源选择革兰氏阳性细菌、革兰氏阴性细菌或真核生物。
可选神经网络法(neural network,结果中简写NN);隐马可夫模型(hidden markov models,结果中简写HMM)以及联合两种方式。默认为两种一起预测。两种方法各自的优势:HMM主要在于预测是否含有信号肽;NN主要为预测信号肽位点。


蛋白质中卷曲螺旋区域的预测
COILS 是一个程序,可将序列与已知平行双股盘绕线圈的数据库进行比较,并得出相似性分数。通过将此分数与球状和卷曲螺旋蛋白中的分数分布进行比较,该程序然后计算该序列将采用卷曲螺旋构象的概率。
https://embnet.vital-it.ch/software/COILS_form.html

end
注:本推文首发“科研日精进”微信公众号
实验技能丨四个蛋白质序列分析在线工具,dna和蛋白质序列数据分析工具pdf
人类交配会产生快感,但分娩时很痛苦,真的是自然选择的最优解吗?
自然选择从未承诺提供最优解,也从未承诺会搞出次优解、“最不坏的解”或在任何程度上算做优秀的“解决方案”。生物的许多性状是勉强凑合的,只要携带者还没死干净,无论产生多大的痛苦都可以继续传下去,至于携带者死了,那更是连问题一起带走了。
Freeland 等学者计算比较了真实的遗传密码与随机分配密码在抵抗随机突变时的效果,确定现在生物使用的遗传密码胜过几乎所有的随机分配,但并不完美。那可是演化了超过 37 亿年的。
20 种常见的蛋白氨基酸比较均匀地分布在广泛的疏水性、大小和电负性值范围内,可能与目前的遗传密码建立了较为稳定的关系。添加更多碱基可能让突变更难控制,后果不完全是积极的;
在漫长的进化时间尺度上,拥有额外的氨基酸可能允许生物以新的方式适应环境,但短期收益可能不足以让额外的氨基酸保留下来;
在同种生物的种群内部,“碱基的大幅增减”“蛋白氨基酸数量的大幅增减”这样涉及遗传密码的重大创新可能难以站稳脚跟。
你可以预期动物的性状也如此。
“既然生孩子这么痛苦,为什么要生”的想法,忽视了历史上女性并不总能“因为我不想生所以我就不生”,很多小孩是人们无聊时靠身体取乐的副产物,是意外来到这个世界上的——2019 年,地球上实施了约 5500 万例人工流产。2017 年,我国有统计的人工流产数量为 962 万例,估计还有数百万未统计到。自古以来,“并不想生,但是搞大了肚子后不知道怎么停止,被迫生了下来”的情况常有。
人类女性骨盆最短的切线从现在的基础上再延长一厘米,就能明显降低分娩时的死亡率和痛苦。但你没法期待人们在理解骨盆的解剖结构后、掌握剖腹产前那么短的时间里靠随机和低水平人工筛查整出这种性状。在比这早的年代里,分娩死亡率本就参与限制着人口增长率。在智人两百多万年的历史中,大部分时期我们的人口比黑猩猩还少。
你可以讨论“设某个时期婴儿活到分娩完毕的概率约 70%,那之后活到传代的概率约 40%,可得每个婴儿活到传代的概率约 28%;此时出现一个性状,降低婴儿活到分娩完毕的概率为约 69% 并提升那之后活到传代的概率为约 41%,可以得到每个婴儿约 28.29% 活到传代的概率,这性状有可能被生殖选择轻微青睐”。显然,这里面的影响因素极其多,“婴儿头的直径和产妇骨盆最短切线”的贡献相当有限、就连这两个因素本身也受到营养条件和孕妇年龄等大量其他因素影响,无法期待导向什么完美平衡。
主题测试文章,只做测试使用。发布者:氨基酸肥料,转转请注明出处:https://www.028aohe.com/18571.html