修正氨基酸(机器学习让氨基酸分析不再费时费力)

修正氨基酸

氨基酸分析数据处理

机器学习让氨基酸分析不再费时费力

在医药、食品、农业和生物化学领域氨基酸分析至关重要。氨基酸的分析方法众多,包括毛细管电泳,气相、液相和离子交换色谱,电子传感器等,这些方法在分析氨基酸之前往往需要进行分离操作,费时而且费力。开发一种简便、经济、无需提前分离氨基酸的分析方法必定是广大研究者 “喜闻乐见”的。

如今机器学习方法(ML)“大行其道”,在许多领域获得了成功,可以处理复杂而且棘手的问题,如药物设计、疾病诊断、虚拟合成、材料筛选等。用ML方法进行氨基酸分析可以带来意想不到的“惊喜”。在惊喜之余,将ML方法用于分析氨基酸最大的困难在于缺乏足够的数据集进行模型训练,这就是所谓的维度灾难(curse of dimensionality),幸运的是高通量实验可以帮助我们获取大量数据而突破数据瓶颈。

有鉴于此,南京大学许昭怡和西安师范大学李剑超课题组利用光谱数据通过机器学习方法进行了5种混合氨基酸的分析研究,这种方法不仅可以区分氨基酸类型,同时还可以得出各种氨基酸的浓度,可谓“一箭双雕”。

机器学习让氨基酸分析不再费时费力

图1.机器学习分析氨基酸过程示意图。

要点1

研究者为了克服维度灾难,对光谱数据进行修正以获取机器学习所需数据。他们首先设计了高通量实验,选择组氨酸(His)、精氨酸(Arg)、苯基丙氨酸(L-phe)、丙氨酸(Ala)和苏氨酸(Thr)为研究对象,随机定量的加入到样品池中形成数千种组合,通过对光源进行调制和过滤,将光照射到样品池中的测试样品上,照射之后的残余光进行成像得到光谱图数据集(CSiM),将这些数据集输入到6种卷积神经元网络中(CNNs):LeNet、Vanilla CNN、Residual Network (RestNet)、SqueezeNet、VGGNet以及GoogLeNet Inception v1,这些深度学习方法利用多组分非线性回归分析法得出氨基酸类型和浓度结果。

机器学习让氨基酸分析不再费时费力

2.基于光谱数据的机器学习方法分析混合氨基酸过程:(A)修正光谱数据以获取数据集,其中1为光源,2是光均衡芯片,3为光谱过滤器,4为样品池,5为高清晰度数码相机;(B)通过机器学习定量分析混合氨基酸

要点2

在进行高通量实验时,最初可见光在380-780 nm范围内,在RGB空间被调制和过滤成1013种光谱,当含有各种带宽的调制光通过样品后,光和氨基酸发生复杂的相互作用,包括酸碱反应、调和反应、氧化还原反应等,这些作用难以描述,就像人工神经元网络的黑盒子一样,重要的是最终吸收了特定波长可见光的光谱被记录下来进行分析,对机器学习来说这就足够了

机器学习让氨基酸分析不再费时费力

图3.(A)光谱过滤器中的颜色维度,颜色空间可以被定量化为RGB数值(0-255);(B)CSiM中的光谱信息

要点3

研究者用收集的CSiM数据集进行网络训练时采用误差反向传播算法,用梯度下降法连续调整权重因子和阈值,以找到最优的网络结构。以Deep Inception v1网络为例,将CSiM数据集输入后,网络首先通过两个隐含层对图像进行加工,包括卷积化、最大池化、局部响应归一化等,然后经过9个检测模块、深度连接、平均池化、完全连接等过程,最终输出层输出5个含有5种氨基酸浓度的矢量。

机器学习让氨基酸分析不再费时费力

图4.利用深度学习方法分析混合氨基酸。(A)CNN的学习规则;(B)Deep Inception v1的网络结构

要点4

研究者采用的不同卷积网络都是以有监督的学习模式进行。所有的数据80%为训练数据集,其余为测试数据集,卷积网络预测值与实验值基本保持一条曲线,预测质量通过确定系数R2和均方根误差RMSE来表示。在6种卷积网络中SqueezeNet由于结构最简单,预测误差相对较大;与SqueezeNet相比,Vanilla CNN和 RestNet预测误差有所下降,但是在高氨基酸浓度下的收敛速度较慢;在LeNet和VGG中,这种情况有显著改善。综合来说,Inception v1网络收敛性好,预测精度高:R2为0.999,RMSE为10.22%。

机器学习让氨基酸分析不再费时费力

图5.(A)各种卷积网络预测氨基酸浓度值和氨基酸浓度实验值;(B)V1模型测试稀疏数据组的表现;(C)不同CSiM图像尺寸

小结

研究者成功利用光谱数据,通过高通量实验,采用6种不同的机器学习方法分析了5种氨基酸混合物。机器学习方法无需提前对氨基酸混合物进行分离,具有操作简便、省时省力的特点,为广大科研工作者分析氨基酸混合物提供了一条“高大上”的途径。

参考文献

Q. Duan, J. Lee, S. Zheng, et al. A color-spectral machine learning path for five mixed amino acids analysis . Chemical Communications . 2019

DOI: 10.1039/C9CC07186E

https://pubs.rsc.org/en/content/articlelanding/2019/cc/c9cc07186e#!divAbstract

纳米生物医学最前沿

NanoLabs 微信公众号

你值得拥有

ID:NanoLabs

机器学习让氨基酸分析不再费时费力,氨基酸分析数据处理

主题测试文章,只做测试使用。发布者:氨基酸肥料,转转请注明出处:https://www.028aohe.com/23506.html

(0)
氨基酸肥料氨基酸肥料
上一篇 2022年8月25日 下午9:38
下一篇 2022年8月25日 下午9:44

相关推荐

  • 水稻种植机械(水稻种植机械有哪些)

      水稻种植方式   水稻种植技术   割稻用的刀叫什么   水稻穴播机技术   繁殖水稻的第一步   水稻是我国的主要粮食作物之一在世界各地都有栽种水稻。水稻种植时间   1、早稻一般于3月底4月初播种7月中下旬收获   2、中稻一般4月初至5月底播种9月中下旬收获   3、晚稻一般于6月中下旬播种十月上中旬收获   水稻种植过程、种植方法   1、整地 …

    肥料资讯 2023年3月19日
    00
  • 血蛋白氨基酸肥料哪个牌子好?对比后就知道了!

    今儿我跟大家伙儿聊聊咋用血蛋白做氨基酸肥料的事儿。我这也是一头雾水,不知道从哪儿下手。后来在网上瞎逛,发现不少人都在讨论这个,我就琢磨着,要不我也试试? 一开始就是搜牌子呗,网上那些个氨基酸肥的牌子真是多到让人眼花缭乱。看一下,什么寿禾、国光、优劲啥的,还真不少,还有什么花怡坊、南叶,看的我头都大。我就随便挑个叫爱农购的牌子,心想试试水,看看效果咋样。 买回…

    肥料资讯 2025年2月5日
    00
  • 园艺肥料视频怎么拍摄

    拍摄园艺肥料视频时,可以遵循以下步骤和建议: 选址与场景 选择在肥料生产基地、田间劳作场景等地进行拍摄,以突出企业的专业性和实力。 也可以考虑在城市绿化带、花卉市场等地拍摄,展现肥料产品的广泛应用场景。 人物演员 邀请企业员工或农户代表参与演出,展现真实的工作场景和过程。 考虑邀请知名农业专家或相关领域的名人代言,提升宣传片的权威性和吸引力。 镜头运用与剪辑…

    肥料资讯 2025年3月6日
    00
  • 轻质水溶肥(新型水溶肥料)

    楼顶种菜用什么土又轻又肥 楼顶种菜用什么土又轻又肥 楼顶种菜用什么土又轻又肥,蔬菜是我们生活日常必需要吃的食物,很多人为了能不断吃到自己种出来的有机蔬菜就选择自己在家中的楼顶上种植一些蔬菜,那么楼顶种菜用什么土又轻又肥呢? 楼顶种菜用什么土又轻又肥1 楼顶种菜用什么土又轻又肥 园土和森林土壤一般情况下用来种植蔬菜。这些土壤非常容易取得,肥力适中,对植物生长很…

    肥料资讯 2022年10月30日
    00
  • 五谷丰登含氨基酸水溶肥料(五谷丰登饲料怎么样)

    本文目录一览: 1、日照市五谷丰登生物科技有限公司怎么样? 2、国内水溶肥生产厂家哪个好?国内水溶肥生产厂家哪家好? 3、国产水溶肥好的品牌有那几个? 4、江苏水溶肥厂家有哪些? 5、国内好的水溶肥有哪些? 6、什么是生态农业? 日照市五谷丰登生物科技有限公司怎么样? 日照市五谷丰登生物科技有限公司是2017-06-07在山东省日照市岚山区注册成立的有限责任…

    肥料资讯 2022年8月24日
    00

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
自6.2开始主题新增页头通知功能,购买用户可免费升级到最新版体验