一、蛋白质空间结构预测的一种优化模型及算法(论文文献综述)
赵子申[1](2021)在《基于神经网络的蛋白质二级结构预测研究》文中认为蛋白质的结构与功能的研究是现代生物信息学领域中的热点问题,对蛋白质二级结构的预测是其中的重要任务之一。近年来,深度学习的方法在蛋白质二级结构预测领域得到了广泛的应用,但是存在训练时间长,并行程度低的问题。将集成学习和深度学习技术联合应用于蛋白质二级结构预测,在一定程度上可以降低模型训练的成本,同时还能联合不同模型,从多个角度分析氨基酸信息,从而提高模型的预测准确率。因此,本文基于深度学习方法,联合集成学习技术构建了蛋白质二级结构预测模型。本文的主要工作如下:1.构建了CNN和Bagging技术的混合模型。该模型用CNN代替简单的SVM弱分类器,有效提高了蛋白质二级结构的预测准确率。同时对Bagging模型的结合策略进行了优化,最终将蛋白质二级结构预测准确率从68.1%提高到了71.9%。2.构建了神经网络与Stacking技术的混合模型。在CNN与Bagging混合模型的基础上,结合Stacking技术,进一步提高了模型的预测准确率,达到73.4%。同时还提出可以依据蛋白质长度对数据集进行划分以及将三分类和八分类结果结合在一起来提高模型预测准确率,最终模型预测准确率达到了75.6%。3.构建了蛋白质二级结构的翻译模型。将蛋白质二级结构预测转为翻译问题,利用n-gram算法进行分词,并构建端到端的翻译模型来预测蛋白质二级结构,最终得到了最高70.6%的预测准确率。
石立[2](2021)在《基于神经网络的蛋白质二级结构分类研究与应用》文中提出随着基因组学的发展,蛋白质种类日益增多,蛋白质结构分类重要性日益增长,而历代传统蛋白质结构预测方法具有精度不高的问题。同时,神经网络是近年来的热点研究领域,是人工智能研究的重要组成部分,其应用领域包括:分类、预测、模式识别、信号处理和图像处理等,并继续向其他领域延伸。神经网络的优化与改进从一开始就是理论和应用的重要研究内容之一,特别是前馈神经网络的研究,目前尚没有一个理想的优化方案。面对这一问题,本文针对性地对灰狼优化算法(Grey Wolf Optimizer,GWO)进行改进,并应用到神经网络中。针对传统算法在蛋白质结构分类精度低的问题,本文提出基于灰狼优化算法的图像分类方法,分别由灰狼优化算法优化的卷积神经网络(Convolutional Neural Networks,CNN)和卷积循环神经网络(Convolutional Recurrent Neural Networks,CRNN)对蛋白质二级结构进行分类。本文主要完成了以下工作:(1)从蛋白质数据库PDB和SCOP中获得蛋白质二级结构3D模型,转化为4类十四位点拍摄的2D图像,总计获得576772张50*50像素的图片数据,考虑到所选取的网络模型层数较深和数据集过大导致的训练时间过长,随机选取300单位ID的蛋白质2D图像做成数据集,整个数据集共包含16800张2D图片。(2)基础灰狼优化算法的改进:针对GWO后期收敛速度慢和易陷入局部最优这两个缺陷,提出了调整收敛因子a的收敛方式和改进搜索机制的方法:GWO收敛过程不完全是线性收敛,而原始的GWO中的参数a是线性收敛的,可以通过改进参数a,将参数a由线性收敛变为非线性收敛,从而实现控制全局搜索与局部搜索;通过改进搜索机制,给予GWO加权距离,利用最佳位置的加权总和进行位置更新,使GWO前期更快收敛,从而影响后期收敛速度。(3)利用改进后的灰狼优化算法,针对不同模型如CNN和CRNN分别进行相应的优化。在CNN中,使用IGWO对L2正则化系数和学习率进行调整;在CRNN中,使用IGWO对多种优化器进行优化,并分别进行实验。通过调整IGWO的迭代次数、灰狼数量、搜索边界和空间维数,计算所需优化参数的个体适应度函数,对神经网络模型的各种参数进行优化,并应用于蛋白质二级结构分类。基于以上工作,设计并实现相关算法,在蛋白质二级结构分类任务中,IGWO-CNN达到了92.6%的准确率,IGWO-CRNN达到了89.6%的准确率,并且与多种传统方法进行对比实验,实验证明:本文方法与现有方法相比在,评价指标上有明显提升,根据神经网络在图像领域上的表现,我们将其运用在蛋白质结构类和折叠类的分类识别上可行且有较好效果,证明了本文方法的可行性、有效性和鲁棒性。
梁猛[3](2020)在《基于分子可视化与机器学习的蛋白质功能分析研究》文中认为对于蛋白质功能的认识在医药科学领域和农业领域的发展中有着至关重要的作用。目前,通过大规模测序技术获取了大量未知功能的蛋白质。借助计算机技术理解蛋白质结构、性质和功能是对传统生物实验方法的有效补充。这些技术主要分为直观展现分子性质的可视化技术以及利用计算机注释蛋白质功能的预测技术。当前研究取得了一定成就,但仍面临着重大挑战:平滑分子表面可视化对昂贵计算能力、绘制的实时性和逼真性的要求;多尺度可视化中带来的抽象模型膨胀问题;目前蛋白质功能预测算法的准确度仍旧难以满足实际应用等问题。本文将从提高大规模分子表面可视化性能、优化抽象层次效果、提出准确度更高的蛋白质功能预测模型等方面展开研究。首先,针对生物大规模场景包含大量分子导致绘制效率不能达到实时性能的问题,提出一种与残基相关的层次聚类算法。通过基于残基的层次聚类算法保证在聚类过程中保留所有残基,维持了分子可视化常用的生物特性;以基于体积的距离度量方式替代传统层次聚类的距离度量,与传统方法相比,基于空间体积的方式更适合三维结构的原子,能有效的提高聚类效果;以残基的层次聚类树快速构建蛋白质聚类过程,提高了层次聚类的性能;对于离散化蛋白质各层次抽象后的过渡问题,设计用于判断抽象层次的最大屏幕空间误差,在绘制过程中根据空间误差与阈值的关系进行自适应判断,实现层次抽象的过渡。其次,针对LOD(Levels of Detail)技术生成的层次抽象在简化几何模型时会引起模型膨胀的问题,设计一种基于椭球包围体的LOD大分子渲染技术,以残基相关的层次聚类算法为基础,通过构造一个完整的二叉树改善抽象层次过渡的平滑性;以椭球包围体替代传统的球包围体,降低高抽象层次中几何模型引起的视觉膨胀问题;通过引入适当的后处理技术,进一步弱化了膨胀引起的视觉问题。以球体的光线投射算法为基础,设计一种基于GPU(Graphics Processing Unit)的椭球绘制方法,确保分子模型的绘制性能。最后,对于分子功能的理解除依靠分子表面可视化技术外,还可通过机器学习的统计手段对蛋白质功能进行预测,本文主要从分子表面参数化和关系推理模型两个方面展开研究。通过可视化技术将附加原子物理-化学特性和几何特性的分子表面映射为特征图像;针对传统CNN(Convolutional Neural Networks)模型仿射不变性的能力不足,利用胶囊网络的深度模型验证分子表面与功能的关联。同时,现有蛋白质功能预测方法受限于CNN模型对输入尺寸的要求,需先将氨基酸扭转角和相互距离等特征简化处理,针对此损失氨基酸间关系信息的问题,设计一种基于关系网络的训练架构,直接使用非固定长度的残基序列进行关系推理,提高功能预测的准确度。上述层次化分子渲染以及基于机器学习的蛋白质功能预测算法已经在相关实验中得到验证并集成到可视化分析平台中,起到辅助用户交互式、快速、准确理解蛋白质的结构和功能的作用。
教育部[4](2020)在《教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知》文中研究指明教材[2020]3号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:为深入贯彻党的十九届四中全会精神和全国教育大会精神,落实立德树人根本任务,完善中小学课程体系,我部组织对普通高中课程方案和语文等学科课程标准(2017年版)进行了修订。普通高中课程方案以及思想政治、语文、
逯畅[5](2020)在《基于序列的膜蛋白配体交互研究》文中认为生物信息学是以计算机为辅助工具,通过数学及统计学方法对生物学领域内问题进行建模、分析和仿真的一门交叉学科。随着生物学研究手段取得突破性进展,生物数据不断积累,计算机技术日新月异,生物大数据时代已然来临。生物信息学研究日趋成熟,成为生物学领域不可或缺的重要组成部分,为传统生物研究方法提供强有力的补充和支持。生物信息学在微观领域主要包括基因组学和蛋白质组学,本文研究内容属于蛋白质组学范畴,是用机器学习方法对膜蛋白及跨膜蛋白的结构和功能进行预测分析。膜蛋白是具有特殊结构和功能的一类蛋白质,这类蛋白质与生物膜关系密切,或永久地附着在生物膜上,或短暂地与生物膜发生交互。膜蛋白参与诸多重要的细胞生命活动,例如物质传递、信号传导、免疫应答、能量代谢等。跨膜蛋白是最典型且含量最多的膜蛋白种类,它们贯穿生物膜并永久稳定地嵌于生物膜上,其异常会直接导致疾病的产生。与此同时,跨膜蛋白是医药学领域的重点研究目标,目前市场上超过半数药物的靶蛋白为跨膜蛋白。鉴于膜蛋白及跨膜蛋白的重要生物学意义,科研工作者们一直孜孜不倦地对它们进行研究,并取得了丰硕的成果。利用生物信息学手段对膜蛋白及跨膜蛋白进行研究可以辅助蛋白质相互作用网络建立、代谢通路绘制、药物筛选等工作,针对膜蛋白及跨膜蛋白结构与功能的研究已然成为生物信息学领域的重要研究方向。本文围绕膜蛋白及跨膜蛋白开展一系列研究工作,主要目标是通过机器学习方法,从蛋白质一级序列中提取特征,预测并分析膜蛋白-配体的相互作用。首先,为了弥补一级序列信息不足的缺点,构造两个基于深度学习的跨膜蛋白结构描述符预测器,分别是残基表面可及性预测器(TMP-SSurface)和残基Z坐标预测器(TM-ZC)。残基表面可及性以及Z坐标是与功能密切相关的结构信息,可以为后续针对膜蛋白功能的研究提供帮助。接下来,将预测的残基表面可及性和Z坐标作为特征,构造基于随机森林的膜蛋白-配体结合位点预测器(MPLs-Pred),并根据不同配体类型训练配体特异性预测模型,从而进一步提高预测性能。在对膜蛋白-配体进行研究的过程中,笔者注意到一种典型的以膜蛋白作为靶蛋白的配体:泛醌,并构造了基于XGBoost的泛醌结合蛋白预测器(UBPs-Pred),并对泛醌结合蛋白进行生物信息学分析。根据上述研究思路,本文的研究工作如下:1)本文提出了基于深度学习的跨膜蛋白残基表面可及性预测器TMP-SSurface,残基的表面可及性用于描述残基暴露于外部环境的情况,用相对溶剂可及表面积进行衡量。TMP-SSurface适用于所有类型跨膜蛋白的全序列残基,对跨膜蛋白类型,残基拓扑结构均没有限制,即没有先验知识的约束。TMP-SSurface使用进化保守性、二进制编码以及序列终端标识符作为输入特征,分类模型是Inception与CapsuleNet相融合的复合型深度学习网络。实验证明TMP-SSurface是一个稳定、高效的模型,且具有良好的泛化能力。对不同类型的跨膜蛋白均可取得良好的预测效果。同时,预测器对特征依赖少,深度学习网络可以挖掘跨膜蛋白序列与结构之间的内在联系。2)本文提出了基于深度学习的跨膜蛋白残基Z坐标预测器TM-ZC,跨膜蛋白的残基Z坐标描述残基到生物膜中心平面的垂直距离,是定量衡量残基与生物膜之间相对位置关系的结构描述符。与TMP-SSurface相似,TM-ZC同样适用于所有类型跨膜蛋白的全序列残基,使用者不需要先验知识。TM-ZC使用的特征与TMP-SSurface相同,即进化保守性、二进制编码以及序列终端标识符。分类模型是包含七个卷积层的卷积神经网络。实验证明TM-ZC模型稳定,具有良好的泛化能力,且对各种类的跨膜蛋白预测性能良好。3)在前面工作的基础上,本文提出了基于随机森林的膜蛋白-配体结合位点预测器MPLs-Pred。蛋白质很多基本功能是依赖于与配体发生交互而完成的,配体结合位点预测是蛋白质功能注释的重要工作之一。MPLs-Pred使用四种特征对膜蛋白残基进行特征编码,分别为进化保守性、物理化学属性、表面可及性以及Z坐标,其中表面可及性和Z坐标分别由TMP-SSurface和TM-ZC预测得到。MPLs-Pred的分类器为随机森林,并使用多倍随机欠采样策略解决严重的样本不平衡问题。此外,考虑到不同配体存在巨大差异,将配体分为三种类型,分别为类药化合物、金属以及生物大分子,并分别训练得到配体特异性预测模型,进一步提高预测器性能。除此之外,本研究还对人类的类药化合物靶标膜蛋白进行了基因本体富集分析和KEGG通路富集分析。4)在对膜蛋白-配体交互数据进行整理分析的过程中,泛醌引起了笔者的关注,其靶蛋白中有86.9%为膜蛋白,其中68.5%为跨膜蛋白,是一种典型的以膜蛋白作为靶标的配体。本文提出了泛醌结合蛋白识别模型UBPs-Pred,并对泛醌结合蛋白进行生物信息学分析。UBPs-Pred使用氨基酸组成、二肽组成以及进化保守性三种特征对蛋白质进行特征编码,使用随机森林对特征重要性进行排序,并通过增量特征选择策略进行特征选择。UBPs-Pred使用XGBoost作为分类器,考虑到XGBoost涉及参数较多且性能对参数敏感,本实验使用多目标粒子群算法对XGBoost的参数进行优化。实验证明UBPs-Pred性能很好。为了对泛醌结合蛋白进行进一步了解,本实验对泛醌结合蛋白进行了生物信息学分析,包括:对泛醌结合域中的模体进行统计;对泛醌结合蛋白的超级家族进行分类统计;对人类的泛醌结合蛋白进行基因本体富集分析以及KEGG通路富集分析。
肖璐倩[6](2020)在《蛋白质高维构象空间多模态优化算法设计与实现》文中研究表明蛋白质的生物学功能取决于蛋白质的三维空间结构,获取蛋白质三维空间结构对于人类认识自身和疾病有着非常重要的意义。然而实验方法测定蛋白质结构不仅代价大,而且周期长。因此从蛋白质序列出发,直接预测蛋白质三维结构已成为目前生物信息学领域中的热点研究问题之一。近年来,蛋白质结构从头预测方法取得了较大的发展和突破,但是蛋白质构象空间的高维复杂性以及能量模型不精确仍然是蛋白质结构预测研究的难点。利用先验知识辅助蛋白质高维构象空间优化,对于提升蛋白质结构预测精度而言具有重要的作用;另外,多模态优化方法可以缓解能量模型不精确的缺陷,提高采样的可靠性。因此,本文在进化算法的框架下,进行了以下研究:(1)针对蛋白质结构从头预测问题,设计一种基于二面角知识辅助的蛋白质结构从头预测算法。首先利用种群中个体的结构信息执行基于二级结构的交叉操作,接着使用片段组装技术和能量函数进行变异,探测潜在的高质量构象;然后利用蛋白质结构片段库特定的二面角分布信息和拉氏图先验知识构建二面角打分模型,引导构象空间采样,获得结构更加合理的构象。实验分析验证了该算法是一种有效的蛋白质结构从头预测算法。(2)针对高维构象空间采样可靠性问题,在前面算法研究的基础上,进一步设计了一种基于二面角相似度模型的多模态构象优化算法。首先执行模态探测,采用基于Rosetta粗粒度能量模型作为筛选高质量新个体的标准,并结合蛋白质结构片段库特定的二面角分布信息和拉氏图先验知识构建角度打分模型,进行种群更新;然后建立二面角相似度模型,用来评价不同构象间的相似程度,满足多模态优化算法中相似个体快速判定的要求,进一步基于排挤机制进行种群更新,实现模态增强,获得结构更为合理的构象。实验分析表明算法不仅可以获得较高的预测精度,同时还能得到尽可能多的高质量局部极值解,从而获得一些较好的蛋白质亚稳态结构。
付丹丹[7](2020)在《贮期鸡蛋蛋白质含量品质的光谱无损检测方法及装置研发》文中进行了进一步梳理有关贮藏期间鸡蛋品质的评价与预测及其与贮藏时间和条件的关系一直是食品加工和保鲜领域的研究热点问题之一,目前无损检测方法很少从鸡蛋特定蛋白质含量变化角度来考虑其食用品质和安全性。若能从鸡蛋组成的生化变化角度解释其品质变化规律,寻找引起鸡蛋品质变化的最本质特征,并且建立该特征因子的外在表征方法,对深入揭示蛋品品质变化机制,实现蛋品品质的有效无损监控具有重要的理论意义。本课题从鸡蛋组成生化变化的角度,以蛋清S-卵白蛋白含量、卵黏蛋白含量、哈夫值、蛋黄指数等多个品质指标为研究对象,利用生化方法、高光谱成像技术及可见-近红外光谱技术对鸡蛋的多个品质进行研究,建立基于光谱的贮期鸡蛋微观品质无损检测模型及相关检测装置,主要研究内容和结论如下:1)贮期鸡蛋品质和蛋清主要蛋白质含量的变化规律及相关关系为了从鸡蛋组成生化变化的角度确定引起鸡蛋品质变化的最本质特征因子,通过传统生化检测方法,统计分析了贮藏期间鸡蛋品质指标及S-卵白蛋白含量、卵黏蛋白含量的变化规律。考察了鸡蛋哈夫值、蛋黄指数、p H值等指标值与S-卵白蛋白含量、卵黏蛋白含量的相关性,发现各品质参数与S-卵白蛋白含量的相关性比与卵黏蛋白的相关性更高;分析了各鸡蛋品质参数与S-卵白蛋白含量、卵黏蛋白含量的灰色关联度,各品质因素与S-卵白蛋白含量、卵黏蛋白的综合灰色关联度均大于0.5;分别以S-卵白蛋白含量和卵黏蛋白含量为自变量建立了等价蛋龄预测模型,模型的决定系数均大于0.9,p≤0.01;综合考虑相关性分析结果,选择S-卵白蛋白含量为研究对象,进一步研究了两种不同品种鸡蛋(市场上常见的海蓝褐壳鸡蛋和罗曼粉壳鸡蛋)S-卵白蛋白含量与鸡蛋哈夫值、蛋黄指数的相关性,发现不同品种鸡蛋的哈夫值、蛋黄指数均与S-卵白蛋白含量显着负相关,粉壳蛋和褐壳蛋S-卵白蛋白含量相关系数为0.950,二者显着相关(p≤0.01)。即在同一贮藏条件下,不同品种鸡蛋S-卵白蛋白含量的变化受鸡蛋品种的影响较小。故确定选择S-卵白蛋白含量为引起鸡蛋品质变化的最本质特征因子。2)基于高光谱成像技术的鸡蛋新鲜度、酸碱度及黏度检测为了建立基于高光谱技术的与鸡蛋新鲜度有关的内部理化指标的无损检测方法,利用高光谱成像检测系统采集了贮期鸡蛋的透射光谱信息,并利用p H计、粘度计测定鸡蛋酸碱度与粘度,发现鸡蛋新鲜度、酸碱度、黏度之间存在较强相关性。对光谱进行预处理发现经过一阶微分处理后的全波段PLS模型对各指标的预测效果最好;分别用竞争性自适应重加权算法(CARS)与连续投影算法(SPA)选取特征波长。对比分析基于CARS及SPA筛选的特征波段建立的偏最小二乘回归模型和多元线性回归模型,建立的多元线性回归模型对鸡蛋哈夫值、p H值及黏度值具有更好的预测性能。在CARS提取的特征波长组合基础上采用SPA再次进行特征波长提取,基于CARS-SPA二次波段提取鸡蛋HU、p H、黏度的最佳波段组合数分别为13个、10个、6个;基于二次筛选出的特征波长建立的鸡蛋HU、p H、黏度MLR模型预测集决定系数Rp2分别为0.884、0.903、0.903,相对分析误差RPD均大于2,能够对这三个指标值进行极好预测。3)基于高光谱成像技术的S-卵白蛋白含量无损检测及其可视化为了从S-卵白蛋白含量的生化本质角度建立无损评价贮期鸡蛋品质变化的方法,利用高光谱成像技术采集了贮期鸡蛋在300 nm-1100 nm的透射高光谱图像,提取7个图像参数,并利用相关系数法筛选出3个图像特征变量(红色分量均值Ravg,分形维度D和图像短轴n),建立PLS模型,比较发现剔除其他四个图像参数后建模效果不变;将整蛋作为感兴趣区域,提取每个鸡蛋的平均光谱,选取450 nm-1000 nm波段,经一阶微分结合平滑预处理后,分别采用竞争性自适应重加权算法(CARS)、连续投影算法(SPA)及二维相关同步光谱分析法提取了S-卵白蛋白含量紧密相关的特征波长,并分别利用筛选出来的特征波长建立了偏最小二乘回归模型(PLS)和遗传算法优化的BP神经网络模型(GA-BP),结果表明,基于SPA筛选的20个特征波长组合建立的GA-BP模型对S-卵白蛋白含量预测效果最好,训练集决定系数Rc2为0.857,RMSEC为0.084,预测集Rp2为0.806,RMSEP为0.120,RPD为2.012。将提取的3个图像特征参数分别与三种方法提取的特征波长组合进行融合,并利用主成分分析(PCA)降维,利用融合后的特征建立预测模型,发现基于3个图像特征和CARS筛选的14个光谱特征融合降维后的5个特征信息建立的GA-BP模型预测效果更好,训练集Rc2为0.856,均方根误差RMSEC为0.084,预测集Rp2为0.845,均方根误差RMSEP为0.143,RPD为1.918。利用优选出的模型对预测集鸡蛋图像上每个像素点的S-卵白蛋白含量进行预测,结合伪彩色图像处理技术,将预测结果用不同颜色直观显示,实现了鸡蛋S-卵白蛋白含量可视化。4)基于可见-近红外光谱技术的鸡蛋新鲜度指标及S-卵白蛋白含量无损检测利用自行搭建的可见近红外光谱系统分别采集了贮期海蓝褐壳鸡蛋和罗曼粉壳鸡蛋的透射光谱信息,并测定了鸡蛋哈夫值、蛋黄指数以及S-卵白蛋白含量。选取500 nm-950 nm范围内的451个波长进行分析,经光谱预处理后,分别采用无信息变量消除算法(UVE)、遗传算法(GA)和逐步回归算法(STP)筛选特征波长,分别建立偏最小二乘回归(PLS)、高斯过程回归(GPR)、多元线性回归(MLR)和支持向量机回归(SVM)预测模型,结果表明,对于海蓝褐壳鸡蛋而言,其哈夫值的最佳预测模型是基于UVE筛选出来的10个特征波长建立的GPR模型,训练集Rc2为0.981,RMSEC为0.031,预测集Rp2为0.708,RMSEP为10.825,RPD为1.603;其蛋黄指数的最佳预测模型是基于GA筛选出来的18个特征波长建立的PLS回归模型,训练集Rc2均为0.792,RMSEC为0.021,预测集Rp2为0.770,RMSEP为0.030,RPD为1.765;其S-卵白蛋白含量的最佳预测模型是基于遗传算法GA筛选出来的19个波长建立的PLS回归模型,训练集Rc2为0.919,RMSEC为0.058,预测集Rp2为0.917,RMSEP为0.079,RPD为3.236。对于罗曼粉壳鸡蛋而言,其哈夫值的最优预测模型是基于逐步回归筛选出来的15个特征波长建立的多元线性回归模型,训练集Rc2为0.926,RMSEC为5.380,预测集Rp2为0.765,RMSEP为10.416,RPD为2.322;其蛋黄指数建立的模型都不能对罗曼粉壳鸡蛋的蛋黄指数进行预测(预测集RPD均小于1.5);其S-卵白蛋白含量建立的最优预测模型是基于逐步回归算法筛选出来的9个特征波长建立的高斯过程回归模型,训练集Rc2为0.954,RMSEC为0.047,预测集Rp2为0.846,RMSEP为0.109,RPD为2.223。建立的单一品种鸡蛋哈夫值、蛋黄指数及S-卵白蛋白含量预测模型为后续开发多品种鸡蛋新鲜度指标及S-卵白蛋白含量定量快速检测通用模型奠定了基础。5)不同品种鸡蛋新鲜度指标及S-卵白蛋白含量预测模型优化利用建立的单一品种鸡蛋哈夫值、蛋黄指数及S-卵白蛋白含量预测模型对另一个品种相应的鸡蛋品质指标进行预测,发现利用单一品种建立的模型对另一品种相同指标的预测性能较差;比较分析两个品种鸡蛋的平均光谱及其光谱矩阵的主成分得分空间分布,发现两个品种鸡蛋的平均光谱在近红外区域差异不明显,在可见光区域有明显差异;两个品种鸡蛋的光谱矩阵主成分得分空间分布图显示罗曼粉壳鸡蛋样本的主成分得分空间分布不能完全覆盖海蓝褐壳鸡蛋样本的主成分得分空间,即单一品种鸡蛋建立的预测模型适用性差。分别利用全局更新、直接校正和斜率/截距校正三种算法对海蓝褐壳鸡蛋和罗曼粉壳鸡蛋哈夫值、蛋黄指数、S-卵白蛋白含量可见-近红外光谱检测模型进行优化,比较不同方法模型优化结果,发现3种模型优化方法均能对优化前最佳模型的预测性能进行不同程度地改善。其中经过全局更新优化后的通用模型对预测性能的改善效果最好。利用全局更新方法建立的两个品种鸡蛋哈夫值通用预测模型对海蓝褐壳鸡蛋的预测性能为Rp2为0.770,RMSEP为9.063,RPD为2.017,对罗曼粉壳鸡蛋的预测性能为Rp2为0.834,RMSEP为8.753,RPD为2.231;蛋黄指数通用预测模型对海蓝褐壳鸡蛋的预测性能为Rp2为0.780,RMSEP为0.029,RPD为1.837,对罗曼粉壳鸡蛋的预测性能为Rp2为0.684,RMSEP为0.038,RPD为1.555;S-卵白蛋白含量通用预测模型对海蓝褐壳鸡蛋的预测性能为Rp2为0.936,RMSEP为0.069,RPD为3.649,对罗曼粉壳鸡蛋的预测性能为Rp2为0.839,RMSEP为0.112,RPD为2.035。优化后的模型更稳定、可靠、准确,且能够同时适用于两个品种鸡蛋的新鲜度和S-卵白蛋白含量预测,为后续开发蛋新鲜度指标及S-卵白蛋白含量无损检测装置奠定了基础。6)蛋新鲜度指标及S-卵白蛋白含量无损检测装置研究利用USB2000+光谱仪,对蛋新鲜度指标及S-卵白蛋白含量快速检测装置进行总体设计,选取合适的关键部件,包括可调光源、散热装置、光谱采集单元等等,并将其进行了组装与调试。根据建立的同时适用于两个品种鸡蛋新鲜度指标及S-卵白蛋白含量无损检测模型,利用Qt软件开发平台开发了蛋新鲜度指标及S-卵白蛋白含量快速检测软件。利用搭建的硬件装置与开发的检测软件,实现了蛋新鲜度指标及S-卵白蛋白含量无损检测。
余宝昆[8](2020)在《基于接触图和过程重采样的蛋白质结构预测方法研究》文中指出蛋白质是生命体中分布最广、功能最复杂的生物大分子,在生命活动中发挥着极其重要的作用,蛋白质的三维结构决定了其功能和活性。许多疾病的发生都跟蛋白质折叠错误相关,研究这些蛋白质的结构有助于找到这些疾病的起因,掌握治愈这些疾病的方法。随着基因测序技术的发展,越来越多的蛋白质序列被解析出来。但是传统的实验方法来测定蛋白质结构费时费力,面对急剧增长的序列,实验测定蛋白质结构显然无法满足要求。在计算生物学和生物信息学领域,根据Anfinsen准则,蛋白质折叠的所有信息都包含在其一维序列中,因而从一维的氨基酸序列出发,预测蛋白质三维结构成为当下研究的热点。在蛋白质结构从头预测中,构象空间搜索算法是提高蛋白质结构预测精度的重要手段之一,本文研究构象空间的搜索算法,主要工作如下:(1)针对蛋白质结构从头预测方法,本文在进化算法框架下,提出了基于接触图的构象空间搜索算法。为了评估构象结构的质量,首先设计了残基接触打分模型;在变异阶段,使用片段库对种群的个体进行片段组装,加强对低能量构象的搜索;在选择阶段,使用残基接触得分指导个体选择,保留种群中质量较优的构象进入下一代。测试蛋白的实验结果表明,所提方法能够有效地减少对能量陷阱区域的搜索,加强对近天然态构象区域的采样,提高蛋白质结构预测精度。(2)为了提取采样过程信息辅助构象搜索,提高采样效率及蛋白质结构预测精度,本文进一步提出了一种接触图辅助的过程重采样蛋白质构象空间搜索算法。在进化算法框架下,根据残基接触打分模型选择质量较优的构象构建过程片段库;进而,在变异阶段,从原片段库和过程片段库中选取片段对构象进行片段组装;其次,设计接触图辅助的过程重采样策略,加强对低能量及低残基接触分数的构象搜索。在基本测试蛋白及CASP12、CASP13部分蛋白上的实验结果验证了算法的有效性。
杨宁[9](2020)在《基于蚱蜢群模糊聚类的蛋白质特征提取与功能预测研究》文中指出蛋白质相互作用的系统性研究随着生物信息学的快速发展迅速成为了后基因组革命时代的关键领域,近年来受到了各国学者广泛关注和重视。传统实验方法由于存在从蛋白质序列中提取有用信息的速度慢、成本高等原因,无法满足日益增长的蛋白质功能注释需求。而计算方法因其成本低、易实现等优势已经成为预测蛋白质功能的主流方法。但一些常见的计算方法存在易受噪声数据影响、准确率不高等问题。本文针对上述问题展开研究,研究内容如下:(1)提出一种基于蚱蜢群模糊聚类的蛋白质功能模块特征提取方法IFCM-GOA。直觉模糊c均值聚类IFCM算法能够很好的诠释蛋白质属于多个功能模块的特性,同时利用蚱蜢算法GOA有效解决IFCM算法对聚类中心敏感的缺陷,提高聚类结果的准确率。将该算法与FCM和IFCM算法分别在三个酵母蛋白数据集上进行性能比较和实例分析,结果表明IFCM-GOA算法相对于另两种算法表现更好,在提取蛋白质功能模块特征上更具有可行性。(2)提出一种基于深度神经网络的蛋白质功能预测方法IGP-DNN。该算法将蛋白质功能模块特征信息,与利用核主成分分析法降维后的蛋白质属性信息相结合作为蛋白质功能特征,在三个数据集上进行实验对比基础上,筛选出合适的超参数构建深度神经网络IGP-DNN,用于预测未知蛋白质功能。结果表明IGP-DNN算法能够有效预测未知蛋白质功能。将IGP-DNN算法与IGP-SVM算法、HPMM算法和FFPred算法进行对比,在DIP数据集上IGP-DNN算法的精度、查全率、F-measure分别能达到0.4903、0.4051、0.4436,优于IGP-SVM算法、HPMM算法和FFPred算法,同时在Krogan和Gavin数据集上该算法也体现了显着优势。(3)设计并实现了一个蛋白质网络聚类方法综合分析平台。该平台实现了多种不同的蛋白质聚类方法用于提取功能模块,通过不同的评估方法评价聚类算法的效果,并可提供数据分析结果的丰富可视化效果展示。
徐琢频[10](2020)在《作物单籽粒近红外快速无损检测的模型转移方法研究》文中研究表明近红外光谱(Near Infrared Spectroscopy,NIRS)是一种快速无损分析技术。利用近红外通量化分选作物籽粒,有望提高农产品品质、提高作物育种效率、并推进植物表型组发展。建立一个好的单粒作物近红外校正模型需要投入较多的时间、人力和物力。然而,各种来自仪器、测量环境、以及样品方面的变化都可能影响预测结果,使得模型不再适用。所以,提高模型在不同条件下的准确性和适用性是近红外应用中亟待解决的问题。利用模型转移可以校正上述差异,使模型标准化。本论文旨在发展新的模型转移方法提高单粒作物近红外分析时模型的通用性、准确性,促进近红外在粮食生产和作物育种上的推广。主要研究结果包括:一、基于斜率截距法(Slope Bias Correction,SBC)的多种光谱平台间模型转移的评价分析。基于一种经典的、广泛使用的SBC算法,以两组形态和成分分布理想的样品(尿素颗粒、淀粉颗粒)和两组未经加工的自然状态样品(两组单粒水稻)为对象,研究它们的NIR模型在三种具有不同特点的光谱平台间的转移。结果表明,采用SBC能够准确校正理想状态样品模型在NIR平台间的转移,其转移结果(RMSEP(Root Mean Square Error of Prediction,预测均方根误差)为2.86至15.4)接近甚至优于原平台建模结果(RMSECV(Root Mean Square Errorof Cross Validation,交叉验证均方根误差)为1.49至10.8);但对单粒水稻模型在NIR平台间转移的校正效果较差。因此,需要开发新的算法校正单粒作物光谱分析时的差异,改善模型转移效果。二、提出一种优化定量模型转移的基于相关分析的波长选择方法(Correlation Analysis based Wavelength Selection,CAWS)。该方法基于相关分析评价和筛选两组仪器间响应一致且稳定的波段来改善模型的转移效果。以一组公开的玉米数据集和一组真实检测的米糠数据集为对象,在不同预处理和模型转移算法条件下,通过和其他波长选择方法的比较,介绍了该方法的使用并验证其优越性。结果表明,采用CAWS处理后的两批数据集的最优模型均比其他波长选择方法在相同条件下的RMSEP更低。其中,经过CAWS优化后的玉米模型在转移时的RMSEP为0.070,较前人报道的相同数据集的分析结果(RMSEP)更好,后者为0.1519和0.098。因此,该方法可有效提高定量模型在转移时的准确性,有望推广应用于单粒作物定量模型的转移上。三、提出一种改善定性模型转移的基于CAWS优化的的波长选择方法。此方法在CAWS算法基础上,引入马修斯相关系数(Matthews Correlation Coefficient,MCC)作为波长选择的评价标准,以达到改善定性模型转移效果的目的。通过对公开的药片数据集、真实检测的小麦籽粒和玉米籽粒数据集的光谱分析,以及不同处理下转移结果的比较,验证了该方法的优越性。CAWS优化后的药片、小麦、玉米数据集转移后的MCC值是所有处理中最高、次高和最高的,分别为0.987,0.717和1。结果表明,该方法能够有效提高单粒作物定性模型转移时的判别正确率。四、基于光谱空间转换(Spectral Space Transformation,SST)的自然状态样品和理想状态样品间的模型转移。该方法通过将具有自然状态的单粒水稻样品的光谱用SST算法转化为去除了颖壳干扰的自然状态(单粒糙米)、以及形状成分均匀一致的理想状态(米粉)的光谱,并使用相应状态样品模型(单粒糙米模型以及米粉模型)进行预测的方式,提高单粒水稻NIR分析结果的准确性。结果表明,将单粒水稻光谱转移成糙米和米粉光谱后的预测结果分别接近(RMSEP=0.480)和优于(RMSEP=0.401)直接分析单粒水稻光谱的结果(RMSEP=0.423)。因此,该方法能够一定程度校正单粒水稻理化状态差异对光谱分析的干扰,提高模型的通用性和准确性。该方法有望应用于其他单粒作物的近红外分析上。
二、蛋白质空间结构预测的一种优化模型及算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、蛋白质空间结构预测的一种优化模型及算法(论文提纲范文)
(1)基于神经网络的蛋白质二级结构预测研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究意义 |
1.2 研究现状 |
1.2.1 机器学习研究现状 |
1.2.2 蛋白质二级结构预测研究现状 |
1.3 目前研究存在的问题与不足 |
1.4 本文主要研究内容 |
1.5 论文结构安排 |
1.6 小结 |
第二章 相关技术介绍 |
2.1 蛋白质结构基础 |
2.1.1 蛋白质一级结构 |
2.1.2 蛋白质二级结构 |
2.1.3 蛋白质二级结构评估标准 |
2.2 卷积神经网络 |
2.2.1 卷积层 |
2.2.2 非线性层 |
2.2.3 池化层 |
2.2.4 全连接层 |
2.3 循环神经网络 |
2.3.1 RNN的原理及结构 |
2.3.2 LSTM网络 |
2.4 翻译模型 |
2.4.1 翻译模型简介 |
2.4.2 注意力机制 |
2.5 transformer模型 |
2.5.1 自注意力 |
2.5.2 编码器 |
2.5.3 解码器 |
2.5.4 位置编码 |
2.6 集成学习 |
2.6.1 Bagging模型 |
2.6.2 Stacking模型 |
2.7 小结 |
第三章 基于CNN和 Bagging的蛋白质二级结构预测模型 |
3.1 输入向量构建 |
3.1.1 数据来源 |
3.1.2 数据预处理 |
3.1.3 滑动窗口的选择 |
3.1.4 特征向量 |
3.2 构建Bagging模型 |
3.2.1 模型的构建步骤 |
3.2.2 结合策略的选择 |
3.3 CNN模型 |
3.3.1 CNN的搭建与优化 |
3.3.2 SGD相关算法 |
3.4 实验结果分析 |
3.4.1 卷积核大小与层数对模型预测准确率的影响 |
3.4.2 卷积核数量对模型准确率的影响 |
3.5 Bagging模型及其优化 |
3.5.1 不同加权方式的比较 |
3.5.2 弱分类器数量和类型对结果的影响 |
3.6 小结 |
第四章 基于CNN和 LSTM的蛋白质二级结构预测模型 |
4.1 LSTM网络的构建 |
4.1.1 双向LSTM网络 |
4.1.2 Adam算法 |
4.2 CNN集成模型与LSTM模型的融合 |
4.3 基于长度信息的分类模型 |
4.4 三分类与八分类的结合 |
4.5 实验结果与分析 |
4.5.1 LSTM网络深度对模型预测准确率的影响 |
4.5.2 加权投票Stacking模型的影响因素 |
4.5.3 基于长度信息的分类 |
4.5.4 蛋白质二级结构三分类和八分类信息的结合 |
4.6 小结 |
第五章 基于翻译的蛋白质二级结构预测模型 |
5.1 将蛋白质信息转化为一种语言 |
5.1.1 n-gram模型 |
5.1.2 基于n-gram的分词模型 |
5.1.3 计算分词路径 |
5.2 蛋白质翻译模型 |
5.3 实验数据及分析 |
5.4 与现有模型的对比 |
5.5 小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 未来工作的展望 |
参考文献 |
致谢 |
(2)基于神经网络的蛋白质二级结构分类研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容及创新点 |
1.4 论文组织结构 |
第二章 相关理论与关键技术 |
2.1 卷积神经网络 |
2.2 循环神经网络 |
2.3 蛋白质二级结构分类数据集 |
2.4 本章小结 |
第三章 灰狼优化算法的改进与应用 |
3.1 灰狼优化算法思想 |
3.2 灰狼优化算法的改进 |
3.3 灰狼优化算法应用 |
3.4 本章小结 |
第四章 基于IGWO改进优化器的蛋白质二级结构图像分类 |
4.1 算法思想 |
4.2 实验与分析 |
4.3 本章小结 |
第五章 基于IGWO-CNN的蛋白质二级结构图像分类 |
5.1 算法思想 |
5.2 实验与分析 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
致谢 |
个人简介 |
(3)基于分子可视化与机器学习的蛋白质功能分析研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 分子可视化的研究现状 |
1.2.1 分子可视化模型研究 |
1.2.2 交互式分子可视化研究 |
1.2.3 可视渲染技术研究 |
1.2.4 交互式分子可视分析 |
1.3 蛋白质功能预测的研究现状 |
1.4 本文的主要研究内容 |
1.5 本文的组织结构 |
第2章 可视化与机器学习相关算法 |
2.1 基于GPU的球体光线投射算法 |
2.2 增强感知的渲染技术 |
2.2.1 轮廓线渲染 |
2.2.2 卡通着色渲染 |
2.3 超参数调优之贝叶斯优化 |
2.4 本章小结 |
第3章 基于残基的分子场景可视化实时绘制 |
3.1 引言 |
3.2 视点相关的分子场景渲染管线 |
3.3 层次聚类 |
3.3.1 传统层次聚类 |
3.3.2 基于残基的层次聚类 |
3.4 基于体积的距离度量 |
3.4.1 对象空间误差的计算 |
3.4.2 聚类簇范德华体积的计算 |
3.5 基于离散层次的分子场景可视化LOD绘制 |
3.5.1 离散化层次抽象的构建 |
3.5.2 自适应LOD选择 |
3.6 实验结果及性能对比 |
3.6.1 层次聚类算法的性能对比 |
3.6.2 距离度量的效果对比 |
3.6.3 基于离散层次LOD的性能分析 |
3.7 本章小结 |
第4章 基于椭球包围体的交互式分子可视化 |
4.1 引言 |
4.2 基于椭球包围体的分子渲染管线 |
4.3 层次聚类树椭球包围体构建 |
4.3.1 椭球包围体的近似计算 |
4.3.2 椭球包围体的快速构建 |
4.4 基于GPU的椭球光线投射算法 |
4.4.1 数据处理 |
4.4.2 椭球光线投射算法 |
4.5 分子抽象层次选择 |
4.6 实验结果及性能分析 |
4.6.1 椭球包围体绘制性能提升 |
4.6.2 多规模分子绘制性能对比与分析 |
4.6.3 椭球包围体绘制效果对比与分析 |
4.7 本章小结 |
第5章 基于机器学习的蛋白质功能预测 |
5.1 引言 |
5.2 蛋白质结构特征信息提取 |
5.3 基于参数化分子表面的酶功能预测 |
5.3.1 参数化分子表面计算 |
5.3.2 基于胶囊网络的深度学习模型 |
5.3.3 实验结果及性能对比 |
5.4 基于RN模型的酶功能预测 |
5.4.1 关系推理模型技术原理 |
5.4.2 氨基酸对象的特征提取 |
5.4.3 基于关系网络的训练模型 |
5.4.4 实验结果及性能对比 |
5.5 本章小结 |
第6章 多视图分子可视分析框架 |
6.1 引言 |
6.2 多尺度分析框架设计 |
6.3 时空尺度下的多视图实现 |
6.4 探索式可视化交互 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间承担的科研任务与主要成果 |
致谢 |
(5)基于序列的膜蛋白配体交互研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 生物信息学及蛋白质组学 |
1.1.1 生物信息学 |
1.1.2 蛋白质组学 |
1.2 膜蛋白及跨膜蛋白 |
1.3 研究相关数据资源 |
1.4 研究相关工具资源 |
1.5 本文工作 |
1.5.1 本文研究内容 |
1.5.2 本文组织结构 |
第二章 跨膜蛋白残基表面可及性预测 |
2.1 引言 |
2.2 研究背景与思路 |
2.3 实验方法 |
2.3.1 数据集 |
2.3.2 计算rASA |
2.3.3 特征编码 |
2.3.4 TMP-SSurface回归模型 |
2.3.5 从概率到rASA |
2.3.6 实验环境 |
2.3.7 评价指标 |
2.4 实验结果及讨论 |
2.4.1 模型稳定性测试 |
2.4.2 模型训练过程 |
2.4.3 参数选择 |
2.4.4 子网络消融实验 |
2.4.5 不同类型跨膜蛋白测试 |
2.4.6 预测器性能对比 |
2.4.7 短序列跨膜蛋白测试 |
2.4.8 预测器效率对比 |
2.4.9 案例分析 |
2.5 本章小结 |
第三章 跨膜蛋白残基Z坐标预测 |
3.1 引言 |
3.2 研究背景与思路 |
3.3 实验方法 |
3.3.1 数据集 |
3.3.2 计算残基Z坐标 |
3.3.3 特征编码 |
3.3.4 TM-ZC回归模型 |
3.3.5 实验环境 |
3.3.6 评价指标 |
3.4 实验结果及讨论 |
3.4.1 特征分析 |
3.4.2 滑窗尺寸调整 |
3.4.3 Z坐标阈值调整 |
3.4.4 模型稳定性测试 |
3.4.5 不同类型跨膜蛋白测试 |
3.4.6 预测器性能对比 |
3.4.7 拓扑结构相关性 |
3.4.8 案例分析 |
3.5 本章小结 |
第四章 膜蛋白-配体结合位点预测 |
4.1 引言 |
4.2 研究背景与思路 |
4.3 实验方法 |
4.3.1 数据集 |
4.3.2 特征编码 |
4.3.3 MPLs-Pred分类模型 |
4.3.4 实验环境 |
4.3.5 评价指标 |
4.4 实验结果及讨论 |
4.4.1 配体结合位点分析 |
4.4.2 特征分析 |
4.4.3 多倍随机欠采样测试 |
4.4.4 分类算法对比 |
4.4.5 配体特异性模型性能 |
4.4.6 独立测试结果 |
4.4.7 预测器性能对比 |
4.4.8 案例分析 |
4.4.9 人类药物靶标膜蛋白分析 |
4.5 本章小结 |
第五章 泛醌结合蛋白识别与分析 |
5.1 引言 |
5.2 研究背景与思路 |
5.3 实验方法 |
5.3.1 数据集 |
5.3.2 特征编码 |
5.3.3 特征选择 |
5.3.4 UBPs-Pred分类模型 |
5.3.5 参数寻优 |
5.3.6 实验环境 |
5.3.7 评价指标 |
5.4 实验结果及讨论 |
5.4.1 分类算法对比 |
5.4.2 特征选择结果 |
5.4.3 参数寻优结果 |
5.4.4 预测器性能 |
5.4.5 案例分析 |
5.4.6 泛醌结合域模体统计 |
5.4.7 泛醌结合蛋白超级家族分布 |
5.4.8 人类泛醌结合蛋白GO富集分析 |
5.4.9 人类泛醌结合蛋白KEGG通路富集分析 |
5.5 本章小结 |
第六章 在线服务平台 |
6.1 网站简介 |
6.2 服务器环境 |
6.3 在线预测 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
附录 |
在学期间公开发表论文及着作情况 |
(6)蛋白质高维构象空间多模态优化算法设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 结构安排 |
第二章 基础知识 |
2.1 进化算法 |
2.2 能量模型 |
2.3 片段组装 |
2.4 蛋白质结构二面角 |
2.5 蛋白质二级结构 |
2.6 本章小结 |
第三章 二面角知识辅助的蛋白质结构从头预测算法 |
3.1 引言 |
3.2 二面角先验知识 |
3.2.1 片段库二面角分布信息 |
3.2.2 拉氏图 |
3.3 算法设计 |
3.3.1 二面角打分模型 |
3.3.2 TARM算法描述 |
3.4 测试结果与讨论 |
3.4.1 测试蛋白与实验设置 |
3.4.2 测试结果分析与讨论 |
3.5 本章小结 |
第四章 基于二面角相似度模型的多模态构象优化算法 |
4.1 引言 |
4.2 多模态优化技术 |
4.3 算法设计 |
4.3.1 二面角相似度模型 |
4.3.2 DASOM算法描述 |
4.4 测试结果与讨论 |
4.4.1 测试蛋白与实验设置 |
4.4.2 实验结果分析与讨论 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
作者简介 |
1 作者简历 |
2 攻读硕士学位期间发表的学术论文 |
3 参与的科研项目及获奖情况 |
4 公开发明专利 |
5 登记软件着作权 |
学位论文数据集 |
(7)贮期鸡蛋蛋白质含量品质的光谱无损检测方法及装置研发(论文提纲范文)
摘要 |
ABSTRACT |
缩略语表 |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 鸡蛋品质无损检测方法研究现状 |
1.2.2 光谱技术在农产品品质无损检测中的研究现状 |
1.2.3 国内外同类研究现状总结及启示 |
1.3 研究内容与技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 本章小结 |
2 贮期鸡蛋品质和蛋清主要蛋白质含量的变化规律及相关关系 |
2.1 前言 |
2.2 材料与方法 |
2.2.1 试验材料与分组 |
2.2.2 试验仪器 |
2.2.3 试验方法 |
2.3 结果与分析 |
2.3.1 鸡蛋品质指标及主要蛋白质含量的统计及其变化规律 |
2.3.2 鸡蛋品质指标与蛋白质含量的相关性分析 |
2.3.3 鸡蛋品质指标与蛋清蛋白含量的灰色关联度分析 |
2.3.4 等价蛋龄预测模型 |
2.3.5 不同品种鸡蛋品质与S-卵白蛋白含量相关性分析 |
2.4 本章小结 |
3 基于高光谱成像技术的鸡蛋新鲜度、酸碱度及黏度检测 |
3.1 前言 |
3.2 材料与方法 |
3.2.1 试验材料与分组 |
3.2.2 试验装置 |
3.2.3 试验方法 |
3.2.4 光谱数据分析方法 |
3.3 结果与分析 |
3.3.1 鸡蛋新鲜度、酸碱度及黏度的相关性 |
3.3.2 光谱数据预处理 |
3.3.3 竞争性自适应重加权算法提取特征波长 |
3.3.4 连续投影算法提取特征波长 |
3.3.5 二次特征波长提取 |
3.3.6 新鲜度、酸碱度及黏度预测模型的建立与验证 |
3.4 本章小节 |
4 基于高光谱成像技术的S-卵白蛋白含量无损检测及其可视化 |
4.1 前言 |
4.2 材料与方法 |
4.2.1 试验材料与分组 |
4.2.2 试验仪器 |
4.2.3 S-卵白蛋白含量测定 |
4.2.4 光谱、图像数据分析方法 |
4.3 结果与分析 |
4.3.1 样本集的划分 |
4.3.2 基于图像特征参数的S-卵白蛋白含量预测 |
4.3.3 基于特征波长的S-卵白蛋白含量预测 |
4.3.4 基于图像—光谱融合信息的无损预测模型 |
4.3.5 S-卵白蛋白含量可视化 |
4.4 本章小结 |
5 基于可见-近红外光谱技术的鸡蛋新鲜度指标及S-卵白蛋白含量无损检测 |
5.1 前言 |
5.2 材料与方法 |
5.2.1 试验材料与分组 |
5.2.2 试验仪器 |
5.2.3 鸡蛋新鲜度指标及S-卵白蛋白含量的测定 |
5.2.4 光谱数据分析方法 |
5.3 结果与分析 |
5.3.1 不同样本划分方法对原始全波段光谱预测模型的影响 |
5.3.2 海蓝褐壳鸡蛋新鲜度指标及S-卵白蛋白含量的光谱建模 |
5.3.3 罗曼粉壳鸡蛋新鲜度指标及S-卵白蛋白含量的光谱建模 |
5.4 本章小节 |
6 不同品种鸡蛋新鲜度指标及S-卵白蛋白含量预测模型优化 |
6.1 前言 |
6.2 模型优化的基本原理与方法 |
6.2.1 基于模型全局更新的模型优化 |
6.2.2 基于直接校正的模型优化 |
6.2.3 基于斜率/截距校正的模型优化 |
6.3 模型适用性检验 |
6.3.1 模型验证法 |
6.3.2 平均光谱法 |
6.3.3 主成分得分空间分布法 |
6.3.4 模型适用性检验结果 |
6.4 鸡蛋哈夫值模型优化结果 |
6.4.1 全局更新 |
6.4.2 直接校正 |
6.4.3 斜率/截距校正 |
6.5 鸡蛋蛋黄指数模型优化结果 |
6.5.1 全局更新 |
6.5.2 直接校正 |
6.5.3 斜率/截距校正 |
6.6 鸡蛋S-卵白蛋白含量模型优化结果 |
6.6.1 全局更新 |
6.6.2 直接校正 |
6.6.3 斜率/截距校正 |
6.7 不同方法模型优化结果比较 |
6.8 本章小结 |
7 蛋新鲜度指标及S-卵白蛋白含量无损检测装置研究 |
7.1 前言 |
7.2 蛋新鲜度指标及S-卵白蛋白含量无损检测装置设计 |
7.2.1 检测装置总体设计 |
7.2.2 检测装置关键部件选择 |
7.2.3 检测装置组装与调试 |
7.3 蛋新鲜度指标及S-卵白蛋白含量无损检测软件系统设计 |
7.3.1 软件开发平台简介 |
7.3.2 软件功能需求分析 |
7.3.3 软件流程及功能实现 |
7.4 蛋新鲜度指标及S-卵白蛋白含量无损检测装置功能检验 |
7.5 本章小结 |
8 结论与展望 |
8.1 研究结论 |
8.2 主要创新点 |
8.3 研究展望 |
参考文献 |
附录A 课题来源 |
附录B 攻读博士学位期间的主要科研成果 |
致谢 |
(8)基于接触图和过程重采样的蛋白质结构预测方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 研究方案 |
1.4 论文结构 |
第二章 蛋白质结构预测基本知识 |
2.1 蛋白质结构模型 |
2.1.1 蛋白质结构划分 |
2.1.2 蛋白质结构简化模型 |
2.1.3 残基接触图 |
2.1.4 能量景观图 |
2.2 能量函数 |
2.3 蛋白质结构预测方法 |
2.3.1 片段组装方法 |
2.3.2 构象搜索方法 |
2.4 蛋白质预测结果评价指标 |
2.5 本章小结 |
第三章 基于接触图的蛋白质构象空间搜索算法 |
3.1 算法描述 |
3.1.1 残基接触打分模型 |
3.1.2 交叉策略 |
3.1.3 BCM算法流程 |
3.2 实验结果及分析 |
3.2.1 实验参数设置 |
3.2.2 实验结果分析 |
3.2.3 算法采样能力分析 |
3.2.4 残基接触分数与RMSD的相关性分析 |
3.2.5 参数检验 |
3.3 本章小结 |
第四章 接触图辅助的过程重采样构象空间搜索算法 |
4.1 算法描述 |
4.1.1 构建过程片段库 |
4.1.2 接触图辅助的过程重采样策略 |
4.1.3 CMPR算法流程 |
4.2 实验结果及分析 |
4.2.1 实验参数设置 |
4.2.2 实验结果分析 |
4.2.3 算法采样能力分析 |
4.2.4 CASP12和CASP13 目标蛋白预测结果 |
4.2.5 参数检验 |
4.3 本章小结 |
第五章 结论与展望 |
5.1 结论 |
5.2 展望 |
参考文献 |
致谢 |
作者简介 |
1 作者简历 |
2 攻读硕士学位期间发表的学术论文 |
3 参与的科研项目 |
4 发明专利 |
5 软件着作权 |
6 获奖情况 |
学位论文数据集 |
(9)基于蚱蜢群模糊聚类的蛋白质特征提取与功能预测研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 本文的主要研究内容 |
1.4 主要工作及章节结构 |
第二章 理论背景概述 |
2.1 相关知识 |
2.1.1 蛋白质相互作用网络 |
2.1.2 蛋白质复合物和功能模块 |
2.2 蛋白质功能模块特征提取方法 |
2.2.1 基于图划分的聚类方法 |
2.2.2 基于密度的局部搜索方法 |
2.2.3 基于层次的聚类方法 |
2.2.4 基于智能种群的聚类方法 |
2.3 蛋白质功能预测方法 |
2.4 本章小结 |
第三章 基于蚱蜢群模糊聚类的蛋白质功能模块特征提取方法 |
3.1 引言 |
3.2 理论基础 |
3.2.1 模糊c均值聚类 |
3.2.2 直觉模糊c均值聚类 |
3.2.3 随机优化算法 |
3.2.4 蚱蜢优化算法 |
3.3 IFCM-GOA算法 |
3.3.1 算法思想 |
3.3.2 算法步骤 |
3.4 实验结果与分析 |
3.4.1 实验数据集 |
3.4.2 实验环境 |
3.4.3 评价标准 |
3.4.4 实验结果分析 |
3.5 本章小结 |
第四章 基于深度神经网络的蛋白质功能预测方法 |
4.1 引言 |
4.2 理论基础 |
4.2.1 核主成分分析方法 |
4.2.2 深度神经网络 |
4.3 基于深度神经网络的蛋白质功能预测 |
4.3.1 算法流程 |
4.3.2 基于IFCM-GOA和核主成分分析的蛋白质特征向量构建 |
4.3.3 基于深度神经网络的功能预测 |
4.4 实验结果与分析 |
4.4.1 实验数据集 |
4.4.2 评价标准 |
4.4.3 实验结果与分析 |
4.5 本章小结 |
第五章 蛋白质网络聚类方法综合分析平台的实现 |
5.1 系统原理及架构 |
5.2 系统聚类分析及评估 |
5.2.1 聚类算法及评估方法 |
5.2.2 主要功能模块 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介 |
(10)作物单籽粒近红外快速无损检测的模型转移方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题背景及意义 |
1.1.1 选题背景 |
1.1.2 选题意义 |
1.2 文献综述及研究进展 |
1.2.1 近红外光谱技术 |
1.2.2 近红外光谱的基本原理 |
1.2.3 近红外光谱仪器 |
1.2.4 近红外光谱分析的流程 |
1.2.5 光谱预处理方法 |
1.2.6 光谱的变量选择 |
1.2.7 奇异样本的剔除 |
1.2.8 多元校正模型 |
1.2.9 近红外定量模型的评价 |
1.2.10 近红外定性模型的评价 |
1.2.11 化学计量学方法的进展 |
1.2.12 近红外光谱应用的进展 |
1.2.13 作物单籽粒近红外快速无损分析 |
1.2.14 作物单籽粒近红外分析的进展 |
1.2.15 作物单籽粒近红外分析的瓶颈 |
1.2.16 模型转移 |
1.2.17 经典的模型转移方法 |
1.2.18 新的模型转移方法 |
1.2.19 模型转移的应用进展 |
1.3 本文研究内容 |
1.4 研究方法、技术路线和论文结构安排 |
第2章 基于斜率截距法的多种光谱平台间模型转移的评价分析 |
2.1 引言 |
2.2 材料和方法 |
2.2.1 样本集 |
2.2.2 光谱采集 |
2.2.3 单粒水稻直链淀粉和蛋白质的微量分析 |
2.2.4 模型构建 |
2.2.5 模型转移 |
2.3 结果与讨论 |
2.3.1 三种平台采集的光谱 |
2.3.2 化学值检测结果 |
2.3.3 三种近红外平台上模型的交叉验证 |
2.3.4 三种近红外平台间的模型转移 |
2.4 本章小结 |
第3章 一种用于定量模型转移的基于相关分析的波长选择方法 |
3.1 引言 |
3.2 材料和方法 |
3.2.1 基于相关分析的波长选择法 |
3.2.2 样本和处理 |
3.2.3 数据分析 |
3.3 结果与讨论 |
3.3.1 两组数据集的模型转移结果 |
3.3.2 CAWS和siPLS选择波长的比较 |
3.3.3 不同波长的模型转移结果 |
3.3.4 两个数据集结果的比较 |
3.4 本章小结 |
第4章 一种用于定性模型转移的基于CAWS优化的波长选择方法 |
4.1 引言 |
4.2 材料和方法 |
4.2.1 基于相关分析的波长选择法的优化 |
4.2.2 基于稳定一致波长选择的模型转移算法 |
4.2.3 数据集和处理 |
4.2.4 化学计量学处理 |
4.3 结果与讨论 |
4.3.1 模型校正结果 |
4.3.2 模型的转移结果 |
4.3.3 三组样本集波段选择的比较 |
4.3.4 三组样本集的转移结果的比较 |
4.4 本章小结 |
第5章 基于光谱空间转换的自然状态样品和理想状态样品间的模型转移 |
5.1 引言 |
5.2 材料和方法 |
5.2.1 单粒水稻蛋白质光谱分析的两种方法 |
5.2.2 样品制备 |
5.2.3 样品预处理和光谱采集 |
5.2.4 单粒水稻蛋白质含量的微量分析 |
5.2.5 光谱空间转换 |
5.2.6 多元校正 |
5.3 结果与讨论 |
5.3.1 单粒水稻的蛋白质含量分布 |
5.3.2 三种形态的水稻样品的原始光谱 |
5.3.3 模型优化 |
5.3.4 水稻的光谱空间转换 |
5.3.5 单粒水稻蛋白质含量模型的外部验证结果 |
5.3.6 单粒糙米和米粉的蛋白质含量模型的外部验证结果 |
5.4 本章小结 |
第6章 结论与展望 |
6.1 研究结论 |
6.2 研究展望 |
参考文献 |
附录 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
四、蛋白质空间结构预测的一种优化模型及算法(论文参考文献)
- [1]基于神经网络的蛋白质二级结构预测研究[D]. 赵子申. 兰州大学, 2021(09)
- [2]基于神经网络的蛋白质二级结构分类研究与应用[D]. 石立. 北方民族大学, 2021(08)
- [3]基于分子可视化与机器学习的蛋白质功能分析研究[D]. 梁猛. 燕山大学, 2020(07)
- [4]教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知[J]. 教育部. 中华人民共和国教育部公报, 2020(06)
- [5]基于序列的膜蛋白配体交互研究[D]. 逯畅. 东北师范大学, 2020(01)
- [6]蛋白质高维构象空间多模态优化算法设计与实现[D]. 肖璐倩. 浙江工业大学, 2020
- [7]贮期鸡蛋蛋白质含量品质的光谱无损检测方法及装置研发[D]. 付丹丹. 华中农业大学, 2020
- [8]基于接触图和过程重采样的蛋白质结构预测方法研究[D]. 余宝昆. 浙江工业大学, 2020(02)
- [9]基于蚱蜢群模糊聚类的蛋白质特征提取与功能预测研究[D]. 杨宁. 安徽农业大学, 2020(05)
- [10]作物单籽粒近红外快速无损检测的模型转移方法研究[D]. 徐琢频. 中国科学技术大学, 2020(01)