一、高质量的文件搜索(论文文献综述)
苏丹[1](2021)在《安卓应用行为刻画方法及关键技术研究》文中研究说明移动互联网的迅猛发展改变着人们的衣食住行等各个方面,智能移动终端已经成为生活中不可或缺的重要工具。其中,安卓平台以其开放性及易用性迅速占领手机市场,与之配套的数以百万计的安卓应用可以满足用户不同的功能需求。然而,种类繁多的安卓应用中鱼目混珠,引发了新的隐私风险和安全问题。一方面,恶意应用的隐私窃取、锁屏勒索等恶意行为给用户造成了重大数据和财产损失;另一方面,大量低质量应用混迹于应用市场内,给用户在选择应用时带来困难。如何刻画应用行为,有效检测恶意应用,筛选出高质量应用,保护用户的信息和财产安全,净化安卓生态环境,已成为当前信息安全领域迫在眉睫的关键问题。本文以安卓应用为主要研究对象,针对恶意应用家族分类、锁屏勒索软件检测、应用质量评估这三个伴随安卓系统发展衍生出的关键问题,以问题为导向,基于现有的领域内研究基础,致力于安卓应用行为刻画方法及应用研究。力求探索不同实际问题场景下安卓应用的行为机理,发现行为规律,提出了多源异构细粒度的行为特征集,对行为进行精准刻画及表达,并结合具体的分类需求,构建了相应的检测模型,达到能高效区分正常应用与恶意应用、高质量应用与低质量应用的目标。本文的主要贡献如下:(1)提出了基于应用关系图社区发现的恶意应用家族分类方法。首先,针对恶意应用家族边界模糊的现状,提取了包含11类多源细粒度特征刻画恶意应用家族行为。其次,针对传统聚类算法对恶意应用之间相似性评定粒度较粗的问题,将行为特征与图模型融合,构建了恶意应用关系图来刻画应用间的相似性。在构建关系图时,为克服ε图的孤立点问题和k近邻图的过度均衡问题,将二者融合,提出了 E-N建图方法。最后,本文以社区而非孤立的角度看待恶意应用,提出了基于应用关系图社区划分的恶意应用家族分类方法。本文评估了不同特征集的有效性和检测恶意应用的局限性,对比了检测的社区分布与原始家族分布的差异,提供了家族间相似性的直观展示。在来自13个家族的3996个恶意应用样本集上验证了家族特征集及家族分类方法的有效性,达到Rand指数为94.93%、准确率为79.53%的检测结果。(2)提出了基于典型行为特征的安卓锁屏勒索软件检测方法。本文是较早系统性分析国内社交网络上安卓锁屏勒索软件的工作。首先,本文对国内社交网络上的锁屏勒索软件交易进行全面研究,详细揭露交易产业链传播策略、开发模式、盈利模式及加密方式。其次,锁屏勒索软件的独特行为无法用传统常用的静态特征准确描述,本文在分析大量样本后,提出了锁屏勒索软件典型行为特征集,从多种来源提取了“言”和“行”两方面共6类特征。此特征集能够克服因混淆导致的传统基于API名称为特征的检测方法失效的问题,可以检测出加壳并伪装成热门应用的锁屏勒索软件。最后,提出了基于典型行为特征的安卓锁屏勒索软件检测方法,采用机器学习算法集成决策高效检测锁屏勒索软件。本文从国内社交网络上收集了 301个真实传播的锁屏勒索软件样本,从安智市场收集了 15751个正常样本组成实验数据集,评估了锁屏勒索软件的特征集及检测方法的有效性。实验结果显示,本文提出的特征和检测方法达到了平均99.98%的准确度。(3)提出了基于界面跳转属性图的安卓应用质量评估方法。针对基于用户生成的统计数据推荐应用而造成的冷启动问题,本文旨在通过应用本身的特征对其进行质量评估。由于正常应用行为更加多样,需寻找不同种类间高质量应用的共同点,构建能对不同种类应用的质量进行统一刻画的特征。首先,本文根据调研得出能够刻画应用质量的特征依据,提出了由界面级特征和应用级特征组成的双结构应用质量评估特征集。在动态分析过程中,提出了基于界面控件优先级的动态触发机制,提高了分析覆盖率。其次,本文提出了图-向量标准化模型及多源异构特征融合方法,使得不同规模的界面级特征转化成标准的向量表达,而后与应用级特征融合,形成能刻画整个应用的特征向量。最后,提出了基于界面跳转属性图的安卓应用质量评估方法,集成机器学习算法将应用划分为不同质量等级,用于区分高质量与低质量应用。本文详细对比了不同质量应用间的特征差异,并在图-向量映射方法中与多种其他方法对比,阐述了特征集和方法的有效性。在来自Google Play的16类共3050个应用的数据集上评估了上述方法,取得最佳85%的分类准确率。
罗树林[2](2021)在《基于高通量计算与机器学习的材料设计方法与软件的开发与应用》文中提出随着第一性原理密度泛函理论的不断发展,以高通量计算、晶体结构预测为代表的材料设计方法在材料研究中的地位正在快速上升。第一性原理高通量计算,可以大规模搜索材料相空间,发现新的材料、性质及原理。近年来,以人工智能图像识别等技术为突破口,机器学习算法快速应用在多个不同的学科领域。机器学习与材料设计方法的交叉融合,在新材料、新的构效规律、设计原则等的发现上取得了显着的进展,进一步刺激了众多科研力量的持续关注。实现高通量计算等材料设计方法与机器学习算法的有效结合,依赖于开发新的算法及软件基础架构。如何高效地产生、收集、管理、学习和挖掘大规模材料数据,是当前该研究方向涉及的算法开发及软件设计过程中面临的主要难点。针对以上问题,我们发展了三个基于高通量计算与机器学习的计算方法与软件,并将其应用于一些典型半导体光电材料物性的研究,取得了以下创新性成果或进展:(1)参与开发了人工智能辅助、数据驱动的高通量计算材料设计软件JAMIP(Jilin Artificial-intelligence aided Materials-design Integrated Package)中的晶体结构数据读写模块的核心算法及结构原型数据库接口,并对JAMIP做了千百级高通量计算任务测试。材料晶体结构信息的保存具有多种不同的数据格式。正确读取,写入这些不同类型的结构文件,是材料设计软件开发中的重要任务之一。我们针对不同结构文件,设计开发了结构文件读写算法。特别重要的是,对各种非标准格式的晶体学信息文件(CIF),现有其他发布的同类算法存在无法正确识别所有非标准类型的CIF文件的问题,我们设计并发展了新的自适应算法来处理这些不同类型的非标准CIF文件,确保结构读写模块的更广泛的普适性。同时,我们开发了JAMIP软件的晶体结构原型数据库接口及配套工具,方便高通量结构建模及计算。此外,我们还对开发的JAMIP材料设计软件,开展了百千级高通量计算任务测试,验证了软件的可靠性。(2)发展了一种基于人工智能聚类算法的结构原型生成算法及软件SPGI(Structure Prototype Generator Infrastructure),并用此软件创建了一个大型无机晶体结构原型数据库LAE-ICSPD(Local Atomic Environment based Inorganic Crystal Structure Prototype Database)。通常,高通量计算方法是基于一些结构原型,进行候选元素替换,通过批量计算来快速筛选潜在的候选材料。因此,高质量、高独占性的结构原型数据库对于高通量计算具有重要的实际使用价值。晶体的原子局域环境编码了晶体结构的所有原子配置信息,能很好地代表结构的独占性。我们开发了一种新的人工智能晶体结构原型生成软件SPGI,其基于无监督学习策略,以晶体结构的局域原子环境作为描述符,对所有实验上已合成的无机晶体结构做聚类分析,从中挑选出来了15613个结构原型,并以此构造了一个大型无机晶体结构原型数据库LAE-ICSPD,为高通量计算或机器学习等材料设计方法提供所需的晶体结构原型数据。(3)发展了一种新的、可逆推回晶体结构的晶体结构表征方法,并基于此结构表征方法设计了一种基于高通量计算和机器学习算法的逆向晶体结构预测策略。基于晶体结构投影分解算法,我们发展了一种新的可逆推回晶体结构的结构表征方法“二维切片格点图”。其核心思想是:对三维晶体结构做切片投影处理,将属于同一平面上的原子“切片”(投影)到同一个二维格点图上。该描述符可以同时用作监督学习预测模型(如深度神经网络)和无监督学习生成式模型(如变分自编码器,生成对抗神经网络)所需的材料特征描述符。同时,结合晶体结构原型数据库、监督学习性质预测模型/无监督学习生成式模型,我们设计了一种新的以材料目标性质为导向的逆向晶体结构预测策略。(4)通过理论与实验相结合,成功解析了实验观测到的Cs Pb Br3钙钛矿在两个不同表面上的具体原子排布,并解释了这两个不同表面间的相互转变机制。实验上用扫描隧道显微镜(STM)观测到了无机钙钛矿Cs Pb Br3材料有两个不同的稳定表面,即“stripe”表面和“armchair”表面。其中,“stripe”表面区域面积比“armchair”表面区域面积更大。但是实验上无法确定这两个表面对应的具体的表面原子排布,也无法解释为什么“stripe”表面区域面积更大。通过采用自主开发的JAMIP软件,我们开展了Cs Pb Br3钙钛矿STM图像的高通量模拟。我们发现了两个构建表面的模拟STM图像与实验观测图像吻合,进而解析了实验上观测到的“stripe”,“armchair”两种STM图像对应的具体表面原子排布:“stripe”图像是由于表面Br原子对及其两侧的Cs原子的长程和短程间隔排布所形成;而“armchair”图像是由于表面Br原子对及其两侧的Cs原子分层排布所形成。通过计算这两个表面结构的表面能,我们发现“stripe”表面的表面能略低于“armchair”表面的表面能,具有更好的稳定性。这是“armchair”表面自发地转变为“stripe”表面的主要原因,解释了“stripe”表面区域具有更大面积的实验事实。(5)基于第一性原理高通量计算方法,探索了纯MAPb I3钙钛矿中掺杂5-AVA分子可以提高材料热力学稳定性的原因,以及二维层状硒化铟材料的β相和γ相中带隙值和电子迁移率随原子层层数的变化规律。对于有机钙钛矿MAPb I3材料,实验上发现往其纯相中掺杂5-AVA分子,使其变成(5-AVA)xMA1-xPb I3体系后,能显着提高其在各种复杂条件下的稳定性。通过采用高通量筛选方法,我们批量计算了数十个不同的MAPb I3相和(5-AVA)xMA1-xPb I3相的形成能,获得了能量最低的两个MAPb I3相和两个(5-AVA)xMA1-xPb I3相。通过分析筛选出的四个相的分解焓及结构中八面体的形变程度,我们发现:5-AVA离子与I离子间有更强的键合作用,使得掺杂相中具有更大的八面体畸变程度;(5-AVA)xMA1-xPb I3体系具有更低的分解焓。因此,理论计算结果显示:5-AVA分子的加入,使得有机钙钛矿中的有机分子更难逃逸。这是纯MAPb I3钙钛矿中掺杂5-AVA分子可以提高材料热力学稳定性的主要原因。此外,通过开发电子输运计算的高通量计算流程方法及模块,与合作者开展了对两种相(β相和γ相)的二维层状硒化铟材料从单层到十层结构的带隙值、电子迁移率等物性随着原子层层数的变化规律的研究。我们发现:两种相的带隙值都是随着原子层层数的增加而减小,两种相的电子迁移率都是随着原子层层数的增加而增大。
刘洪飞[3](2021)在《融合信任度及不确定上下文质量修正模型的本体建模研究》文中提出本文针对如何更好的建模上下文进行了研究。在上下文的建模和利用中存在着一些问题,本文针对低质量上下文、模糊上下文和缺失上下文三个方面进行了提高上下文质量、模糊本体建模和补全缺失上下文的研究。然后分别将它们应用在了光伏发电预测、文献摘要、文献检索的领域。研究内容如下:研究内容1:对于低质量上下文,本文提出了一种新的方法来建立了高质量本体模型,该本体模型可提高上下文质量。该本体先将上下文按照其来源的不同进行分类,共分为用户上下文、网络上下文、传感器上下文和邻居上下文四种。然后对这些分类后的上下文进行质量评估,最后选择高质量的上下文来代替低质量上下文,从而提高上下文的质量。上述研究成果可应用在光伏发电预测领域,解决环境上下文数据质量低的问题。在仿真实验中,本文建立了光伏发电高质量本体来获取光伏功率预测所需要的上下文信息。结合门控循环神经网络预测模型,该方法可以提高光伏功率的预测精度,使得在光伏并网时电网能更加安全地运行。研究内容2:对于模糊上下文,本文构建了一种模糊上下文本体来对用户文章的上下文进行建模和收集,并将其应用于文献摘要领域来提高文献摘要的精度。在文献摘要领域,各种词汇由于其所处领域不同会呈现不同的意思。本文提出的方法可以通过模糊上下文本体中的领域隶属度、用户兴趣隶属度和主题隶属度找出能够准确描述文章内容的词语。最后通过这些关键的摘要词语来获得准确的摘要。通过文献摘要实验证明,该模糊本体较传统方法平均精度可以提高15%左右,使得读者们通过摘要就能准确了解文章内容。研究内容3:完全缺失的上下文,新发表文献的被引频率为空,就属于完全缺失上下文。本文通过对新发表文章的被引频率进行推理预测,然后将推理得到的被引频率应用在了文献检索中,从而提高了文献检索的精度。具体是通过将文献上下文本体和模糊神经网络推理模型结合,利用其它存在的上下文推理得到缺失的上下文并将这些文献检索上下文应用于文献检索领域。经过文献检索实验表明,该方法比单纯使用Best Matching方法平均精度提高了20%左右,并且该方法可以使检索到的文献更符合用户兴趣。
范子茜[4](2021)在《基于Github的Java程序缺陷自动修复方法研究》文中研究表明软件缺陷制约软件产业发展,严重影响软件质量。探索高效、自动的软件缺陷修复方法是目前软件工程领域的重要课题之一。深度学习技术的发展和大规模开源代码库的出现为改进传统基于“生成-验证”的缺陷修复方法带来了可能,正在成为目前研究的热点方向。目前基于深度学习的缺陷修复方法主要依赖来自开源代码库中的数据集构建模型,尽管与传统基于手工提取缺陷修复模式的修复方法相比,能够生成可通过配套测试用例集的有效补丁,但生成的补丁往往偏离了原始程序的语义,正确性依然有待提升,其主要原因在于:(1)因为这些方法使用简单的规则从开源仓库中获取数据,由于开源仓库的多样性,这种单一的数据筛选方式获取的训练数据质量低,影响模型的学习效果;(2)现有方法忽略关注程序中的控制流和数据流信息;(3)现有方法在序列化处理源代码时粒度单一,并且对其中的用户自定义标识符抽象表示,使生成的词汇表中损失了一部分程序语义信息,影响模型生成补丁的效果。本文针对以上问题对现有缺陷修复方法进行改进,并提出一种基于深度学习技术的缺陷修复解决方案,具体研究内容总结如下:(1)面对开源仓库的数据存在质量分布不均衡的挑战,本文提出了一种基于大规模开源仓库的数据优化方法,通过数据筛选过程对开源仓库中的数据进行提纯,并且为了捕获程序上下文中对缺陷修复有意义的重点特征,构建一种基于程序控制流和数据流的程序切片方法对数据进行预处理,提升从开源仓库获取数据的质量。(2)提出一种使用编码器-解码器结构的程序缺陷修复模型。针对现有方法在源码序列化过程中存在粒度单一、损失部分程序信息的问题,本文使用基于子词表示的序列化方法对源码进行处理,尽可能多的保留程序上下文中的用户自定义标识符信息。再通过基于局部注意力机制的编码器-解码器模型学习缺陷的修复模式,实现补丁的自动生成。考虑到每种缺陷的修复操作具有相似性,本文通过构建一个基于程序抽象语法树(Abstract Syntax Tree,AST)结构特征的缺陷预分类模型,为待修复缺陷选择最匹配的补丁生成模型。(3)设计并实现了一个基于Github的Java程序缺陷修复原型系统VulRepair。并且为了验证VulRepair的缺陷修复效果,还设计并实现了一组评估对比实验,从多个角度评估验证本文提出的缺陷修复模型和系统。实验结果表明,本文提出的缺陷修复方法在基准数据集和来自开源仓库的数据集上,相比已有的缺陷修复方法,VulRepair生成的有效补丁和正确补丁数量更多,并且具有修复多行缺陷的潜力。
陈轩[5](2021)在《新型RNA-配体对接预测工具的开发及测试》文中研究指明医疗药物研发是一个长期、高投入、高风险的过程,加快药物研发速度、降低资金投入成本、提高研发成功率具有十分重要的意义。RNA作为一种核糖核酸,不仅是生命系统重要的遗传物质,也是许多重大疾病的重要生物学靶标。在药物研发初始利用分子对接工具进行高通量筛选,从而确定药物先导化合物,能为药物设计提供具有指导性的计算数据。因此,研究针对RNA-配体的对接工具具有巨大的科学价值和实用价值。本文以RNA-配体对接构象搜索为研究的科学问题,以提高分子对接精度为出发点,提出了一种高效率的、高对接精度的对接构象空间搜索算法。将RNA-配体对接定义为一个问题维数与配体分子可转动键数量相关的优化问题,优化问题的目标函数定义为最小化对接构象结合能,优化问题的约束条件定义为配体分子原子间的成键情况,利用人工蜂群算法来求解该高维优化问题。人工蜂群算法有着极其广泛的应用,但存在着收敛速度较慢、过早陷入局部最优的缺点。本文在传统人工蜂群算法的基础上,改进引领蜂和跟随蜂的随机蜜源搜索策略,引领蜂改用自适应非线性搜索策略的全局最优子空间蜜源更新方式,跟随蜂改用随机非线性更新维度的局部最优子空间搜索策略,从而提出了基于最优子空间自适应搜索的人工蜂群算法。在对接实验过程中,将基于半经验的势能评估方法作为RNA与配体结合能量的打分函数,指引优化算法的构象优化搜索方向。本文主要以FIPSDock为研究基础,并在FIPSDock的框架基础上加以扩展,将提出的最优子空间搜索人工蜂群算法EPSABC引入到FIPSDock中,从而实现了面向RNA-小分子配体的对接工具EPSDock。在相同实验环境条件下,在多个开源RNA-配体复合物结构数据集上,与广泛使用的Auto Dock 4、Auto Dock Vina、r Dock、Glide、FIPSDock对接工具进行了对比测试,其中EPSDock的对接成功率达到84%。实验结果表明,对于RNA-配体类型的高维度、高灵活性的分子对接难题,EPSDock表现出了较高的对接成功率和对接准确度,也进一步验证了本研究工作所提出的基于最优子空间自适应搜索的人工蜂群算法的有效性、稳定性以及准确性。
李方东[6](2021)在《茶树转录组组装评估与多组学生物信息平台开发》文中研究表明茶树是我国最重要的传统经济作物,其叶制成的茶叶是世界上最受欢迎的仅次于水的第一大非酒精饮品,具有巨大的经济、健康和文化价值。近年来,随着高通量转录组测序技术的广泛应用,有力推进了茶树生物学基础研究进程。然而目前大部分组装软件及其分析流程均依据于模式植物的转录组数据设计的,其在非模式植物如茶上的应用存在诸多问题,因此急需开发适宜茶树转录组组装和分析的方法与策略。同时,随着茶树基因组和代谢组数据的增加,亟待构建能够整合大量不同类型组学信息与分析方法的综合数据分析平台。为此,本研究基于茶树基因组学、转录组学、代谢组学等数据资源,借助通用计算机系统、开放的数据库平台架构、高效的数据库存储系统,并结合智能的搜索引擎、友好多样的数据展示方式和简便易用的生物信息分析工具,优化茶树转录组数据组装策略,构建茶树基因组数据库分析平台,以促进茶树生物学大数据的共享和各类组学的挖掘研究。本研究的主要研究结果如下:(1)利用的茶树八个代表性组织的高深度二代转录组测序数据,通过随机抽取数据法进行全组织混合组装模拟,抽取的测序数据量为32 Gb,然后使用五种主流的转录组从头组装软件(SOAPdenovo、Trans-ABy SS、Trinity、Bridger和Bin Packer)分别进行茶树转录本重构组装,利用植物直系同源单拷贝基因库比对、公共数据库注释和转录本表达模式的分析等统计学方法进行评价。结果发现在使用32 Gb模拟测序数据量进行转录组组装时,Bin Packer组装软件和Bridger组装软件的各项评估指标均优于其他三个软件。进一步比较得出,Bridger软件在转录本N50长度、平均序列长度和序列完整性指标上略优于Bin Packer软件,同时组装的完整性也和茶树三代转录组测序相当,说明这两个软件尤其是Bridger可能更加适合茶树转录本的从头组装。(2)通过随机抽取序列进行不同数据量全组织混合和单组织组装,模拟茶树4-84 Gb测序量下使用上一步已评价较适合的Bridger组装软件分别进行组装,然后评估数据量对茶树转录组组装的影响。通过对组装结果基本指标进行统计和BUSCO评价分析得出,当茶树全组织混合组装的数据量为48 Gb时各项指标均较优,说明48Gb是茶树全(多)组织组装的优先选择的测序量。进一步进行单组织和多个组织不同数据量的组转评估得出:1)随着单组织测序数据量的增加,组装出转录本的数量也在增加,同时BUSCO评估的缺失率也在降低。当数据量达到6 Gb时,8个组织中6个组织的组装BUSCO缺失低于20%;继续增加至数据量至9 Gb时,8个组织组装的BUSCO缺失均低于20%,甚至嫩叶样本的完整性超过90%。2)对多个组织进行不同数据量组装时,其变化规律和单组织组装相似;同时两个以上组织的混合组装得到的转录本数量和完整性也优于单个组织的组装。这些结果说明,单组织组装数据量在6至9 Gb时可以获得较好的结果,性价比较高,但继续增加单组织组装的数据量或者进行多个组织混合组装均可提高转录本的数量和组装完整性。(3)本研究通过广泛收集和自主测序,整理并获得了茶树基因组图谱、24种山茶属植物共计97个转录组、代谢组、甲基化组、种质资源及大量生物和非生物胁迫基因表达谱数据,利用基因表达和代谢物分布模式的相关性等建立起各数据之间的联系;通过Mysql数据库存储、网页服务器工具和基于JAVA语言等各类计算扩展包,构建了以茶树基因图谱为框架的茶树基因组数据库平台。平台通过前端HTML5网页设计数据库整体界面,集成高性能的搜索引擎和友好的可视化工具,为用户提供基本的检索和结果的展示,以及批量下载各类丰富的数据信息。通过集成各类生物信息分析工具(如BLAST,GO和KEGG功能聚类,相关性分析,同源基因搜索,ORF搜寻,多态性SSR位点鉴定和引物设计等),有助于研究者快速检索以及深度挖掘数据库中丰富的组学数据并实现批量数据获取和可视化。以TPIA收集的不同种茶组植物的转录组和基因组数据为应用实例,本研究初步构建了代表性茶组植物的系统发育框架,结果表明,这些茶组植物物种可分为三组,其中栽培茶树聚集在一起并和C.makuanica、C.tachangensis等构成姐妹组,大理茶是该系统进化关系的基部类群。我们进一步检索了茶组植物叶片中儿茶素和咖啡因的代谢积累数据,然后根据物种分类关系将其映射到构建的系统发育关系上。结果表明,茶叶品质相关代谢物(如儿茶素)的含量随着物种进化轨迹而增加,最近分化的茶树积累的儿茶素和咖啡因比古老分支的物种多。这些数据全面揭示了茶组植物茶叶品质相关特征代谢产物的动态演化,为未来茶树功能基因组学研究和育种提供新的见解和重要线索。综上所述,本研究通过对茶树转录组装策略的研究和优化,探索了适宜茶树二代转录组组装的软件和测序量;同时对基因组学等相关组学数据进行广泛收集和分析,构建了茶树目前最全面的基因组数据库平台,为茶树分子生物学研究提供了丰富的数据和理论基础,将有助于推动茶树功能基因组学、进化生物学和群体遗传学等研究以充分发掘利用茶树优质基因资源,进而指导茶树遗传育种和品种改良,进而促进茶产业的可持续发展。
赵薇[7](2021)在《杨树驻芽和萌芽时间QTL定位分析》文中研究表明杨树是我国广泛栽培的树种之一,在工业用材、生态防护和绿化环境等方面具有不可替代的作用。杨树为多年生落叶乔木,在秋季形成驻芽以应对干燥寒冷的冬季,在春天温度和水分适宜的条件下,萌芽打破休眠后开始萌发,恢复生长。芽的休眠与萌发是杨树重要的生存策略,是对环境适应的综合体现,影响着杨树的地理分布和木材材积量。目前,有关杨树驻芽和萌芽时间的遗传机制还知之甚少。本研究以美洲黑杨(Populus deltoides)和小叶杨(Populus simonii)杂交子代作为研究材料,对杨树驻芽和萌芽时间进行QTL定位分析,并挖掘相关的候选基因,深入研究杨树驻芽和萌芽时间的遗传机制。主要研究结果如下:1.以美洲黑杨和小叶杨杂交F1代的无性系为材料,建立了随机区组扦插试验林,2020~2021年测定了每棵树的驻芽和萌芽时间。基于已构建的两个亲本高密度遗传图谱,采用区间作图法、复合区间作图法以及关联分析法对驻芽和萌芽时间进行了QTL定位分析。结果显示复合区间作图法最有效,而其它两种方法收效甚微。利用复合区间作图法,在12个连锁群上定位到23个与杨树驻芽时间相关的QTL位点,其中11个QTL位于母本美洲黑杨第1、2、4、5、6、7、10、11、17和19连锁群,而其余12个QTL位于父本小叶杨第1、2、3、4、6和12连锁群;在15个连锁群上定位到26个与杨树萌芽时间相关的QTL位点,其中13个位于美洲黑杨第1、3、5、6、10、11、15和17连锁群,其余13个QTL位于小叶杨第1、2、3、4、7、8、10、14、15、18和19连锁群。2.开发了基因功能注释和富集分析软件包Gen AE,利用该软件对QTL位点附近的基因进行功能注释,以挖掘相关候选基因。该软件分为六个步骤来实现算法:(1)对较大的基因组序列文件进行分割;(2)将分割后的文件提交到蛋白质数据库进行比对;(3)合并比对结果并提取比对信息;(4)对上一步的比对结果进行功能注释;(5)提取基因组注释信息;(6)提供候选基因文件,基因组注释结果作为背景基因,进行富集分析。3.根据QTL区间内基因的功能注释,筛选杨树驻芽和萌芽时间相关的候选基因。结果挖掘到57个与杨树萌芽和驻芽时间相关的候选基因,这些基因可分为7大类。进一步对这些候选基因进行GO和KEGG富集分析,研究发现植物激素信号转导通路、植物有丝分裂原蛋白激酶信号转导通路、生长素激活信号转导通路和生长素激活信号通路在杨树芽的休眠与萌发过程中发挥了重要作用。本研究检测到了更多有关杨树驻芽和萌芽时间的QTL位点,并且筛选出了相关的候选基因,这将有助于进一步理解杨树生长及适应性的分子机理,为加速杨树的遗传改良提供重要的参考依据。
郑欣[8](2021)在《基于图卷积网络的片上系统软硬件协同设计研究》文中研究说明随着嵌入式系统的规模越来越大,片上系统(SoC)的设计复杂度也越来越高。自20世纪80年代以来,软硬件协同设计已经发展成为一种新的SoC设计方法学,经过几代的发展,SoC设计逐步向全自动化流程方向发展。软硬件划分是软硬件协同设计中的关键步骤,它可以显着缩短SoC设计的时间,提高嵌入式系统的性能。但对于大规模系统来说,大多数相关研究提出的软硬件划分方案具有搜索时间长、划分结果质量不高等问题。在信息安全领域,数字签名SoC系统在保障用户数据安全方面起着重要的作用,数字签名系统软硬件划分的实现仍依赖于工程师的经验,且硬件设计完成后才开始软件设计,这将使得系统开发周期变长,设计效率低。现有的SoC软硬件协同设计没有形成完备统一的验证流程,使得验证过程繁琐,验证效率低。针对以上问题,本文首先研究了基于迁移学习和字典学习的任务分类问题,从图分类的角度作为切入点,再扩展到结点分类,最后到软硬件划分问题的研究,设计了两种不同的分类模型。其次,根据设计需求搭建SoC系统架构,并提出了一种基于图卷积网络的高效软硬件划分和调度方法—GCPS,在满足系统硬件约束的前提下,最大化资源利用率,寻找最优的软硬件划分方案,并进行系统的快速软硬件划分。在此基础上,基于任务静态优先级设计任务调度算法完成系统的调度并回馈给划分模型,进一步提高系统的效率和并行性。最终将GCPS模型应用于数字签名系统中,实现数字签名系统的SoC软硬件协同设计和验证。本文的创新点和主要研究工作包括以下几个方面:(1)针对传统机器学习方法在大规模系统中分类效率低的问题,本文首先研究了基于迁移学习的任务分类问题,并设计基于迁移学习和字典学习的DMTTL模型,通过迁移学习和并行执行的特性,提升了系统的分类性能和运行效率。另一方面,进一步对具有图结构数据的任务进行分类,设计了一种基于多视角字典学习的图模型,其分类效果优于大部分最新的图分类模型。通过引入多视角,GMADL模型扩展性强,可以将GMADL模型应用于结点分类问题,故本文对GMADL模型进行了改进,提出了 NMADL结点分类模型,并进行了验证与分析,研究该模型在软硬件划分问题上的可行性,同时为后续工作提供了必要的理论和实验支撑。(2)针对大规模系统设计复杂度高,软硬件划分速度慢等问题,本文基于图卷积网络(GCN),设计了一种适用于大规模系统的快速软硬件划分方法——GCPS。GCN可以有效地处理图结构数据,并聚合邻居结点的特征来生成新的结点表示。该算法能够快速收敛,有效地实现结点分类。本文研究的划分问题可以描述为在硬件面积约束下最小化所有任务的执行时间的优化问题。可以利用GCN和梯度下降的方法来求解该优化问题,实现高效的系统软硬件划分,尤其针对于大规模系统而言,该方法与传统启发式算法相比效率更高。(3)为了进一步提高软硬件划分的性能和通过并行化减少系统的执行时间,在实现软硬件划分后对系统进行任务调度,设计任务调度算法。通过计算每个结点的静态优先级,设计基于静态优先级的表调度算法实现任务调度和量化软硬件划分的质量,进一步缩短执行时间。从而在满足系统约束条件下最小化任务调度时间和最大化硬件资源利用率,对系统任务图实现最优的调度。(4)为了进一步增强数字签名系统的安全性,本文针对ECDSA算法进行改进,在明文的预处理阶段设计防护手段,实现了高安全的数字签名片上系统的软硬件协同设计。在完成系统任务图的构建、系统软硬件划分和调度后,针对数字签名系统应用,本文采用了 SoC软硬件协同设计技术。首先,将GCPS模型应用于数字签名系统的软硬件划分过程。其次,实现系统的软件设计、硬件设计和接口设计,并通过软硬件协同设计方法进行软硬件综合,采用C/C++和Verilog编程语言实现ECDSA数字签名验签。(5)针对SoC软硬件协同验证效率低、流程不统一等问题,构建协同仿真验证平台,通过设计PLI/VPI共享接口实现测试向量和输入数据的共享,并且由高级语言模型随机产生测试向量,提高系统验证效率。研究完备统一的SoC软硬件协同验证流程,对系统设计的验证可以达到实时比特级验证,并实时反馈软硬件协同设计过程中存在的问题,一体化的验证平台提高了系统的验证效率。
郭凤仙[9](2021)在《5G网络中多维资源联合管理技术研究》文中认为随着智能设备和计算技术的发展,无线蜂窝网络承载的设备与流量与日俱增。与此同时,各种新型应用不断涌现,如高清视频点播、模式识别、虚拟现实(Virtual Reality,VR)线上游戏等。这些新型应用具有数据密集、计算密集和时延敏感等特征,对第五代移动通信(5th Generation Mobile Communication,5G)提出了更高的要求,如超高速率、超低时延和海量连接等。为了满足新型业务的需求,5G网络拟引入异构小小区网络、超密集网络和移动边缘计算(Mobile Edge Computing,MEC)等技术,通过密集部署各类小小区基站并将缓存、计算等功能下沉到网络边缘,以提高网络容量、频谱效率和传输速率等。随着新型技术的引入,5G网络需要管理的资源不再仅限于传统的通信资源,而是逐渐向包括缓存、计算等在内的多维资源演进。由于各维资源的管理在系统性能保障中扮演着同等重要的角色,且相互影响,因此,多维资源联合管理非常必要。综上所述,本文以5G中的多维资源联合管理为研究重点,面向不同应用分别提出了高效的多维资源联合管理方案,以提高资源利用率,改善用户服务质量。论文的主要创新工作如下:1.在基于能量收集(Energy Harvesting,EH)和边缘缓存的5G小小区网络中,提出了一种面向高清视频的缓存和用户接入联合优化方案。首先,将EH和边缘缓存技术引入到小小区网络中,通过收集可再生能源进行供电,在网络边缘实现了自供能和内容存储,从而实现了绿色通信,提高了用户的QoS。其次,考虑能源到达的随机性和回程容量受限,本文将缓存和用户接入问题建模为联合优化问题,最大化小小区基站所服务的请求数,以降低传统电网能耗。再次,为了求解该问题,将原始问题分解为两个子问题,即用户接入和缓存,以降低求解复杂度。然后,利用潜博弈对两个子问题进行再建模,并提出了一种二维迭代算法进行求解。最后,仿真结果表明所提算法可以有效提高系统效益、能效和命中率。2.在基于MEC的5G小小区网络中,提出了一种面向计算型应用的高效计算卸载方案。首先,将MEC技术引入到小小区网络中,通过两者的结合,实现了用户在网络边缘进行分布式计算卸载的需求,减轻了核心网的压力,提高了用户的QoS,延长了移动设备的使用寿命。其次,以最小化用户能耗为目标,将卸载决策、信道分配和计算资源分配问题建模为混合整数非线性规划问题。再次,提出了一种基于遗传算法和粒子群优化的分层计算卸载算法,其中遗传算法负责粗粒度搜索,粒子群优化负责局部搜索,并分析了所提算法的复杂度。最后仿真结果表明所提算法能够有效收敛,并能够降低用户能耗,提高卸载用户数。3.在基于毫米波和MEC的5G网络中,提出了一种面向无线VR的多维资源联合管理方案。首先,将毫米波和MEC技术引入到5G网络中,提出了一种自适应无线VR架构,通过在网络边缘提供自适应渲染服务和缓存服务,满足了高质量无线VR游戏的需求。其次,考虑到资源的有限性和用户的移动性,将多维资源联合管理问题建模为最优化问题,通过联合优化用户接入、缓存策略和卸载模式选择,最大化用户体验质量效益。再次,提出了一种基于深度强化学习和潜博弈的分布式算法。其中深度强化学习负责线下训练,潜博弈负责线上执行。最后,仿真结果表明所提算法具有良好的适应性和可扩展性,并且能够有效降低时延和改善VR用户的体验质量。
刘瑞卿[10](2021)在《物流从业人员医疗诊断辅助PACS系统的设计与开发》文中研究说明随着我国经济的蓬勃发展,物流行业也快速发展,物流从业人员面临的竞争压力和工作强度都越来越大,如何保障物流从业人员在高强度的工作状态下保持身体的健康,成为大部分物流企业日益关注的问题。相关物流企业选择给员工提供定期的体检服务,借助检查结果帮助员工提前预防可能出现的重大疾病,能够有效地提高物流从业人员的健康水平,物流从业人员体检产生的病历文件所提供的信息也具有理论研究和实际应用价值。本文研发了一套物流从业人员医疗诊断辅助PACS系统,该系统有机地融合了 PACS系统、脱敏系统、标注系统,具有对病历文件的归档、脱敏、回溯与标注功能,将脱敏后的病历图像进行标注,既保护了病人的隐私,也可以用于科研使用。能够有效地对员工体检产生的数字化文件进行管理,提高医院的文件管理效率。该系统现已稳定运行在某医院的医学研究中心内,能够有效的促进科研人员的研究。本文在认真分析系统需求的基础上,将系统的整体功能划分为多个子系统模块,介绍了系统的主要架构设计与各子系统模块的架构设计,说明了系统内各子模块之间的交互关系。系统研发过程中采用医疗行业的DICOM标准,采用React作为前端主要部分的架构,采用Node.js和Egg框架作为后端主要部分的架构,并配合MySQL数据库实现数据的读取与存储,使用Docker工具进行系统的安装与部署。本文对该系统进行了系统测试,达到了预期的设计目标,系统运行稳定可靠。医学人工智能技术发展迅速,其应用实践的瓶颈之一就是缺少有效的标签数据,本系统可以提供高质量的数据,能够满足相关科研人员的使用需求,以促进相关科研的发展,从而使用科研成果为物流行业提供更好的医疗服务,为提高物流从业人员健康水平起到积极的促进作用。
二、高质量的文件搜索(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、高质量的文件搜索(论文提纲范文)
(1)安卓应用行为刻画方法及关键技术研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
缩略语对照表 |
1 绪论 |
1.1 引言 |
1.2 研究背景 |
1.2.1 安卓系统框架 |
1.2.2 安卓系统的安全机制 |
1.2.3 安卓应用简介 |
1.2.4 安卓应用分发和传播平台 |
1.2.5 安卓恶意应用 |
1.3 国内外研究现状 |
1.3.1 安卓应用行为刻画及恶意应用检测通用方法研究 |
1.3.2 安卓恶意应用家族分类研究 |
1.3.3 安卓勒索软件检测方法研究 |
1.3.4 安卓应用质量评估及分类方法研究 |
1.3.5 当前研究的不足 |
1.4 研究内容 |
1.4.1 基于应用关系图社区发现的恶意应用家族分类方法 |
1.4.2 基于典型行为特征的安卓锁屏勒索软件检测方法 |
1.4.3 基于界面跳转属性图的安卓应用质量评估方法 |
1.5 论文结构 |
2 基于应用关系图社区发现的恶意应用家族分类方法 |
2.1 引言 |
2.1.1 问题描述 |
2.1.2 本章贡献 |
2.2 相关背景知识 |
2.2.1 反编译过程 |
2.2.2 Smali文件结构 |
2.2.3 权限-API映射 |
2.2.4 无向图的构建方法 |
2.3 恶意应用家族行为特征 |
2.3.1 行为特征刻画 |
2.3.2 行为特征描述方式 |
2.4 基于文档频率法的应用相似度计算方法 |
2.5 E-N算法构建恶意应用关系图 |
2.6 应用关系图社区划分方法 |
2.7 实验结果及分析 |
2.7.1 实验数据及环境 |
2.7.2 评价指标 |
2.7.3 恶意应用家族分类结果分析 |
2.7.4 相关工作对比 |
2.7.5 方法讨论 |
2.8 本章总结 |
3 基于典型行为特征的安卓锁屏勒索软件检测方法 |
3.1 引言 |
3.1.1 问题描述 |
3.1.2 本章贡献 |
3.2 相关背景知识 |
3.2.1 勒索软件发展历程 |
3.2.2 恶意应用分类模型 |
3.3 国内的安卓锁屏勒索软件模式分析 |
3.3.1 锁屏勒索软件通用传播策略 |
3.3.2 典型密码类型及解锁方式 |
3.4 锁屏勒索软件典型恶意行为分析及刻画 |
3.4.1 锁屏勒索软件行为表现形式 |
3.4.2 锁屏勒索软件行为特点分析 |
3.4.3 锁屏勒索软件行为特征刻画 |
3.5 锁屏勒索软件检测方法 |
3.6 实验结果及分析 |
3.6.1 实验数据及环境 |
3.6.2 评价指标 |
3.6.3 锁屏勒索软件检测结果 |
3.6.4 时间花销 |
3.6.5 锁屏勒索软件与正常应用的特征对比 |
3.6.6 相关工作对比 |
3.6.7 方法讨论 |
3.7 锁屏勒索软件治理进展 |
3.8 本章总结 |
4 基于界面跳转属性图的安卓应用质量评估方法 |
4.1 引言 |
4.1.1 问题描述 |
4.1.2 本章贡献 |
4.2 应用质量评估特征 |
4.2.1 特征选取依据分析 |
4.2.2 应用级特征刻画 |
4.2.3 界面级特征刻画 |
4.3 基于界面控件优先级的动态触发机制 |
4.4 图-向量标准化模型及异构特征融合方法 |
4.4.1 构建界面跳转属性图 |
4.4.2 图-向量标准化模型 |
4.5 应用质量评估方法 |
4.6 实验结果及分析 |
4.6.1 数据集及实验环境 |
4.6.2 评价指标 |
4.6.3 质量标签划定 |
4.6.4 应用质量评估结果分析 |
4.6.5 不同质量应用的特征差异 |
4.6.6 时间花销 |
4.6.7 相关工作对比 |
4.6.8 方法讨论 |
4.7 本章总结 |
5 总结与展望 |
5.1 论文的主要贡献 |
5.2 下一步研究方向 |
5.3 未来展望 |
参考文献 |
作者攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(2)基于高通量计算与机器学习的材料设计方法与软件的开发与应用(论文提纲范文)
中文摘要 |
abstract |
第一章 绪论 |
1.1 材料领域高通量计算工具概述 |
1.1.1 大型材料结构及物性计算数据库 |
1.1.2 现有高通量计算软件包 |
1.2 用于材料学领域的机器学习算法概述 |
1.2.1 监督学习算法 |
1.2.2 无监督学习算法 |
1.3 论文选题目的及意义 |
1.4 论文的结构安排 |
第二章 计算材料学的理论背景和物性计算方法 |
2.1 密度泛函理论概述 |
2.1.1 密度泛函理论的发展历史 |
2.1.2 Hohenberg-Kohn定理 |
2.1.3 Kohn-Sham方程 |
2.1.4 交换关联泛函 |
2.2 材料的第一性原理物性计算 |
2.2.1 材料的第一性原理物性计算概述 |
2.2.2 本文中涉及到的材料第一性原理物性计算 |
2.2.2.1 表面原子的STM图像 |
2.2.2.2 表面能 |
2.2.2.3 原子填充因子 |
2.3 结构描述符 |
2.3.1 材料的结构表征方法概述 |
2.3.2 本论文中涉及到的材料结构表征方法 |
2.3.2.1 原子成键键取向序列(BOO) |
2.3.2.2 原子位置平滑重叠(SOAP) |
2.4 新材料的计算设计方法 |
2.4.1 基于高通量计算的计算设计方法 |
2.4.2 基于结构预测的计算设计方法 |
2.4.3 基于机器学习的计算设计方法 |
第三章 开发机器学习辅助的高通量计算材料设计工具 |
3.1 参与开发机器学习辅助的高通量计算材料设计软件JAMIP |
3.1.1 开发背景 |
3.1.2 开发工具 |
3.1.3 开发细节 |
3.1.3.1 晶体结构的文本文件格式转换 |
3.1.3.2 结构原型数据库 |
3.1.3.3 百千级高通量计算任务测试 |
3.1.4 本节小结 |
3.2 基于无监督学习及高通量计算开发晶体结构原型生成软件SPGI及数据库LAE-ICSPD |
3.2.1 开发背景 |
3.2.2 开发工具 |
3.2.3 开发细节 |
3.2.3.1 创建LAE-ICSPD的流程概述 |
3.2.3.2 初始结构的筛选及预处理 |
3.2.3.3 结构局域原子环境的表征 |
3.2.3.4 聚类分析 |
3.2.3.5 无机晶体结构原型数据库LAE-ICSPD的创建 |
3.2.3.6 结构原型生成软件SPGI |
3.2.3.7 基于密度泛函理论的高通量计算 |
3.2.4 本节小结 |
3.3 结合机器学习与高通量计算的逆向晶体结构预测策略 |
3.3.1 逆向晶体结构预测的研究现状 |
3.3.2 可逆结构表征方法“二维切片格点图” |
3.3.3 结合监督学习与无监督学习的逆向晶体结构预测策略 |
3.3.4 本节小结 |
3.4 本章小结 |
第四章 自主研发的高通量计算方法与软件在设计半导体光电材料中的应用 |
4.1 高通量计算材料设计方法用于设计半导体光电材料的研究现状 |
4.2 JAMIP在研究半导体光电材料的结构及性质中的应用 |
4.2.1 JAMIP在研究钙钛矿材料CsPbBr_3表面中的应用 |
4.2.1.1 CsPbBr_3钙钛矿薄膜样本的实验合成方法及STM观测结果 |
4.2.1.2 高通量计算模拟表面原子STM图像的方法及结果 |
4.2.2 用JAMIP做高通量计算研究钙钛矿(5-AVA)_xMA_(1-x)PbI_3的稳定性.. |
4.2.2.1 (5-AVA)_xMA_(1-x)PbI_3钙钛矿的实验合成方法及稳定性测试 |
4.2.2.2 高通量计算辅助研究(5-AVA)_xMA_(1-x)PbI_3钙钛矿的稳定性 |
4.2.3 高通量计算二维层状硒化铟材料的电子性质 |
4.2.3.1 二维层状硒化铟材料的带隙值随层数的变化规律 |
4.2.3.2 二维层状硒化铟材料的电子迁移率随层数的变化规律 |
4.3 本章小结 |
第五章 总结与展望 |
参考文献 |
作者简介 |
攻读博士学位期间公开发表的学术论文 |
致谢 |
(3)融合信任度及不确定上下文质量修正模型的本体建模研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景 |
1.2 主要研究目的和意义 |
1.3 国内外研究现状 |
1.4 本文研究内容与创新点 |
1.5 论文结构安排 |
第2章 相关理论与技术 |
2.1 上下文感知计算 |
2.1.1 上下文的定义和分类 |
2.1.2 上下文的感知和获取 |
2.1.3 上下文的建模 |
2.1.4 上下文的推理 |
2.2 本体建模方法 |
2.2.1 本体的要素 |
2.2.2 本体的构建方法 |
2.2.3 本体的建模语言和模糊本体 |
第3章 可提高上下文质量的高质量上下文本体 |
3.1 上层本体模型 |
3.2 加入优化上下文质量层的中层本体模型 |
3.2.1 上下文质量表示层 |
3.2.2 实现上下文质量的修正 |
3.3 下层光伏发电预测领域本体模型 |
3.4 光伏发电预测模型 |
3.5 其他领域的上下文本体 |
3.6 仿真实验 |
3.6.1 评估高质量本体模型 |
3.6.2 光伏预测模型实验 |
3.7 小结 |
第4章 利用模糊上下文本体与机器学习方法进行文献摘要的研究 |
4.1 文献领域词语的模糊性和模糊本体 |
4.2 文本摘要介绍 |
4.3 文本摘要相关研究 |
4.3.1 基于统计的自动摘要方法 |
4.3.2 基于主题的方法 |
4.3.3 基于图模型的自动摘要方法 |
4.3.4 基于机器学习的自动摘要方法 |
4.3.5 基于本体的自动摘要方法 |
4.4 基于模糊本体的文本摘要方法 |
4.4.1 模糊本体的定义 |
4.4.2 词语的领域隶属度 |
4.4.3 词语的作者兴趣隶属度 |
4.4.4 词语的文档主题隶属度 |
4.4.5 句子选择与摘要过程 |
4.5 仿真实验 |
4.5.1 数据准备与评测标准 |
4.5.2 实验结果与分析 |
4.6 小结 |
第5章 利用补全的上下文提高文档检索效率 |
5.1 基本的信息检索方法 |
5.1.1 布尔检索 |
5.1.2 倒排索引 |
5.1.3 排名检索模型 |
5.2 基于文章兴趣度的信息检索 |
5.2.1 文献检索上下文本体 |
5.2.2 建立基于兴趣度的文献检索模型 |
5.3 仿真实验 |
5.3.1 数据准备与评测标准 |
5.3.2 实验结果与分析 |
5.4 小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
在学期间主要科研成果 |
一、发表学术论文 |
二、申请发明专利 |
三、获奖情况 |
(4)基于Github的Java程序缺陷自动修复方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 研究背景与意义 |
1.2 本文研究动机 |
1.3 本文研究内容 |
1.4 本文组织结构 |
第二章 程序缺陷修复方法 |
2.1 研究现状 |
2.1.1 基于生成-验证的缺陷修复技术 |
2.1.2 基于语义合成的缺陷修复技术 |
2.1.3 基于手工提取修复模式的缺陷修复技术 |
2.1.4 基于深度学习提取修复模式的缺陷修复技术 |
2.2 当前研究的局限性 |
2.3 本章小结 |
第三章 基于大规模开源仓库的高质量数据优化方法 |
3.1 高质量数据优化方法概述 |
3.2 Github仓库获取 |
3.2.1 Github仓库与commit介绍 |
3.2.2 commit存在问题 |
3.2.3 基于排序的Github仓库获取 |
3.3 commit筛选 |
3.3.1 基于变更类型的一次筛选 |
3.3.2 基于正则表达式的二次筛选 |
3.3.3 基于BiLSTM分类模型的三次筛选 |
3.3.4 基于关键词模式匹配的commit分类 |
3.4 数据预处理 |
3.4.1 解析变更文件对 |
3.4.2 提取变更函数对 |
3.4.3 基于程序控制流和数据流的切片方法 |
3.5 本章小结 |
第四章 基于Encoder-Decoder的程序缺陷修复模型 |
4.1 程序缺陷修复模型介绍 |
4.2 源代码特征提取与向量化表示 |
4.2.1 基于文本特征与子词表示的源码向量化 |
4.2.2 基于AST结构特征与注意力机制的源码向量化 |
4.3 基于程序AST结构特征的BiLSTM缺陷预分类模型 |
4.3.1 BiLSTM神经网络介绍 |
4.3.2 学习分类特征 |
4.4 基于Encoder-Decoder的补丁生成模型 |
4.4.1 基于局部注意力机制的Encoder-Decoder模型介绍 |
4.4.2 学习缺陷修复模式 |
4.4.3 补丁生成与验证 |
4.5 本章小结 |
第五章 系统实验评估与分析 |
5.1 VulRepair原型系统设计与实现 |
5.1.1 系统实现与模块设计 |
5.1.2 系统界面展示 |
5.2 VulRepair系统实验设计 |
5.2.1 实验数据 |
5.2.2 实验环境与配置 |
5.2.3 实验设置 |
5.2.4 对比工作介绍 |
5.2.5 评估指标 |
5.3 不同序列化方法对模型修复效果的影响实验 |
5.4 不同预处理方法对模型修复效果的影响实验 |
5.5 缺陷预分类模型对模型修复效果的影响实验 |
5.6 与其他缺陷修复工具的对比实验 |
5.6.1 基于Java基准数据集的对比 |
5.6.2 基于开源仓库数据集的对比 |
5.7 修复实例分析 |
5.7.1 在Java基准数据集上的修复结果 |
5.7.2 在Github数据集上的修复结果 |
5.8 本章小结 |
总结与展望 |
总结 |
展望 |
参考文献 |
攻读硕士学位期间取得的科研成果 |
1.申请(授权)专利 |
2.参与科研项目及科研获奖 |
致谢 |
(5)新型RNA-配体对接预测工具的开发及测试(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究的目的与意义 |
1.2 相关研究发展现状 |
1.3 本研究工作的主要内容 |
1.4 全文组织结构 |
2 RNA-配体对接的相关研究 |
2.1 引言 |
2.2 RNA-配体对接的结合形式 |
2.3 RNA-配体对接的工具 |
2.3.1 Auto Dock4 对接工具 |
2.3.2 Auto Dock Vina对接工具 |
2.3.3 Glide对接工具 |
2.3.4 r Dock对接工具 |
2.3.5 FIPSDock对接工具 |
2.4 RNA-配体对接的能量打分函数 |
2.5 RNA-配体对接的构象搜索算法 |
2.6 本章小结 |
3 基于最优子空间学习的人工蜂群算法 |
3.1 引言 |
3.2 人工蜂群算法简介 |
3.2.1 基于个体互学习的人工蜂群算法 |
3.2.2 基于全局最优个体自适应的人工蜂群算法 |
3.2.3 可变搜索策略的人工蜂群算法 |
3.2.4 全局最佳引导的人工蜂群算法 |
3.3 基于最优子空间自适应学习的人工蜂群算法 |
3.3.1 子空间邻居 |
3.3.2 全局最优学习规则 |
3.3.3 自适应非线性搜索策略 |
3.3.4 EPSABC算法实现 |
3.3.5 算法性能分析 |
3.4 本章小结 |
4 EPSDock对接工具的开发与测试 |
4.1 引言 |
4.2 RNA-配体对接问题的表述 |
4.3 EPSDock对接测试流程 |
4.4 实验平台与超参数 |
4.5 测试用数据集 |
4.6 实验结果及分析 |
4.7 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间取得科研成果情况 |
致谢 |
(6)茶树转录组组装评估与多组学生物信息平台开发(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
第一章 文献综述 |
1.1 茶树概述 |
1.2 转录组测序 |
1.2.1 转录组测序技术 |
1.2.2 转录组组装研究进展 |
1.3 茶树转录组的研究进展 |
1.4 植物基因组数据库研究现状 |
1.4.1 植物基因组数据库 |
1.4.2 茶树数据库建设现状 |
1.5 研究目的及意义 |
1.6 技术路线 |
第二章 茶树转录组组装 |
引言 |
2.1 材料与方法 |
2.1.1 数据的获取 |
2.1.2 茶树转录组组装方法 |
2.2 研究结果 |
2.2.1 茶树转录组组装最优化工具研究 |
2.2.2 茶树转录组组装最优化数据量研究 |
2.3 小结与讨论 |
第三章 茶树基因组生物信息学平台的构建与应用 |
引言 |
3.1 材料与方法 |
3.1.1 数据材料 |
3.1.2 方法 |
3.2 研究结果 |
3.2.1 茶树基因组注释优化 |
3.2.2 茶树基因组数据库的构建 |
3.2.3 生物信息学分析工具集成与应用 |
3.2.4 利用TPIA数据研究茶组植物的化学进化模式 |
3.3 小结与讨论 |
第四章 结论与展望 |
4.1 结论 |
4.2 创新点 |
4.3 展望 |
参考文献 |
附录A 附图 |
附录B 附表 |
作者简介 |
(7)杨树驻芽和萌芽时间QTL定位分析(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 前言 |
1.1 杨树资源概述及研究进展 |
1.1.1 杨树资源概述 |
1.1.2 杨树杂交研究进展 |
1.2 休眠与萌发 |
1.2.1 芽休眠与萌发 |
1.2.2 休眠和萌发的影响因素 |
1.3 林木QTL定位及研究进展 |
1.3.1 作图群体 |
1.3.2 遗传连锁图谱 |
1.3.3 QTL定位基本原理与方法 |
1.3.4 QTL作图软件 |
1.3.5 杨树QTL定位研究进展 |
1.4 研究目的及意义 |
第二章 杨树萌芽与驻芽时间QTL定位 |
2.1 材料和方法 |
2.1.1 实验材料 |
2.1.2 表型数据的测定及分析 |
2.1.3 杨树高密度遗传图谱构建 |
2.1.4 驻芽和萌芽时间QTL定位 |
2.2 结果与分析 |
2.2.1 杨树驻芽和萌芽时间表型数据分析 |
2.2.2 驻芽和萌芽时间QTL定位分析 |
2.3 讨论 |
2.3.1 杨树驻芽和萌芽时间性状表型分析 |
2.3.2 影响QTL作图的因素分析 |
2.3.3 驻芽和萌芽时间的QTL定位分析 |
第三章 杨树驻芽与萌芽时间关联分析 |
3.1 材料与方法 |
3.1.1 试验材料与表型数据测定 |
3.1.2 SNP标记数据获取 |
3.1.3 驻芽和萌芽时间关联分析 |
3.2 结果与分析 |
3.2.1 RAD测序数据 |
3.2.2 驻芽时间关联分析 |
3.2.3 萌芽时间关联分析 |
3.3 讨论 |
第四章 候选基因功能注释与富集分析 |
4.1 候选基因研究 |
4.1.1 候选基因挖掘 |
4.1.2 候选基因富集分析 |
4.2 GenAE软件包开发 |
4.2.1 GenAE软件包的使用说明 |
4.2.2 GenAE软件测试 |
4.3 结果分析 |
4.3.1 候选基因功能注释 |
4.3.2 候选基因富集分析 |
4.4 讨论 |
第五章 结论与展望 |
5.1 本研究的主要结论 |
5.2 本研究的创新点 |
5.3 研究中存在的问题及展望 |
攻读硕士学位期间发表的学术论文 |
参考文献 |
附录 |
(8)基于图卷积网络的片上系统软硬件协同设计研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外相关研究现状 |
1.2.1 SoC软硬件协同设计 |
1.2.2 图卷积网络 |
1.2.3 数字签名密码算法 |
1.3 研究内容与技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 章节安排 |
1.5 研究创新点 |
第二章 SoC软硬件协同设计和图神经网络 |
2.1 片上系统的组成与设计方法学 |
2.1.1 SoC集成模型 |
2.1.2 SoC设计方法学 |
2.2 软硬件协同设计流程 |
2.3 软硬件划分技术研究 |
2.3.1 问题描述及优化目标 |
2.3.2 基于精确算法的软硬件划分技术 |
2.3.3 基于启发式算法的软硬件划分技术 |
2.4 图神经网络架构研究 |
2.4.1 图卷积网络模型 |
2.4.2 GraphSage网络模型 |
2.4.3 图注意力网络模型 |
2.4.4 图神经网络模型对比及分析 |
2.5 本章小结 |
第三章 基于迁移学习和字典学习的任务分类研究 |
3.1 迁移学习与字典学习 |
3.1.1 迁移学习 |
3.1.2 字典学习 |
3.2 基于多任务迁移学习的字典学习模型 |
3.2.1 DMTTL模型描述与设计 |
3.2.2 DMTTL模型优化 |
3.2.3 多线程并行优化学习低维表示 |
3.3 实验结果及分析 |
3.3.1 数据集与对比方法 |
3.3.2 评估指标与参数设定 |
3.3.3 实验结果分析 |
3.4 特征提取与分析字典 |
3.4.1 子图特征提取 |
3.4.2 多视角分析字典 |
3.5 多视角字典学习的分类模型 |
3.5.1 基于PCA和LDA的图数据预处理 |
3.5.2 基于分析字典的特征提取 |
3.5.3 多视角SVM图分类模型构建与优化 |
3.5.4 软硬件划分结点分类模型构建 |
3.6 实验结果及分析 |
3.6.1 数据集与对比方法 |
3.6.2 评估指标与参数设定 |
3.6.3 实验结果与分析 |
3.7 本章小结 |
第四章 基于图卷积网络的软硬件划分模型研究 |
4.1 基于TGFF构建系统任务图 |
4.1.1 系统任务图的存储与表示 |
4.1.2 具有物理意义的任务图属性设定 |
4.1.3 基于TGFF的系统任务图生成 |
4.2 GCN软硬件划分模型设计 |
4.2.1 数据预处理与输入层设计 |
4.2.2 图卷积层设计 |
4.2.3 输出层设计 |
4.3 LSSP任务调度算法设计 |
4.3.1 静态优先级计算 |
4.3.2 任务分配规则设计 |
4.4 GCPS软硬件划分、调度模型设计与优化 |
4.4.1 GCPS模型优化与改进策略 |
4.4.2 预训练及GCPS算法实现 |
4.4.3 GCPS算法应用 |
4.5 实验结果及分析 |
4.5.1 实验平台及设定 |
4.5.2 实验评估指标 |
4.5.3 实验结果与分析 |
4.6 本章小结 |
第五章 数字签名系统的软硬件协同设计研究 |
5.1 基于椭圆曲线的数字签名算法 |
5.1.1 ECC密码算法 |
5.1.2 ECDSA数字签名算法 |
5.2 ECDSA任务模型与系统框架构建分析 |
5.2.1 软硬件划分粒度选择 |
5.2.2 目标体系架构与任务模型设定 |
5.2.3 确定SoC系统架构 |
5.3 数字签名系统的软硬件划分 |
5.3.1 数字签名系统的任务图构建 |
5.3.2 ECDSA软硬件划分与调度 |
5.4 ECDSA SoC软硬件协同设计 |
5.4.1 ECDSA软件设计与优化 |
5.4.2 ECDSA核心硬件设计与优化 |
5.4.3 AHB-Lite总线接口设计 |
5.5 数字签名系统的软硬件协同验证 |
5.5.1 协同仿真验证流程设计 |
5.5.2 仿真工具与数字签名系统协同验证 |
5.6 实验结果及分析 |
5.6.1 实验平台及设定 |
5.6.2 实验评估指标 |
5.6.3 实验结果与分析 |
5.7 本章小结 |
结论与展望 |
参考文献 |
攻读学位期间取得与学位论文相关的成果 |
致谢 |
(9)5G网络中多维资源联合管理技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 论文的研究背景 |
1.1.1 5G网络概述 |
1.1.2 5G网络发展方向 |
1.1.3 5G网络关键技术研究 |
1.2 5G网络中多维资源联合管理关键技术研究 |
1.2.1 多维资源联合管理技术面临的挑战 |
1.2.2 多维资源联合管理技术研究现状 |
1.2.3 研究意义 |
1.3 论文主要工作和安排 |
1.3.1 论文研究内容 |
1.3.2 论文创新点 |
1.3.3 论文章节安排 |
参考文献 |
第二章 5G网络资源管理关键技术概述 |
2.1 引言 |
2.2 面向数据型应用的多维资源联合管理技术研究 |
2.2.1 文件流行度已知的缓存技术 |
2.2.2 文件流行度未知的缓存技术 |
2.3 面向计算型应用的多维资源联合管理技术研究 |
2.3.1 计算卸载决策已知的多维资源联合管理技术 |
2.3.2 计算卸载决策未知的多维资源联合管理技术 |
2.4 面向综合型应用的多维资源联合管理技术研究 |
2.4.1 针对视频转码的多维资源联合管理技术 |
2.4.2 针对VR/AR的多维资源联合管理技术 |
2.5 本章小结 |
参考文献 |
第三章 面向高清视频的缓存和用户接入联合优化方案 |
3.1 引言 |
3.2 系统模型 |
3.2.1 文件请求模型 |
3.2.2 通信协议 |
3.2.3 能量收集模型 |
3.2.4 传输模型 |
3.3 问题建模 |
3.4 博弈模型与算法 |
3.4.1 用户接入博弈 |
3.4.2 缓存博弈 |
3.4.3 二维弱非循环博弈 |
3.4.4 二维迭代算法 |
3.5 仿真结果与分析 |
3.5.1 收敛性分析 |
3.5.2 性能分析 |
3.6 本章小结 |
参考文献 |
第四章 面向计算型应用的高效计算卸载策略 |
4.1 引言 |
4.2 系统模型 |
4.2.1 网络架构 |
4.2.2 通信模型 |
4.2.3 计算模型 |
4.3 问题建模和分析 |
4.4 基于启发式算法的分层计算卸载算法 |
4.4.1 算法流程概述 |
4.4.2 遗传算法 |
4.4.3 粒子群算法 |
4.4.4 收敛性和时间复杂度分析 |
4.5 仿真结果与分析 |
4.5.1 仿真设置和对比算法 |
4.5.2 收敛性验证 |
4.5.3 算法性能验证 |
4.6 本章小结 |
参考文献 |
第五章 面向无线VR的多维资源联合管理方案 |
5.1 引言 |
5.2 系统模型 |
5.2.1 自适应VR架构概述 |
5.2.2 缓存模型 |
5.2.3 通信模型 |
5.2.4 计算模型 |
5.2.5 体验质量模型 |
5.3 问题建模 |
5.4 基于深度强化学习和潜博弈的分布式多维资源管理方案 |
5.4.1 算法概述 |
5.4.2 基于深度强化学习的线下训练阶段 |
5.4.3 基于潜博弈的线上执行阶段 |
5.4.4 复杂度分析和算法部署 |
5.5 仿真结果与讨论 |
5.5.1 仿真设置和对比算法 |
5.5.2 收敛性验证 |
5.5.3 算法性能验证 |
5.6 本章小结 |
参考文献 |
第六章 结论与展望 |
6.1 本文工作总结 |
6.2 下一步工作计划 |
附录A 缩略语表 |
致谢 |
攻读学位期间发表的学术论文目录 |
(10)物流从业人员医疗诊断辅助PACS系统的设计与开发(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要创新点 |
1.4 研究内容与论文结构 |
1.4.1 研究内容 |
1.4.2 论文组织结构 |
1.5 本章小结 |
第二章 关键理论与技术概述 |
2.1 概述 |
2.2 DICOM介绍 |
2.2.1 DICOM标准简介 |
2.2.2 DICOM标准信息层次结构 |
2.2.3 DICOM数据结构 |
2.3 Node.js技术 |
2.3.1 Node.js的基础架构 |
2.3.2 Node.js的特点 |
2.4 MySQL数据库技术 |
2.4.1 MySQL数据库简介 |
2.5 Docker技术 |
2.5.1 Docker简介 |
2.5.2 Docker的工作原理 |
2.6 React前端技术 |
2.7 数据脱敏相关理论 |
2.7.1 数据脱敏简介 |
2.7.2 传统的数据脱敏方法 |
2.8 本章小结 |
第三章 系统需求分析 |
3.1 概述 |
3.2 可行性分析 |
3.2.1 技术可行性分析 |
3.2.2 经济可行性分析 |
3.2.3 操作可行性 |
3.3 系统非功能性需求分析 |
3.3.1 可靠性 |
3.3.2 安全性 |
3.3.3 易维护性 |
3.3.4 易扩展性 |
3.4 系统业务流程分析 |
3.5 系统功能性需求分析 |
3.5.1 医疗诊断辅助PACS系统 |
3.5.2 图片查看器系统 |
3.5.3 脱敏系统 |
3.5.4 回溯系统 |
3.5.5 标注系统 |
3.6 本章小结 |
第四章 系统总体设计 |
4.1 概述 |
4.2 系统结构设计与子模块交互关系 |
4.2.1 系统结构设计 |
4.2.2 子模块交互关系 |
4.3 系统架构设计 |
4.3.1 系统后端主要架构设计 |
4.3.2 系统前端主要架构设计 |
4.4 系统功能子模块设计 |
4.4.1 PACS系统设计 |
4.4.2 图片查看器系统设计 |
4.4.3 脱敏系统设计 |
4.4.4 回溯系统设计 |
4.4.5 标注系统设计 |
4.5 系统数据库设计 |
4.5.1 E-R模型设计 |
4.5.2 表结构设计 |
4.6 本章小结 |
第五章 系统实现 |
5.1 概述 |
5.2 开发平台与工具 |
5.3 系统总体架构实现 |
5.3.1 后端系统主要部分架构实现 |
5.3.2 前端系统主要部分架构实现 |
5.4 系统功能模块实现 |
5.4.1 医疗诊断辅助PACS系统 |
5.4.2 图片查看器系统 |
5.4.3 脱敏系统 |
5.4.4 回溯系统 |
5.4.5 标注系统 |
5.5 系统部署 |
5.5.1 PACS系统的部署 |
5.5.2 图片查看器系统与回溯系统的部署 |
5.5.3 脱敏系统的部署 |
5.6 本章小结 |
第六章 系统测试 |
6.1 概述 |
6.2 测试环境 |
6.3 功能测试 |
6.3.1 PACS系统测试 |
6.3.2 图片查看器系统 |
6.3.3 脱敏系统 |
6.3.4 回溯系统 |
6.3.5 标注系统 |
6.4 兼容性测试 |
6.5 压力测试 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文及其他成果 |
四、高质量的文件搜索(论文参考文献)
- [1]安卓应用行为刻画方法及关键技术研究[D]. 苏丹. 北京交通大学, 2021(02)
- [2]基于高通量计算与机器学习的材料设计方法与软件的开发与应用[D]. 罗树林. 吉林大学, 2021(01)
- [3]融合信任度及不确定上下文质量修正模型的本体建模研究[D]. 刘洪飞. 齐鲁工业大学, 2021(10)
- [4]基于Github的Java程序缺陷自动修复方法研究[D]. 范子茜. 西北大学, 2021(12)
- [5]新型RNA-配体对接预测工具的开发及测试[D]. 陈轩. 大连理工大学, 2021(01)
- [6]茶树转录组组装评估与多组学生物信息平台开发[D]. 李方东. 安徽农业大学, 2021(01)
- [7]杨树驻芽和萌芽时间QTL定位分析[D]. 赵薇. 南京林业大学, 2021(02)
- [8]基于图卷积网络的片上系统软硬件协同设计研究[D]. 郑欣. 广东工业大学, 2021(08)
- [9]5G网络中多维资源联合管理技术研究[D]. 郭凤仙. 北京邮电大学, 2021(01)
- [10]物流从业人员医疗诊断辅助PACS系统的设计与开发[D]. 刘瑞卿. 北京邮电大学, 2021(01)