基于InternetGIS的数据检索工具设计与JAVA实现

基于InternetGIS的数据检索工具设计与JAVA实现

一、基于InternetGIS数据检索工具的设计及JAVA实现(论文文献综述)

李方东[1](2021)在《茶树转录组组装评估与多组学生物信息平台开发》文中研究指明茶树是我国最重要的传统经济作物,其叶制成的茶叶是世界上最受欢迎的仅次于水的第一大非酒精饮品,具有巨大的经济、健康和文化价值。近年来,随着高通量转录组测序技术的广泛应用,有力推进了茶树生物学基础研究进程。然而目前大部分组装软件及其分析流程均依据于模式植物的转录组数据设计的,其在非模式植物如茶上的应用存在诸多问题,因此急需开发适宜茶树转录组组装和分析的方法与策略。同时,随着茶树基因组和代谢组数据的增加,亟待构建能够整合大量不同类型组学信息与分析方法的综合数据分析平台。为此,本研究基于茶树基因组学、转录组学、代谢组学等数据资源,借助通用计算机系统、开放的数据库平台架构、高效的数据库存储系统,并结合智能的搜索引擎、友好多样的数据展示方式和简便易用的生物信息分析工具,优化茶树转录组数据组装策略,构建茶树基因组数据库分析平台,以促进茶树生物学大数据的共享和各类组学的挖掘研究。本研究的主要研究结果如下:(1)利用的茶树八个代表性组织的高深度二代转录组测序数据,通过随机抽取数据法进行全组织混合组装模拟,抽取的测序数据量为32 Gb,然后使用五种主流的转录组从头组装软件(SOAPdenovo、Trans-ABy SS、Trinity、Bridger和Bin Packer)分别进行茶树转录本重构组装,利用植物直系同源单拷贝基因库比对、公共数据库注释和转录本表达模式的分析等统计学方法进行评价。结果发现在使用32 Gb模拟测序数据量进行转录组组装时,Bin Packer组装软件和Bridger组装软件的各项评估指标均优于其他三个软件。进一步比较得出,Bridger软件在转录本N50长度、平均序列长度和序列完整性指标上略优于Bin Packer软件,同时组装的完整性也和茶树三代转录组测序相当,说明这两个软件尤其是Bridger可能更加适合茶树转录本的从头组装。(2)通过随机抽取序列进行不同数据量全组织混合和单组织组装,模拟茶树4-84 Gb测序量下使用上一步已评价较适合的Bridger组装软件分别进行组装,然后评估数据量对茶树转录组组装的影响。通过对组装结果基本指标进行统计和BUSCO评价分析得出,当茶树全组织混合组装的数据量为48 Gb时各项指标均较优,说明48Gb是茶树全(多)组织组装的优先选择的测序量。进一步进行单组织和多个组织不同数据量的组转评估得出:1)随着单组织测序数据量的增加,组装出转录本的数量也在增加,同时BUSCO评估的缺失率也在降低。当数据量达到6 Gb时,8个组织中6个组织的组装BUSCO缺失低于20%;继续增加至数据量至9 Gb时,8个组织组装的BUSCO缺失均低于20%,甚至嫩叶样本的完整性超过90%。2)对多个组织进行不同数据量组装时,其变化规律和单组织组装相似;同时两个以上组织的混合组装得到的转录本数量和完整性也优于单个组织的组装。这些结果说明,单组织组装数据量在6至9 Gb时可以获得较好的结果,性价比较高,但继续增加单组织组装的数据量或者进行多个组织混合组装均可提高转录本的数量和组装完整性。(3)本研究通过广泛收集和自主测序,整理并获得了茶树基因组图谱、24种山茶属植物共计97个转录组、代谢组、甲基化组、种质资源及大量生物和非生物胁迫基因表达谱数据,利用基因表达和代谢物分布模式的相关性等建立起各数据之间的联系;通过Mysql数据库存储、网页服务器工具和基于JAVA语言等各类计算扩展包,构建了以茶树基因图谱为框架的茶树基因组数据库平台。平台通过前端HTML5网页设计数据库整体界面,集成高性能的搜索引擎和友好的可视化工具,为用户提供基本的检索和结果的展示,以及批量下载各类丰富的数据信息。通过集成各类生物信息分析工具(如BLAST,GO和KEGG功能聚类,相关性分析,同源基因搜索,ORF搜寻,多态性SSR位点鉴定和引物设计等),有助于研究者快速检索以及深度挖掘数据库中丰富的组学数据并实现批量数据获取和可视化。以TPIA收集的不同种茶组植物的转录组和基因组数据为应用实例,本研究初步构建了代表性茶组植物的系统发育框架,结果表明,这些茶组植物物种可分为三组,其中栽培茶树聚集在一起并和C.makuanica、C.tachangensis等构成姐妹组,大理茶是该系统进化关系的基部类群。我们进一步检索了茶组植物叶片中儿茶素和咖啡因的代谢积累数据,然后根据物种分类关系将其映射到构建的系统发育关系上。结果表明,茶叶品质相关代谢物(如儿茶素)的含量随着物种进化轨迹而增加,最近分化的茶树积累的儿茶素和咖啡因比古老分支的物种多。这些数据全面揭示了茶组植物茶叶品质相关特征代谢产物的动态演化,为未来茶树功能基因组学研究和育种提供新的见解和重要线索。综上所述,本研究通过对茶树转录组装策略的研究和优化,探索了适宜茶树二代转录组组装的软件和测序量;同时对基因组学等相关组学数据进行广泛收集和分析,构建了茶树目前最全面的基因组数据库平台,为茶树分子生物学研究提供了丰富的数据和理论基础,将有助于推动茶树功能基因组学、进化生物学和群体遗传学等研究以充分发掘利用茶树优质基因资源,进而指导茶树遗传育种和品种改良,进而促进茶产业的可持续发展。

叶云波[2](2021)在《基于元搜索引擎的排序算法研究》文中进行了进一步梳理在大数据时代,大量信息涌现在用户面前,人们大多通过网络获取信息。而搜索引擎的出现则是在互联网与用户之间搭起了一座桥梁,帮助用户获取信息。但是,单一的搜索引擎因为低精度、低召回率等原因导致用户的满意度较低。因此,调用多个成员搜索引擎的元搜索引擎被提出,有助于扩大信息检索的覆盖面,提升召回率。元搜索引擎最关键的技术在于对结果的合成和重新排序,排序结果的好坏将直接影响整个元搜索引擎的性能。现在的元搜索引擎很少关注网页信息的质量以及网页正文的内容和信息量。本文通过对网页信息质量进行评估,进一步考虑网页正文关键词信息对搜索结果进行重新排序,本文的主要工作有:(1)本文提出了一种基于网页信息质量评价模型的排序算法。针对现有搜索引擎很少关注网页信息质量的问题,本文基于网页的标题、网页的摘要、网页的来源计算出网页信息质量的评分。根据网页信息质量的评分对网页进行重新排序。本文通过实验,验证了基于网页信息质量评价算法的元搜索引擎提升了搜索精度,并且用户的满意度也明显优于现有的搜索引擎。(2)本文在第一个工作的基础上进一步提出了融合网页正文关键词信息评价模型的排序算法。针对现有搜索引擎只返回大量相关主题页面,并不评价网页正文内容的问题,对于信息类查询本文首先通过网页正文抽取算法抓取网页正文部分内容。再通过正文关键词提取算法获得网页正文的关键词以及权重。最后通过网页正文关键词信息评价算法计算出网页正文内容评价得分。根据得分进一步优化元搜索引擎的排序。经过实验验证,该方法对于尖端网页的排序更加合理,平均查准率高达94%。(3)本文基于提出的元搜索引擎的重排序算法设计并实现了原型系统。对元搜索引擎系统的流程和整体框架进行了说明,对系统界面进行了展示。本系统通过一个友好简洁的界面与用户进行交互,帮助用户在更短的时间获取更多有效的信息,并且提供相关搜索与当下搜索热点推荐,以提升用户的满意度。

戴厚乐[3](2020)在《基于倒排索引的多关键词并行密文检索系统设计与实现》文中研究指明随着信息技术的发展,在生产生活中产生的数据量日益增长。由于大数据以及云计算技术的持续发展,使得更多的个人或企业趋向于将本地数据迁移到云端存储和管理。然而,这些数据中不乏各种账户、病人就诊资料等隐私数据。为了应对云环境中隐私数据存储所产生的安全性问题,将数据加密并且以密文形式实现数据管理和存储可以有效保证数据安全性,但对于密文数据的检索操作会变得更加难以实现。本文从加密数据的可检索性具体需求出发,针对于单机资源局限性和多关键词检索效率等问题,设计并实现了一种多关键词并行密文检索系统。首先根据软件设计开发的流程,对系统做了需求分析,通过流程图确定模块之间的依赖关系和整体流程,并设计系统基本模型和结构。然后对系统主要模块进行详细设计,针对SSE-1方案的性能缺陷,基于Luence采用不同的索引加密方式构建密文索引,并且与Map Reduce并行计算模型相结合实现了密文索引的并行构建方案。通过结合多种加密算法,基于代理模式实现数据共享场景下的密钥和用户管理,实现安全、有效的用户访问控制。利用基于关键词的倒排索引切分算法实现分块检索,克服了单机资源的局限性。通过结合并行模型实现了多关键词的并行检索,有效提高了检索效率。基于Swing设计并实现了友好的人机交互界面,提高系统易用性。最后说明了该系统的开发环境,并且分别对系统的空间性能和检索效率进行测试和分析。

胡屹强[4](2020)在《企业知识分享平台的设计与实现》文中研究指明随着知识经济时代的到来,越来越多的企业意识到了有效的知识管理对于丰富员工认知,提高工作效率,进而促进企业发展,提升企业核心竞争力的重要作用。但是,目前在中小型企业内部,大多采用一种传统的手工知识管理方式,知识管理普遍存在文档存储管理困难,存储结构难以划分,查找效率缓慢以及无法协作共享的问题。同时,基于此种方式也不利于企业内部显性知识和隐性知识的相互转化以及知识资源的整合。显然,这种方式已不再适用于当下企业知识管理的需求。基于此种情况,提出了企业知识分享平台的设计与实现需求,计划建立一个实现知识的获取,存储,共享和应用的综合信息管理平台。本文依据实际项目需求,设计和实现了企业知识分享平台,不仅解决了在中小型企业内部知识文档统一存储的问题,同时通过对知识库,专家页面以及知识交流社区子系统的设计有效实现了知识信息的录入、采集、分类、共享、推荐以及检索和展示。系统采用B/S架构,基于开源框架SSM(Spring,Spring MVC,Mybatis)完成了平台整体的架构设计。实现了登录注册、应用/咨询管理、知识管理(包含知识组织,知识分类,知识审批以及知识应用)、专家任务处理以及角色、权限管理等功能模块。系统采用分层架构,基于面向服务的体系结构理念将服务层抽象出来对外提供服务,供其他系统调用,可以实现灵活的分布式部署。同时为了提升企业知识库的高效利用以及用户体验,使用Apache Software Foundation(ASF)旗下的开源项目mahout实现了相关知识的智能推荐,使用一个开源的Java垂直爬虫框架Web Magic实现了最新咨询推荐。进行了Redis服务搭建,为平台相关模块添加缓存功能,实现了Solr服务来搭建基于Lucene的全文搜索服务器,配合IKAnalyzer中文分词器来实现知识检索功能。最后,作者通过对平台的整体测试结果以及实际运行情况分析,证明了企业知识分享平台对于中小型企业知识管理的有效性和实用性。本文所做工作有效改善了企业的经营绩效,增强了企业文化氛围,学习氛围,提升了企业的核心竞争力以及技术创新。

胡永奇[5](2020)在《招聘信息垂直搜索引擎的设计与实现》文中提出在信息爆炸的互联网环境中,各个领域的数据和信息呈指数增长,从这些海量无规则数据和强干扰的信息中检索出有价值的数据具有重要的研究意义。海量数据导致通用搜索引擎对专业领域上查询的信息不够准确和全面,而用户对专业领域信息的需求却在与日俱增。对于招聘行业来说,具有可以快速检索招聘信息的垂直搜索引擎至关重要,因此,本文设计并实现了一个面向招聘行业的垂直搜索引擎。本文基于Scrapy-Redis实现分布式爬虫来为招聘信息垂直搜索引擎提供数据支持,通过对分布式爬虫框架的二次开发来实时抓取网络招聘信息,完成了招聘信息的高效采集和结构化信息的准确抽取。在研究爬虫框架源码后,对网页抓取过程中URL去重方法进行改进,通过集成自定义的布隆过滤器解决了原爬虫框架在抓取海量网页数据时内存占用过高的问题,实现了快速抓取海量招聘信息的功能。对于垂直搜索引擎,数据的快速存取和检索非常重要,本文对数据的存储选用了非关系型数据库HBase,并借助全文检索技术来弥补HBase对非主键字段的检索或者多条件的组合查询和模糊查询等方面的的不足。利用全文搜索引擎ES(Elasticsearch)为HBase构建二级索引来将索引和数据分离,借助ES完善的检索服务来实现用户多样化的查询。同时,为了给用户提供实时的检索服务,本文利用HBase的协处理器来将前面分离的数据与索引同步更新。目前数据库中已有千万级的职位数据并还在持续增长中,存储在HBase集群上的海量职位数据还可以用于大数据分析等领域。本文结合分布式爬虫框架、非关系型数据库HBase和全文搜索框架ES设计并实现了一个招聘信息垂直搜索引擎系统,给用户提供全文检索和高级检索两种方式来满足用户的不同检索需求,并提供数据可视化分析功能来帮助用户了解当前的招聘环境,提升用户的交互体验。通过功能测试和性能测试,该垂直搜索引擎可以提供多样化的查询服务和毫秒级别的响应时间。同时,系统的集群服务保证了系统具有良好的扩展性和较高的吞吐率。

陶林[6](2020)在《基于ElasticSearch与聚合支付的分布式电商平台的设计与实现》文中认为近年来,随着互联网技术的发展,电商行业应运而生,彻底改变了传统的购物方式。但是,随着业务规模的不断扩大,业务逻辑错综复杂,功能之间耦合严重,开发运维成本也与日俱增;同时,商品信息量也呈爆发式增长,传统商品搜索过程效率低下,急需一种电商垂直领域专用搜索引擎;其次,随着第三方支付渠道的不断增多,如支付宝、微信、银联等,传统支付系统支付渠道接入复杂且可扩展性差。针对如何实现业务解耦合提高业务可伸缩性、如何高效精确的获取到用户想要的商品信息、如何集成简单易用的支付系统等问题,本文设计并实现了一种基于ElasticSearch与聚合支付的分布式电商平台,具体如下:首先,构建一个分布式电商平台。首先,使用Dubbo微服务框架搭建分布式架构,使用Zookeeper实现服务注册与发现,使用Dubbo-admin构建服务监控中心;其次,使用Java Web后端技术实现后台业务的开发,使用Mysql创建数据库系统,使用Maven项目管理工具进行项目管理;然后,使用Vue框架搭建前后端分离架构,使用Java Web前端技术开发前端页面。其次,设计并实现了一种电商垂直搜索引擎。首先,利用ElasticSearch构建分布式搜索引擎集群;其次,利用Kibana可视化设计工具根据搜索业务需求设计并创建搜索引擎数据结构,使用IK中文分词算法实现文本分词计算;然后,利用倒排索引算法、相关性匹配算分以及聚合分析等设计了一种电商垂直搜索引擎,实现全文检索、分类查询、聚合搜索以及排序推荐等功能。然后,设计并实现了一种多通道聚合支付。首先,分析支付宝支付、微信支付、银联支付等主流第三方支付工具的接入原理;其次,构建聚合支付数据库表结构,利用策略设计模式、工厂设计模式、模板方法设计模式以及反射机制对第三方支付渠道进行了融合设计;然后,对高并发时分布式事务问题进行了研究和设计,实现了一种安全可靠的多通道聚合支付。最后,进行了完整的系统测试与分析。测试数据与预期吻合,系统各功能模块均已实现,电商垂直搜索引擎高效精确,聚合支付系统安全可靠,业务的可扩展性显着增强,开发运维效率显着提高,系统高并发性能良好,系统运行稳定流畅,能为用户提供良好的购物体验。

艾磊[7](2020)在《基于语句级表征的代码片段推荐方法研究》文中进行了进一步梳理代码片段推荐是一种以代码片段为推荐目标的代码推荐方法。由于代码片段推荐能够提高软件开发的效率和质量,其成为了软件工程领域研究者与实践者关注的热点。代码片段推荐按照应用场景的不同,可分为无查询代码片段推荐和有查询代码片段推荐,这两类方法分别使用编程上下文和自然语言查询作为输入,在开发过程的不同阶段,针对不同的需求为开发者提供支持。现有工作通常将代码片段视为文本或结构数据在标识符级别对其进行处理,从中抽取关注的特征信息实现代码片段的表征;然后使用信息检索、机器学习和启发式规则根据其输入进行检索,形成推荐列表。然而现有工作中存在对代码片段语义信息使用不够充分,并且不能较好地解决编程风格差异、弥补自然语言与代码语言之间存在的语义鸿沟等问题,从而导致推荐精度不高,推荐结果的实用效果不佳。这些问题限制了代码片段推荐方法在实际工程环境中的推广和使用。针对上述问题,本文开展了以下研究:(1)提出了基于语句级表征方法的代码片段推荐框架,对代码片段推荐流程和研究框架进行了定义。该框架针对代码片段表征中语义和序列信息使用不充分的问题,提出了语句级代码片段表征方法,实现代码语句级别的代码片段表征,为代码片段推荐方法提供了支撑。(2)面向无查询代码片段推荐场景,提出了基于序列匹配的代码片段推荐方法。该方法以编程上下文为输入,在推荐过程中使用语句级代码片段表征方法进行数据表征,并采用序列匹配算法作为推荐的核心算法,充分利用了代码片段的语句序列信息和结构信息,提高了代码片段推荐的精度,并优化了排序效果。(3)面向有查询代码片段推荐场景,提出了基于联合嵌入的代码片段推荐方法。该方法以自然语言查询为输入,在推荐过程中使用语句级代码片段表征方法和联合嵌入技术将代码片段和自然语言在保持语义相关性的情况下映射到同一向量空间,在一定程度上弥补了自然语言和代码语言之间存在的语义鸿沟,提高了代码片段推荐的精度,并优化了排序效果。(4)设计并实现了结合上述两种代码片段推荐算法的原型工具。该工具以插件形式嵌入开发者编程环境中,能够在多种情境下为开发者提供高质量的代码片段,并且为开发者提供了友好的用户接口和功能。最后验证了工具的实用性,并展示了工具的使用方法和功能。

朱琳[8](2020)在《发现系统在汽车售后服务中的应用》文中研究说明随着我国经济生活水平的提高和交通运输需求的增长,汽车行业发展势头迅猛。发现系统作为一种应用广泛的资源检索系统,在多个领域的资源管理方面应用较为成熟,汽车行业发现系统的相关研究仍处于起步阶段,汽车发现系统尚未在市场中有所应用。本文研究了发现系统在汽车售后服务中的应用,为汽车企业的战略决策提供数据基础,为汽车售后服务信息化管理提供技术支撑,为提高用户体验提供通道和平台。本文首先梳理了MySQL数据库技术和JAVA EE软件开发工具的研究现状以及在汽车发现系统开发设计中的应用;其次,进行了汽车服务系统需求分析,在系统梳理国内汽车售后服务的基本现状、存在问题和售后服务的业务流程的基础上,从系统管理人员、员工和客户三个方面分析其对汽车发现系统的功能需求,进而设计系统功能用例并进行可行性分析;再次,设计基于移动互联技术的汽车服务发现系统,包括结构设计和功能设计两部分;最后,设计了该汽车服务软件系统的数据库。论文可为我国汽车售后服务信息化体系建设提供借鉴和参考。

刘博鸿[9](2019)在《面向开源复用的代码自动摘要与检索技术研究与实现》文中研究指明近年来,随着开源生态的迅速发展,积累了大量的开源软件资源。在这些数目庞大的软件资源中,不乏质量很高的代码片段,以及其衍生品,如代码摘要、文档等。这些高质量的资源具有丰富的价值。然而在海量的开源资源中,如何挖掘出这些高质量的开源资源,使其能够复用于未来的软件工程之中,仍然面临着许多挑战。本文认为面对大数据背景下的开源资源,需要从两个方面进行着手:理解代码与定位代码。因此,本文提出了进行了如下研究:1、基于抽象语法树的静态调用关系提取。一段代码的详细功能实现,与它和其它代码段之间的调用关系是密不可分的。而一个项目内的调用关系对于了解该项目的整体功能十分重要。因此,本文利用静态扫描的方法,在抽象语法树的基础上,设计了自动提取代码多层级调用关系的工具。同时,本文也对不同项目之间调用关系进行了统计分析,对Java项目中调用关系的特点进行了归纳总结。以此为基础,阐述了本文的调用关系序列如何助力于代码的理解。2、基于调用关系的代码摘要生成。大数据背景下的代码摘要生成技术,引入了机器学习和自然语言翻译的方法。该领域的最新研究,致力于通过解析代码的结构、语义特点,优化改进机器学习的翻译模型,以使其更契合于代码到摘要之间的转换。然而这些研究工作,仅考虑一段代码之内的特性,忽略了代码的调用关系。本文使用自身开发的调用关系提取工具,首次将代码的调用关系融入代码摘要生成方法之中。本文在大规模数据上进行了实验。在与目前代码摘要生成的最新研究成果的比较中,本文的方法使得代码摘要的生成效果获得了一定的提升。3、基于代码标签的代码检索技术。目前的代码检索领域中,基于机器学习技术的代码语义检索引擎获得了较大的成功。本文借鉴代码摘要生成模型的思路,以代码语义检索为目标,设计了代码标签生成模型。实验表明,代码的标签作为代码语义的关键词,具有较高的生成准确率。以代码标签为中介的检索引擎与现今前沿的代码语义检索引擎进行了对比,结果显示本文的方法具有较高的检索准确率。综上所述,基于抽象语法树的静态调用关系提取工具和利用该工具提取的信息进行研究的基于调用关系的代码摘要生成模型,能够助力于开发者对代码的理解。同时基于代码标签的代码检索技术有助于解决代码的定位问题。

李晓晨[10](2019)在《软件Bug的报告生成与理解》文中指出软件bug管理是开发和维护软件系统的核心工作之一。为提升软件bug的管理效率,软件公司通常采用bug仓库统一记录和处理软件bug。结合bug仓库,已有研究尝试将bug处理流程自动化,如自动生成测试脚本检测bug、自动分派和定位bug报告。尽管如此,在软件bug的报告生成与理解方面仍有许多问题亟待解决,主要包括如何自动分析软件测试失败脚本以撰写bug报告,以及如何理解bug报告内容以修复软件bug。围绕上述问题,本文研究三方面内容,分别是bug报告的生成(系统集成测试bug形成原因分类),bug报告内容理解(基于众包的有监督bug报告摘要、基于深度学习的无监督bug报告摘要),bug报告关联资源理解(基于词嵌入的bug报告关联资源推荐)。(1)提出系统集成测试bug分类算法。在软件测试过程中,测试人员通常需分析执行失败的测试脚本以找到bug产生的原因,进而准确提交bug报告。为提升测试人员撰写bug报告的效率,本部分研究利用测试脚本所关联的测试日志,自动分类测试脚本执行失败的原因。实验表明算法可应用于工业生产环境并提升测试脚本分析的准确率。(2)提出基于众包的有监督bug报告摘要算法。Bug报告摘要是帮助开发人员高效理解bug报告内容的重要手段,基于摘要结果,开发人员可以在减少阅读量的同时快速理解bug报告的主旨。本部分研究利用众包的方式招募志愿者人工完成bug报告摘要任务,通过分析志愿者选择摘要句的原因,并结合启发式构建规则构造领域特征。实践表明,利用上述方法构建的特征可直接提升bug报告摘要任务的效果。(3)提出基于深度学习的无监督bug报告摘要算法。监督学习算法的效果往往受标注数据的影响,为了缓解该影响,本部分研究结合bug报告的领域特征,设计步进式自编码网络,以无监督的方式对bug报告进行摘要。实验对典型bug仓库中的bug报告进行摘要,结果显示该算法显着超过对比算法,可解决无标注数据下的bug报告摘要问题。(4)提出基于词嵌入的bug报告关联资源推荐算法。开发人员根据bug报告所描述的需求编写软件代码,为了更好的理解bug维护需求,本部分研究根据bug的维护需求推荐相关的软件资源,包括API和API文档,进而帮助开发人员从代码的角度理解bug报告。该算法利用词嵌入技术将自然语言和代码中API进行统一向量表示,根据向量检索与bug维护需求语义相关的软件资源,利用这些资源辅助开发人员理解bug报告。本文对软件bug的报告生成与理解进行分析,以提升提交软件bug报告和理解软件bug的效率。同时本文提出的基于众包的特征构建方法可扩展解决软件工程其它问题。

二、基于InternetGIS数据检索工具的设计及JAVA实现(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于InternetGIS数据检索工具的设计及JAVA实现(论文提纲范文)

(1)茶树转录组组装评估与多组学生物信息平台开发(论文提纲范文)

致谢
摘要
ABSTRACT
第一章 文献综述
    1.1 茶树概述
    1.2 转录组测序
        1.2.1 转录组测序技术
        1.2.2 转录组组装研究进展
    1.3 茶树转录组的研究进展
    1.4 植物基因组数据库研究现状
        1.4.1 植物基因组数据库
        1.4.2 茶树数据库建设现状
    1.5 研究目的及意义
    1.6 技术路线
第二章 茶树转录组组装
    引言
    2.1 材料与方法
        2.1.1 数据的获取
        2.1.2 茶树转录组组装方法
    2.2 研究结果
        2.2.1 茶树转录组组装最优化工具研究
        2.2.2 茶树转录组组装最优化数据量研究
    2.3 小结与讨论
第三章 茶树基因组生物信息学平台的构建与应用
    引言
    3.1 材料与方法
        3.1.1 数据材料
        3.1.2 方法
    3.2 研究结果
        3.2.1 茶树基因组注释优化
        3.2.2 茶树基因组数据库的构建
        3.2.3 生物信息学分析工具集成与应用
        3.2.4 利用TPIA数据研究茶组植物的化学进化模式
    3.3 小结与讨论
第四章 结论与展望
    4.1 结论
    4.2 创新点
    4.3 展望
参考文献
附录A 附图
附录B 附表
作者简介

(2)基于元搜索引擎的排序算法研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 研究现状
    1.3 本文研究内容
    1.4 本文组织结构
第二章 元搜索引擎相关理论技术研究
    2.1 搜索引擎概述
        2.1.1 搜索引擎的发展
        2.1.2 搜索引擎的技术架构
        2.1.3 搜索引擎存在的问题
    2.2 元搜索引擎概述
        2.2.1 元搜索引擎的原理
        2.2.2 元搜索引擎的分类
        2.2.3 元搜索引擎和搜索引擎的区别
    2.3 搜索质量评价技术
        2.3.1 Cranfield评价体系
        2.3.2 评价指标
    2.4 本章小结
第三章 基于网页信息质量评价模型的排序算法
    3.1 网页信息质量评价模型
        3.1.1 相关定义
        3.1.2 网页信息质量评价框架
    3.2 基于网页信息质量评价模型的排序算法
        3.2.1 数据清洗预处理
        3.2.2 指标计算方法
        3.2.3 网页信息质量评价算法
    3.3 实验和分析
        3.3.1 实验数据和评价标准
        3.3.2 权重确定
        3.3.3 实验设计与实验结果
        3.3.4 实验分析
    3.4 本章小结
第四章 融合网页正文关键词信息评价模型的排序算法
    4.1 网页正文关键词信息评价模型
        4.1.1 相关定义
        4.1.2 方法框架
    4.2 融合网页正文关键词信息评价模型的排序算法
        4.2.1 网页正文的获取方法
        4.2.2 动态页面正文抽取
        4.2.3 正文关键词提取算法
        4.2.4 网页正文关键词信息评价算法
    4.3 实验和分析
        4.3.1 实验数据和评价标准
        4.3.2 实验设计与实验结果
        4.3.3 实验分析
    4.4 本章小结
第五章 原型系统设计与实现
    5.1 系统开发环境
    5.2 系统流程
    5.3 相关技术
        5.3.1 网络爬虫技术
        5.3.2 分词技术
        5.3.3 服务器端动态网页开发技术
    5.4 系统整体框架
        5.4.1 用户接口模块
        5.4.2 检索请求模块
        5.4.3 成员搜索引擎调度模块
        5.4.4 结果处理模块
    5.5 系统功能与展示
        5.5.1 数据集成功能
        5.5.2 信息查询与推荐功能
        5.5.3 系统界面
        5.5.4 查询结果展示
    5.6 本章小结
第六章 工作总结与展望
    6.1 研究成果总结
    6.2 未来工作展望
参考文献
在学期间取得的科研成果和科研情况说明
致谢

(3)基于倒排索引的多关键词并行密文检索系统设计与实现(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 云计算与云安全
        1.2.2 可搜索加密技术
    1.3 论文结构
第二章 相关背景知识介绍
    2.1 云计算
        2.1.1 云计算定义
        2.1.2 云计算特征
        2.1.3 云计算服务模式
        2.1.4 云计算部署模型
    2.2 云安全
        2.2.1 云安全威胁
        2.2.2 云安全架构
        2.2.3 云安全关键技术
    2.3 可搜索加密扩展
        2.3.1 可搜索加密架构
        2.3.2 可搜索加密应用场景
        2.3.3 数据共享场景下的相关问题分析
    2.4 本章小结
第三章 Hadoop与 Luence技术介绍
    3.1 Hadoop
        3.1.1 HDFS
        3.1.2 Map Reduce
    3.2 倒排索引
        3.2.1 倒排索引定义与结构
        3.2.2 Luence
    3.3 本章小结
第四章 并行密文检索系统需求分析
    4.1 系统目标设计
    4.2 系统需求分析
        4.2.1 系统功能性需求
        4.2.2 系统非功能性需求
    4.3 系统动态建模
        4.3.1 系统基本模型
        4.3.2 系统数据流向
    4.4 本章小结
第五章 并行密文检索系统详细设计
    5.1 体系结构
    5.2 系统初始化
    5.3 密文倒排索引
        5.3.1 密文倒排索引
        5.3.2 密文倒排索引的构建
        5.3.3 并行密文倒排索引
    5.4 相关模块设计
        5.4.1 索引切分模块
        5.4.2 加密模块
        5.4.3 密钥管理模块
        5.4.4 用户管理模块
        5.4.5 人机交互模块
    5.5 多关键词并行检索方案
        5.5.1 并行检索模型
        5.5.2 多关键词并行检索模型
    5.6 方案安全性分析
    5.7 本章小结
第六章 并行密文检索系统实现与测试
    6.1 IKAnalyzer
    6.2 Swing
    6.3 系统实现
        6.3.1 系统实现环境
        6.3.2 密文索引构建模块
        6.3.3 加解密模块
        6.3.4 密钥管理模块
        6.3.5 用户管理模块
        6.3.6 人机交互功能模块
    6.4 系统测试
        6.4.1 测试环境
        6.4.2 密文索引构建性能
        6.4.3 密文检索时间性能
    6.5 本章小结
第七章 总结与展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间申请的专利
附录3 攻读硕士学位期间参加的科研项目
致谢

(4)企业知识分享平台的设计与实现(论文提纲范文)

致谢
摘要
ABSTRACT
1 引言
    1.1 论文背景
    1.2 项目目标
    1.3 关键问题
    1.4 论文主要工作
    1.5 本章小结
2 企业知识分享平台相关技术
    2.1 MVC模式
    2.2 轻量级SSM开源框架
        2.2.1 Spring MVC
        2.2.2 Mybatis
        2.2.3 Spring
    2.3 JavaEE
        2.3.1 Java Servlet
        2.3.2 JavaMail
    2.4 Redis
    2.5 Web Magic
    2.6 Mahout
    2.7 Solr
    2.8 数据库
    2.9 Ajax技术
    2.10 平台选择
    2.11 本章小结
3 企业知识分享平台需求分析
    3.1 可行性分析
        3.1.1 技术可行性
        3.1.2 经济可行性
        3.1.3 操作可行性
    3.2 总体需求描述
    3.3 业务需求分析
    3.4 功能需求分析
        3.4.1 平台子系统划分
        3.4.2 系统功能用例分析
        3.4.3 子系统主要功能
    3.5 系统非功能性需求分析
        3.5.1 安全性需求
        3.5.2 性能需求
    3.6 本章小结
4 企业知识分享平台架构设计
    4.1 系统总体架构设计
        4.1.1 系统技术路线
        4.1.2 系统业务逻辑架构设计
        4.1.3 系统技术架构设计
    4.2 系统功能模块设计
    4.3 数据库设计
        4.3.1 数据库概念设计
        4.3.2 数据库逻辑模型设计
    4.4 本章小结
5 企业知识分享平台功能详细设计及实现
    5.1 开发运行环境
    5.2 持久层的实现
        5.2.1 Mybatis配置
        5.2.2 创建持久化类
        5.2.3 对象关系映射的实现
        5.2.4 关键技术实现
    5.3 业务逻辑层的实现
        5.3.1 Java Bean技术应用
        5.3.2 事务管理
        5.3.3 日志管理
        5.3.4 定时任务
    5.4 登录注册模块
        5.4.1 流程设计
        5.4.2 时序设计
        5.4.3 登录注册类设计
        5.4.4 关键技术实现
    5.5 应用/资讯源模块
        5.5.1 应用
        5.5.2 资讯源
    5.6 知识管理模块
        5.6.1 知识组织
        5.6.2 知识分类
        5.6.3 知识审批
        5.6.4 知识应用
    5.7 专家任务处理模块
        5.7.1 专家任务处理流程图
        5.7.2 专家任务处理时序设计
        5.7.3 专家任务处理类设计
    5.8 系统管理模块
    5.9 本章小结
6 企业知识分享平台系统测试
    6.1 测试环境
    6.2 功能测试
    6.3 性能测试
    6.4 验证性结果分析
7 结论与展望
    7.1 项目结论
    7.2 未来展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集

(5)招聘信息垂直搜索引擎的设计与实现(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
    1.3 主要内容和结构安排
第2章 垂直搜索引擎相关技术
    2.1 搜索引擎技术架构
    2.2 网络爬虫
        2.2.1 通用网络爬虫
        2.2.2 分布式网络爬虫
        2.2.3 爬虫框架Scrapy-Redis
    2.3 海量数据存储
        2.3.1 Hadoop概述
        2.3.2 非关系型数据库HBase
        2.3.3 HBase协处理框架
    2.4 索引技术
        2.4.1 全文检索工具库Lucene
        2.4.2 分布式搜索引擎ES
        2.4.3 Lucene索引与数据库索引
    2.5 ECharts数据可视化
    2.6 本章小结
第3章 系统需求分析与设计
    3.1 需求分析
        3.1.1 需求背景
        3.1.2 系统目标
        3.1.3 功能需求
        3.1.4 非功能需求
    3.2 系统总体设计
        3.2.1 系统总体架构
        3.2.2 系统总体功能设计
        3.2.3 系统体系结构
    3.3 数据采集模块的设计
        3.3.1 网页抓取的设计
        3.3.2 URL任务分发的设计
        3.3.3 URL去重的设计
    3.4 信息抽取模块的设计
    3.5 存储模块的设计
    3.6 索引模块的设计
        3.6.1 索引构建
        3.6.2 索引与数据同步的设计
    3.7 检索模块的设计
    3.8 数据分析展示模块的设计
    3.9 本章小结
第4章 系统实现
    4.1 数据采集模块的实现
        4.1.1 网页抓取的实现
        4.1.2 URL任务分发的实现
        4.1.3 URL去重的实现
    4.2 信息抽取模块的实现
    4.3 存储模块的实现
        4.3.1 数据存储
        4.3.2 数据去重
    4.4 索引模块的实现
        4.4.1 索引构建
        4.4.2 索引与数据同步的实现
    4.5 检索模块的实现
        4.5.1 服务端检索实现
        4.5.2 检索前端界面实现
    4.6 数据分析展示模块的实现
    4.7 本章小结
第5章 系统开发环境与测试
    5.1 开发环境及配置
        5.1.1 Hadoop集群
        5.1.2 HBase集群
        5.1.3 ES集群
    5.2 功能测试
    5.3 性能测试
    5.4 本章小结
总结与展望
致谢
参考文献

(6)基于ElasticSearch与聚合支付的分布式电商平台的设计与实现(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 主要研究内容
    1.4 论文结构安排
2 ElasticSearch与聚合支付及分布式电商平台相关技术
    2.1 Java Web相关技术
        2.1.1 前端相关技术
        2.1.2 后端相关技术
    2.2 分布式相关技术
        2.2.1 Zookeeper
        2.2.2 Dubbo
    2.3 ElasticSearch相关技术
        2.3.1 倒排索引算法
        2.3.2 TF-IDF算法
        2.3.3 BM25算法
    2.4 聚合支付相关技术
        2.4.1 第三方支付
        2.4.2 设计模式
    2.5 本章小结
3 基于ElasticSearch与聚合支付的分布式电商平台总体设计
    3.1 系统总体需求分析
    3.2 系统总体架构设计
    3.3 搜索引擎总体功能设计
    3.4 聚合支付总体功能设计
    3.5 高可用的分析与设计
        3.5.1 缓存与分布式锁算法设计
        3.5.2 分布式文件存储设计
    3.6 数据库设计
        3.6.1 概念结构分析
        3.6.2 数据表设计
    3.7 本章小结
4 一种基于ElasticSearch的电商垂直搜索引擎的分析与设计
    4.1 基于ElasticSearch的电商垂直搜索引擎相关算法分析
        4.1.1 中文分词计算
        4.1.2 倒排索引算法
        4.1.3 相关性匹配算分
        4.1.4 聚合分析
    4.2 基于ElasticSearch的电商垂直搜索引擎设计
        4.2.1 搜索引擎分布式集群设计
        4.2.2 搜索引擎数据结构的设计
        4.2.3 搜索引擎搜索算法的设计
    4.3 本章小结
5 一种多通道聚合支付的分析与设计
    5.1 多支付通道融合算法设计
        5.1.1 第三方支付通道接入分析
        5.1.2 多支付通道融合算法设计
    5.2 分布式事务的研究与设计
        5.2.1 分布式事务问题研究
        5.2.2 分布式事务业务设计
    5.3 本章小结
6 基于ElasticSearch与聚合支付的分布式电商平台实现与测试
    6.1 电商平台环境搭建部署
    6.2 电商平台前台功能实现
        6.2.1 前台首页
        6.2.2 SSO单点登录模块
        6.2.3 社交登录模块
        6.2.4 商品详情模块
        6.2.5 购物车模块
        6.2.6 订单结算模块
        6.2.7 搜索引擎模块
        6.2.8 聚合支付模块
    6.3 电商平台后台管理功能实现
        6.3.1 登录认证模块
        6.3.2 后台主页
        6.3.3 基本信息管理模块
        6.3.4 商品信息管理模块
    6.4 系统测试与分析
        6.4.1 系统整体测试环境
        6.4.2 分布式电商平台的测试与分析
        6.4.3 电商垂直搜索引擎的测试与分析
        6.4.4 多通道聚合支付的测试与分析
    6.5 本章小结
7 总结与展望
    7.1 总结
    7.2 展望
参考文献
攻读硕士期间发表的论文
致谢

(7)基于语句级表征的代码片段推荐方法研究(论文提纲范文)

摘要
abstract
缩略词
第一章 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 无查询代码片段推荐相关研究现状
        1.2.2 有查询代码片段推荐相关研究现状
        1.2.3 选题依据
    1.3 论文结构
第二章 语句级代码片段表征方法及相关技术
    2.1 程序分析相关技术
        2.1.1 程序分析概述
        2.1.2 抽象语法树
    2.2 信息检索相关技术
        2.2.1 信息检索概述
        2.2.2 序列匹配算法
        2.2.3 Elastic Search
    2.3 机器学习相关技术
        2.3.1 机器学习概述
        2.3.2 嵌入技术
    2.4 基于语句级表征的代码片段推荐框架
        2.4.1 语句级代码片段表征方法
        2.4.2 代码片段推荐框架
    2.5 本章小结
第三章 无查询场景下基于序列匹配的代码片段推荐方法
    3.1 基于序列匹配的代码片段推荐框架
    3.2 基于序列匹配的代码片段推荐方法
        3.2.1 数据收集
        3.2.2 数据处理
        3.2.3 推荐算法
    3.3 实验设计及结果分析
        3.3.1 实验设计
        3.3.2 实验结果分析
    3.4 本章小结
第四章 有查询场景下基于联合嵌入的代码片段推荐方法
    4.1 基于联合嵌入的代码片段推荐框架
    4.2 基于联合嵌入的代码片段推荐方法
        4.2.1 数据处理
        4.2.2 模型构建及训练
        4.2.3 推荐算法
    4.3 实验设计及结果分析
        4.3.1 实验设计
        4.3.2 实验结果分析
    4.4 本章小结
第五章 原型工具实现与分析
    5.1 应用场景
    5.2 原型工具设计与实现
        5.2.1 工具框架
        5.2.2 工具设计与实现
    5.3 工具实验与展示
        5.3.1 实用性实验
        5.3.2 界面展示
    5.4 本章小结
第六章 总结与展望
    6.1 论文工作总结
    6.2 未来研究展望
参考文献
致谢
在学期间的研究成果及发表的学术论文

(8)发现系统在汽车售后服务中的应用(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究现状
        1.3.1 发现系统研究现状
        1.3.2 汽车服务发现系统研究现状
        1.3.3 汽车服务软件平台开发与应用现状
    1.4 研究内容与方法
        1.4.1 研究内容
        1.4.2 研究方法
        1.4.3 技术路线
第2章 汽车发现系统相关技术分析
    2.1 MySQL数据库技术
        2.1.1 MySQL数据库技术概述
        2.1.2 MySQL数据库技术应用
        2.1.3 MySQL数据库技术优势
    2.2 JAVA EE软件开发工具
        2.2.1 Java EE技术概述
        2.2.2 系统技术框架
        2.2.3 Java EE技术优势
第3章 汽车发现系统需求分析
    3.1 汽车售后服务的基本现状和存在的问题
        3.1.1 汽车售后服务的基本现状
        3.1.2 汽车售后服务存在的问题
    3.2 汽车售后服务的业务流程
    3.3 汽车服务发现系统的功能需求
        3.3.1 系统管理人员的功能需求
        3.3.2 员工的功能需求
        3.3.3 客户的功能需求
    3.4 汽车发现系统设计可行性分析
        3.4.1 经济可行性分析
        3.4.2 技术可行性分析
        3.4.3 组织可行性分析
第4章 基于JAVA EE和 My SQL数据库的汽车服务发现系统设计
    4.1 汽车服务发现系统设计原则
    4.2 汽车服务发现系统结构设计
    4.3 基于JAVA EE软件开发工具的汽车服务发现系统功能详细设计
        4.3.1 系统管理模块详细设计
        4.3.2 客户管理模块详细设计
        4.3.3 预约服务模块详细设计
        4.3.4 订单管理模块详细设计
        4.3.5 派工管理模块详细设计
        4.3.6 配件管理模块详细设计
        4.3.7 报价管理模块详细设计
        4.3.8 服务评价模块详细设计
    4.4 My SQL数据库设计
        4.4.1 数据库设计原则
        4.4.2 数据库概念设计及E-R图
        4.4.3 数据库逻辑设计
        4.4.4 数据库物理设计
第5章 研究结论与展望
    5.1 研究总结
    5.2 不足与展望
参考文献
致谢

(9)面向开源复用的代码自动摘要与检索技术研究与实现(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
        1.1.1 开源的发展
        1.1.2 软件资源复用
    1.2 相关研究现状
        1.2.1 自然语言与代码
        1.2.2 代码自动摘要
        1.2.3 代码检索
    1.3 本文主要工作
        1.3.1 本文主要内容和贡献
        1.3.2 本文的组织结构
第二章 基于抽象语法树的静态调用关系提取
    2.1 引言
    2.2 相关工作
    2.3 研究思路
    2.4 调用关系的抽取算法
    2.5 实验设计与结果分析
        2.5.1 实验设置
        2.5.2 Java项目中调用关系的特点
        2.5.3 调用关系对理解项目内代码的帮助
    2.6 效度分析
    2.7 本章小结
第三章 基于调用关系的代码摘要生成
    3.1 引言
    3.2 相关工作
    3.3 研究思路
    3.4 基于调用关系的代码摘要生成
        3.4.1 总体方法框架
        3.4.2 CallNN代码摘要生成模型
    3.5 实验设计与结果分析
        3.5.1 数据集
        3.5.2 评价指标
        3.5.3 代码摘要生成效果
    3.6 效度分析
        3.6.1 嵌入向量分析
        3.6.2 调用关系序列的注意力权重
    3.7 本章小结
第四章 基于代码标签的代码检索技术
    4.1 引言
    4.2 相关工作
    4.3 研究思路
    4.4 基于代码标签的检索模型
        4.4.1 代码标签生成模型
        4.4.2 自然语言向量化模型
        4.4.3 高维空间向量索引
    4.5 实验设计与结果分析
        4.5.1 数据整理
        4.5.2 实验设置
        4.5.3 基于代码标签的代码检索结果
    4.6 效度分析
    4.7 本章小结
第五章 总结与展望
    5.1 工作总结
    5.2 工作展望
致谢
参考文献
作者在学期间取得的学术成果

(10)软件Bug的报告生成与理解(论文提纲范文)

摘要
ABSTRACT
1 绪论
    1.1 研究背景与意义
    1.2 相关研究进展
        1.2.1 软件测试Bug形成原因分析
        1.2.2 Bug报告特征构建与摘要
        1.2.3 面向Bug维护需求的资源推荐
    1.3 主要研究思路
        1.3.1 Bug报告生成
        1.3.2 Bug报告内容理解
        1.3.3 Bug报告关联资源理解
    1.4 本章小结
2 系统集成测试Bug形成原因分类
    2.1 概述
        2.1.1 系统集成测试过程
        2.1.2 测试日志
        2.1.3 问题定义
    2.2 算法设计
        2.2.1 测试日志预处理
        2.2.2 历史测试日志选择
        2.2.3 原因预测
        2.2.4 预测结果表示
    2.3 实验评估
        2.3.1 实验设计
        2.3.2 参数对算法的影响评估
        2.3.3 与对比算法比较
        2.3.4 历史测试日志选择模块对CAM的影响评估
        2.3.5 在真实开发环境下的性能评估
    2.4 讨论
    2.5 本章小结
3 基于众包的有监督Bug报告摘要
    3.1 概述
    3.2 特征构建动机
    3.3 基于众包的特征构建框架
    3.4 基于众包的bug报告摘要特征构建
        3.4.1 特征构建过程
        3.4.2 特征构建结果
    3.5 实验评估
        3.5.1 实验设置
        3.5.2 与对比算法比较
        3.5.3 志愿者人数对众包过程的影响
        3.5.4 众包志愿者质量分析
    3.6 讨论
    3.7 本章小结
4 基于深度学习的无监督Bug报告摘要
    4.1 概述
    4.2 无监督深度摘要框架
        4.2.1 Bug报告预处理
        4.2.2 无监督网络训练
        4.2.3 摘要生成
    4.3 实验评估
        4.3.1 实验设计
        4.3.2 参数影响分析
        4.3.3 模块影响分析
        4.3.4 单词权重设置策略影响分析
        4.3.5 与对比算法比较
    4.4 讨论
        4.4.1 摘要结果示例
        4.4.2 有效性讨论
    4.5 本章小结
5 基于词嵌入的Bug报告关联资源推荐
    5.1 概述
    5.2 词嵌入表示框架
        5.2.1 数据获取
        5.2.2 单词API序列构建
        5.2.3 训练集创建
        5.2.4 向量生成
    5.3 实验评估
        5.3.1 对比算法
        5.3.2 评价策略
        5.3.3 评价指标
        5.3.4 语义相关性度量性能分析
        5.3.5 主要参数影响
        5.3.6 混淆策略影响
    5.4 API序列资源推荐
        5.4.1 基于API的查询扩展算法
        5.4.2 基于API的查询扩展算法比较
        5.4.3 算法与通用搜索引擎比较
    5.5 API文档资源推荐
        5.5.1 API文档推荐算法
        5.5.2 与对比算法比较
    5.6 讨论
    5.7 本章小结
6 结论与展望
    6.1 工作小结
    6.2 创新点
    6.3 展望
参考文献
攻读博士学位期间科研项目及科研成果
致谢
作者简介

四、基于InternetGIS数据检索工具的设计及JAVA实现(论文参考文献)

  • [1]茶树转录组组装评估与多组学生物信息平台开发[D]. 李方东. 安徽农业大学, 2021(01)
  • [2]基于元搜索引擎的排序算法研究[D]. 叶云波. 天津理工大学, 2021(08)
  • [3]基于倒排索引的多关键词并行密文检索系统设计与实现[D]. 戴厚乐. 南京邮电大学, 2020(03)
  • [4]企业知识分享平台的设计与实现[D]. 胡屹强. 北京交通大学, 2020(03)
  • [5]招聘信息垂直搜索引擎的设计与实现[D]. 胡永奇. 西南交通大学, 2020(07)
  • [6]基于ElasticSearch与聚合支付的分布式电商平台的设计与实现[D]. 陶林. 华中师范大学, 2020(12)
  • [7]基于语句级表征的代码片段推荐方法研究[D]. 艾磊. 南京航空航天大学, 2020(07)
  • [8]发现系统在汽车售后服务中的应用[D]. 朱琳. 吉林大学, 2020(08)
  • [9]面向开源复用的代码自动摘要与检索技术研究与实现[D]. 刘博鸿. 国防科技大学, 2019(02)
  • [10]软件Bug的报告生成与理解[D]. 李晓晨. 大连理工大学, 2019(01)

标签:;  ;  ;  ;  ;  

基于InternetGIS的数据检索工具设计与JAVA实现
下载Doc文档

猜你喜欢