数据挖掘技术应用研究

数据挖掘技术应用研究

一、数据挖掘技术的应用研究(论文文献综述)

李娜[1](2022)在《数据挖掘技术在软件工程中的应用研究》文中指出随着计算机信息技术的快速发展,软件系统呈现复杂性,进而加剧系统软件开发复杂度,尤其是数据挖掘技术。在软件工程中应用数据挖掘技术,可以满足社会发展需求,处理好软件工程问题。在中注重分析软件工程问题,讨论数据挖掘技术的应用价值,仅供参考。

方丽[2](2021)在《基于需求分析的临床医疗数据挖掘人才胜任力研究》文中研究说明目的:目前,对临床医疗数据的数据挖掘研究所得到的分析模型往往不能满足临床实际需求,距离解决现实问题还有不小的差距。究其原因,多数研究是立足于可获得的数据而不是临床实际需求开展的,因此,如何面向临床实践需求开展数据挖掘是临床医疗数据挖掘研究需要解决的当务之急。面对这种当务之急,我们需要考虑的问题包括:临床医疗数据挖掘分析有哪些实际需求?基于这样的需求,开展临床数据挖掘研究的人员应该具有什么样的知识和技能?为解决上述问题,本研究采用文本挖掘和德尔菲法等方法,对临床医疗数据挖掘的需求和人才胜任力要素展开调查,希望为未来的临床医疗数据开发策略研究和人才培养提供理论依据,并从客观意义上推动临床医学的发展。研究方法:(1)临床医疗数据挖掘的需求分析文本挖掘:从PubMed数据库中检索临床医疗数据挖掘相关论文,抽取论文中有关临床医疗数据挖掘应用、目的和意图的主题词,根据主题词共现矩阵,运用双聚类算法自动聚类分析,得到通过文献形式表达出来的临床医疗数据挖掘现实需求,为后续临床医疗数据挖掘问题和需求的问卷调查编制提供依据。德尔菲法:根据文本挖掘提供的线索,在知识非常态理论框架下,结合数据挖掘过程模型,设计和构建临床医疗数据挖掘需求问卷,采用德尔菲法,将临床医疗数据挖掘需求问卷发放给临床医学、计算机、医学信息学和流行病学等领域中从事临床数据挖掘研究和管理工作的16名专家,经过2轮的问卷发放,专家的意见逐渐趋同,最终整理出临床医疗数据挖掘面临的问题、知识现状和需求。(2)临床医疗数据挖掘人才胜任力模型构建借鉴人才胜任力模型理念,以期通过提高临床医疗数据挖掘人员的个人能力及时发现临床医疗数据挖掘中的临床诊疗需求和临床管理需求,解决数据挖掘过程中由于知识和能力不匹配而导致的较多问题。根据冰山模型,将临床医疗数据挖掘人才胜任力分为冰山以下的内在素质部分和冰山以上的基本知识和技能部分,构建临床医疗数据挖掘人才胜任力一级指标和二级指标。将临床医疗数据挖掘人才胜任力问卷发放给16名临床医学、计算机、医学信息学和流行病学等领域方面的专家,经过2轮的问卷发放,根据均值、变异系数筛选优化各级指标,初步确立临床医疗数据挖掘人才胜任力评价模型。(3)模型实证研究以来自某医科大学附属一院和附属二院的46名从事临床医疗数据挖掘的研究人员为主要调查对象进行问卷调查,进行信度和效度检验,保证评价模型的可靠性和有效性。同时发现当前从事数据挖掘研究人员胜任力上的实际情况和影响因素。结果:(1)双聚类算法和德尔菲法发现临床医疗数据挖掘的需求运用双聚类算法提取和锚定了通过文献形式表达出来的一部分临床医疗数据挖掘现实需求,主要涵盖了临床诊疗相关需求,如在精准医学、疾病风险因素分析、药物不良事件监测、疾病预后、疾病诊断、疾病治疗和诊断影像学等方面的需求。德尔菲调查结果对临床医疗数据挖掘的现实需求进行了补充。德尔菲调查结果显示,临床医疗数据挖掘除了在临床诊疗方面表现出需求外,在临床管理方面也存在一定的需求,如再住院预测不良事件监测、临床路径优化、药物处方序列、医院感染预测、住院时间预测等。在知识非常态理论框架下,结合两轮德尔菲法专家调查结果,发现临床数据挖掘实践人员知识与其数据挖掘目的和意图之间存在着“鸿沟”,这种“鸿沟”具体表现为:由于数据挖掘知识和数据分析知识与目的意图的不匹配而导致的数据理解问题,尤其是数据具体价值认识不足问题;由于数据分析知识与目的意图的不匹配而导致的数据准备问题,尤其是数据预处理难和数据一致性检查难问题;由于跨学科知识和数据分析知识与目的意图的不匹配而导致的模型评价问题;临床医疗数据挖掘客观条件与目的意图的不匹配导致的数据获取问题,尤其是数据标准化程度低问题和因为隐私与安全要求导致数据获取难问题。“鸿沟”的存在反映了临床医疗数据挖掘的潜在需求,即临床数据挖掘应具备的知识和能力的需求和临床医疗数据挖掘客观条件的需求。(2)临床医疗数据挖掘人才胜任力模型本研究基于需求分析结果和冰山模型初步构建的临床医疗数据挖掘人才胜任力评价模型包括动机、个性和特质和知识技术能力三个维度,17个二级指标,在内容上既包括了综合知识、数据挖掘技能等显性要素,也包括了成就动机、个人品质等隐性要素。根据专家意见设立的各个指标的权重情况为动机权重0.122,个性和特质权重0.481,知识技术能力权重0.397,最终总结临床医疗数据挖掘人才胜任力模型为:胜任力=0.122*动机+0.481*个性和特质+0.397*知识技术能力。(3)临床医疗数据挖掘人才胜任力现状应用本研究构建的模型进行46名临床医疗数据挖掘人员评价,结果发现,被调查人员总体岗位胜任力得分为4.094±0.762,按量表等级(1-5分)水平,说明被调查对象的总体胜任力处于较高水平,在动机(4.488±0.763)、个性和特质(4.138±0.930)和知识技术能力(3.914±1.047)三个维度中,知识技术能力分数较低,值得研究者关注。评价指标中,兴趣、持续学习能力、数据素养在各维度中分数较高,其中兴趣和数据素养分数较高说明被调查的临床医疗数据挖掘人员在对自身的数据挖掘兴趣和数据素养方面较为自信,而在洞察临床问题能力上仍需加强。临床医疗数据挖掘人才胜任力会受到个人社会学特征的影响,单因素分析和多元线性回归分析结果表明,性别、年龄因素对临床医疗数据挖掘人才胜任力总分会产生显着的影响关系(p<0.05)。性别、年龄、工作年限、职称、学历等因素对临床医疗数据挖掘人才的动机方面影响不存在统计学意义(p>0.05);而性别、年龄因素对临床医疗数据挖掘人才的个性和特质得分产生显着的影响关系(p<0.05);性别因素对临床医疗数据挖掘人才在知识技术能力得分会产生显着的影响关系(p<0.05)。结论:(1)本研究将临床医疗数据挖掘研究的需求总结为3大类:(1)临床诊疗和临床管理的现实需求;(2)临床医疗数据挖掘应具备的知识和能力的需求;(3)临床医疗数据挖掘客观条件的需求。(2)本研究构建了包含3个核心维度,17个二级指标的临床医疗数据挖掘人才胜任力评价模型,信度效度较好,能够客观反映临床医疗数据挖掘人员胜任力要求。(3)实证研究发现,被调查临床医疗数据挖掘人员总体胜任力处于较高水平,在动机、个性和特质以及知识技术能力三个维度中,知识技术能力分数较低,因此,提升临床医疗数据挖掘人员胜任力的关键在于知识技术能力培训。此外,年龄和性别对临床医疗数据挖掘人才胜任力影响较大,可能会决定临床医疗数据挖掘人员的职业规划,即男性临床医疗数据挖掘人员可能更愿意长期从事临床数据挖掘研究工作,以期获取更高的胜任力和社会声誉。

李鑫[3](2021)在《铁路机车设备画像理论及关键技术研究》文中进行了进一步梳理铁路机务专业是铁路运输系统的重要行车专业,主要负责各型机车的运用组织、整备保养和综合检修。作为重要的铁路运输生产设备,机车的运输生产效率、设备质量状态、整备检修能力、安全管理水平等均会对铁路运输生产能力的稳健提升和经营管理工作的稳步发展产生重要影响。随着各种监测检测设备以及各类信息管理系统的广泛应用,围绕机车积累了形式多样的海量数据,数据增量及质量均大幅提升,数据价值日益体现,铁路行业对于完善机车健康管理的需求十分迫切。当前铁路机务专业在进行机车健康管理的过程中,存在分析方法较少、大数据挖掘不足、管理决策科学性较弱、综合分析平台缺失等问题。铁路机车设备画像理论及关键技术研究作为实现机车健康管理的重要手段,致力于加强机车数据资源的整合利用,通过客观、形象、科学的标签体系全面而精准地刻画机车的质量安全状态,并以此为基础深入挖掘潜藏的数据价值,实现机车事故故障关联分析、安全状态预警盯控、质量安全态势预测、检修养护差异化施修、稳健可靠管理决策等目的,支撑起铁路运输生产及质量安全管理工作的科学化、数字化、智能化发展。本文主要对铁路机车设备画像理论及其一系列关键技术进行了研究与应用,取得了以下创新成果:(1)提出了铁路机车设备画像理论。通过梳理机车设备画像的含义及研究意义,明确了构建铁路机车设备画像理论的必要性及其定位。基于此,给出铁路机车设备画像理论的定义与内涵,梳理了符合现阶段机车运输生产管理需要的铁路机车设备画像理论的构成,阐述了关键技术的研究方法及之间的逻辑关系。同时,设计相匹配的应用架构,介绍了其所包含的核心应用、赋能应用、总体目标等6个方面内容。这为系统性地开展机车健康管理相关研究提供了崭新的理论和方法支持。(2)构建了基于设备画像的铁路机车画像标签体系。通过整合利用机车多维度数据,提出了机车设备画像3级标签体系技术架构,全面分析所包含的数据采集层、标签库层和标签应用层,详细阐释各级标签的内容构成,形成机车画像标签体系的构建方法。针对聚类这一标签产生方式,改进K均值(K-means)聚类算法的初始质心选取方法,提高标签获取的精度和稳定性。通过在某铁路局开展机车设备画像实地应用研究,获得了客观、精准、完整、可靠的机车画像。(3)提出了基于Ms Eclat算法的铁路机车事故故障多最小支持度关联规则挖掘方法。针对机车事故故障在关联规则挖掘中具有不同支持度的特点,提出了改进的等价变换类(Eclat)算法——多最小支持度等价变换类(Ms Eclat)算法,以各项目的支持度值为排序依据重新构建数据集,进而运用垂直挖掘思想获得频繁项集;为了进一步提高Ms Eclat算法在大数据分析场景中的执行效率,将布尔矩阵和并行计算编程模型Map Reduce应用于算法的计算过程,得到优化的Ms Eclat算法,设计并阐述了相应的频繁项集挖掘步骤。通过比较,Ms Eclat算法及其优化算法在多最小支持度关联规则挖掘方面有着极大的计算效率优势。通过在某铁路局开展实际应用研究,验证了算法的有效性、高效性和准确性。(4)设计了基于时变概率的PSO+DE混合优化BP神经网络的机车质量安全态势预测模型。通过总结反向传播(BP)神经网络、粒子群优化(PSO)算法和差分进化(DE)算法的原理及优缺点,设计了基于时变概率且融入了防早熟机制的PSO+DE混合优化BP神经网络预测模型,详细阐释了这一预测模型的训练步骤。以某铁路局的机车质量评价办法为依托,选用灰色关联度分析方法选择出运用故障件数、碎修件数等7个评价项点,预测机车未来3个月的质量安全态势。经过实验对比,新提出的预测模型有着更好的收敛能力,对于机车质量评价等级预测及分值变化趋势预测的准确度分别可以达到98%和91%以上。最后开展了实际预测应用及分析,为科学把控机车质量安全态势提供了较好的技术方法。(5)设计了基于铁路机车设备画像理论的铁路机车健康管理应用。通过总结梳理铁路机车健康管理应用与铁路机车设备画像理论及机务大数据三者间的关系,设计了基于铁路机车设备画像理论的铁路机车健康管理应用的“N+1+3”总体架构及其技术架构。基于此,从设备、人员和综合管理3个方面介绍了机车运用组织、机车整备检修、辅助决策分析等7个典型应用场景,并特别给出这些场景的数据挖掘分析思路及框架,为铁路机车设备画像理论的扎实应用奠定了重要基础。最后,将本文所取得的相关研究成果在某铁路局开展实地的铁路机车健康管理应用实践,通过搭建人机友好的应用系统,完成一系列机务大数据挖掘分析算法模型的封装,实现了机车画像标签生成及设备画像分析、机车事故故障关联分析、机车质量评价分析、机车质量安全态势预测分析等多项功能。通过实际的工程应用,实现了铁路机车设备画像理论及其关键技术的创新实践,取得了良好的效果。全文共有图56幅,表21个,参考文献267篇。

孙阳[4](2021)在《基于数据挖掘的A企业内部审计信息化研究》文中研究表明

李昊宇[5](2021)在《数据挖掘技术在A企业招标审计中的应用研究》文中研究表明

刘梦柳[6](2021)在《基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析》文中认为目的:建立《伤寒杂病论》麻黄-石膏的证-方-药关联规则网络模型,结合中医药专业理论知识分析出麻黄-石膏间的相关规律,为系统研究《伤寒论》等经典古籍提供新思路,最终真正实现中医经典方剂的数据化、可视化。方法:本研究首先对《伤寒杂病论》含麻黄、石膏的原文按方剂、中药、症状进行规范化处理,之后统计相应的频次、频率,并录入Microsoft Excel软件建立原始数据库;继而采用IBM SPSS Modeler 18.0软件包初步构建关联规则图;再用IBM SPSS Statistics 22.0软件绘制聚类分析图;之后依据置信度、支持度提取相关数据,最后依据所制图表结合相关中医专业知识将数学语言转换为中医专业语言并分析、归纳、总结其中隐藏的规律与关系。结果:(1)涉及麻黄、石膏的方剂中,使用最多的中药是甘草,麻黄汤、白虎加人参汤是使用最多的方子,常见药对是甘草-生姜-大枣。方剂主要分布在太阳病篇,除少阳经、太阴经外均有涉及,既重视六经辨证又采用脏腑经络辨证,太阳病的证治以伤寒、中风、风温分类,太阳主证用麻黄汤,兼证经气不利用葛根汤、兼有饮证用小青龙汤,变为肺热证时用麻黄杏仁甘草石膏汤等。(2)高频次、多链接的症状为脉浮、发热、汗出、喘、口渴,可作为一个症候群起到诊断与鉴别诊断的作用。脉浮、发热、汗出可辨为太阳伤寒,审证用方选麻黄汤,无汗时则是太阳中风,方证结合则用桂枝汤;仲景对于疾病的诊断注重色脉,对于色脉的掌握是很精到的:察色有“面色反有热色”、“面色缘缘正赤者”、“一身面目悉黄”、“黧黑”等,既描述了面色,又凸出了特点;诊脉,脉浮、脉浮紧、脉浮缓、脉浮滑,脉沉、脉沉迟等,体现了其重脉思想。结论:本次研究采用关联规则、聚类分析和频次、频率统计工具与方法,对《伤寒杂病论》涉及麻黄、石膏的原文从方剂、中药、症状等方面进行专业知识的梳理总结,分析得出证-方-药间的规律与复杂关系。本研究所展示的结果为:应用数据挖掘得到的关联规则网络与模型,其呈现的图形清晰、直观,有良好的具体化、可视化效果,实现了由点带面对《伤寒杂病论》辨证、遣方、用药规律的探索与解释。对精研张仲景辨证求因、审因论治、方证相合等规律有重要意义,同时也可指导后世流派,数据挖掘技术是系统研究《伤寒杂病论》相对科学而行之有效的工具。

邓晶艳[7](2021)在《基于大数据的大学生日常思想政治教育创新研究》文中认为中国特色社会主义进入新时代,标定了大学生日常思想政治教育的新方位。面对新时代提出的新任务与新要求,大学生日常思想政治教育要不断探索新思路、新路径与新方法,进一步增强工作的针对性与实效性,以满足大学生成长成才需求以及党和国家事业发展需要。当前,随着移动互联网、物联网、云计算、人工智能等为代表的新一代网络信息技术的迅猛发展、全面集成与广泛应用,人类逐步迈入大规模数据挖掘、运用与创新的“大数据时代”。在此时代背景下,如何运用新媒体、新技术加强和创新高校思想政治教育工作,使之富有时代性、增强针对性、彰显实效性,是新时期高校面临的一个重要而现实的课题。作为当代信息技术发展的前沿,大数据广域的信息资源、先进的信息处理技术以及全新的思维范式,为大学生日常思想政治教育带来了即时性、精准性、前瞻性与个性化等创新发展的新动力与新空间。将大数据思维、技术与方法全方位嵌入大学生日常思想政治教育各要素、各环节与全过程,促进大学生日常思想政治教育革新思维、优化供给、改进方法、重构范式,建构科学化、数字化与智能化的大学生日常思想政治教育体系,推进大学生日常思想政治教育向“精准思政”“智慧思政”转型升级,是大学生日常思想政治教育顺应时代发展的现实需要,也是其进一步提质增效、焕发新机的重要生长点与强劲推动力。阐释大数据内涵、价值、特征与功能,阐释大学生日常思想政治教育内涵并且辨析其与大学生思想政治理论教育的关系,有利于进一步探讨两者的深度融合。基于此,大学生日常思想政治教育大数据概念得以提出。从大学生日常思想政治教育大数据资源、大学生日常思想政治教育大数据技术、大学生日常思想政治教育大数据思维三个维度全面阐述大学生日常思想政治教育大数据的内涵与外延,同时运用马克思主义哲学基本原理和方法论论析大学生日常思想政治教育大数据的生成逻辑、发展动因、方法论基础与价值取向,可以明确大数据与大学生日常思想政治教育需求的契合点,理清大数据对大学生日常思想政治教育的作用机理。面对新时代提出的新任务与新要求,大学生日常思想政治教育仍然面临一些困境、存在一些短板和弱环。运用文献资料法、大数据文本挖掘方法与访谈调研法审视大学生日常思想政治教育现状,总结当前大学生日常思想政治教育存在的问题与困境并作原因剖析,同时探讨新时代大学生日常思想政治教育新要求,指出新时代大学生日常思想政治教育面临的新课题以及新时代大学生日常思想政治教育的指导思想与原则、教育内容体系以及教育工作的主体转型,有利于为新时期大学生日常思想政治教育发展创新提供现实依据。通过分析大数据在大学生日常思想政治教育中应用的技术优势以及可能性,进一步探讨大数据在大学生日常思想政治教育中“精准画像”“规律探寻”与“超前感知”三个应用呈现。以之为基础,基于当前大学生日常思想政治教育存在的理念滞后、模式粗放、知行脱节、供需错位等难题,提出利用大数据推进大学生日常思想政治教育由线性思维向系统思维、由普适教育向个性化培育、由认知培育向实践养成、由需求侧适应向供给侧发力四大发展转向并详细阐述四大发展转向的实现路径。基于大数据推进大学生日常思想政治教育不仅要遵循学科规律、注重理论深化,还要坚持实践导向,致力推动大数据应用,促进理论与实践的双向转化。由之,宏观上,探索大学生日常思想政治教育大数据的数据采集、数据预处理与存储、数据挖掘与分析、数据应用与可视化、数据解释与反馈五大工作模块与应用流程;微观上,对大数据在大学生日常思想政治教育典型场域中的“数据画像”“精准资助”“失联告警”三个应用进行数据模型构建,从而为大学生日常思想政治教育利用大数据提供切实可行的实现路径。大数据为大学生日常思想政治教育创新发展带来了前所未有的机遇,然而,当前大学生日常思想政治教育利用大数据还存在观念性、路径性与机制性瓶颈,同时,大数据是一柄双刃剑,对数据的不当应用会带来诸如“数据垄断”“数据滥用”“数据侵害”“数据冰冷”等一些可能的风险与挑战。高校尚须在思维理念、技术开发、政策支持、制度完善、机制建设、校园环境建设等方面对大数据应用作出回应与调试。不仅如此,在基于大数据创新大学生日常思想政治教育过程中,高校要注重发挥教育工作者的主体性与能动性,始终坚持数字技术与人文精神、数据智能与教育智慧相结合。

杨楠[8](2021)在《基于数据挖掘的A公司员工离职预测研究》文中提出随着工业4.0、工业大数据、人工智能以及工业互联网技术的迅速发展,第四次工业革命开始把制造业带入了一个面临巨大变革的时代。制造业企业员工数量大,流动率高,优秀员工的频繁离职必然会带来公司经济效益的损失,因此把握企业员工离职动向、了解员工离职原因对企业制定人才挽留措施,提高人力资源合理配置与管理有着积极作用。数据挖掘技术迅速发展,已广泛应用于金融、生物工程、工业工程等各领域,应用数据挖掘技术对企业人力资源信息进行深入探索,挖掘员工离职的潜在原因和预测员工离职倾向,可以为企业人力资源管理者制定决策提供参考建议。本文基于A公司的员工离职相关数据,应用多种单一和集成的机器学习算法,分别建立以预测员工离职概率为主题的分类预测模型。单一预测模型选择了较为经典的决策树模型、朴素贝叶斯模型和支持向量机模型为代表,集成模型选择了随机森林模型和XGBoost模型为代表。通过模型预测结果的可视化展示,了解员工离职的决策路径和重要影响因素排序,以便于对企业人力资源管理提供针对性的政策建议。使用机器学习算法对实际问题进行预测建模时,模型的优劣直接决定了预测结果的准确性和可信度。为了更结合实际情况,对企业决策提供全面参考建议,本文对以上3种单一模型及其集成模型的预测效果进行综合维度的评价,期望筛选出最适合企业员工离职预测问题的模型。在模型评估上,区别于以往研究中仅使用准确性这一单一评价指标,还综合考虑了模型的Kappa系数、均方根误差、相对绝对误差、ROC曲线面积以及模型运行时间等多个评价指标。创新性地引入了偏好的多属性决策理论,将算法评价问题建模为多属性决策问题,根据决策者的偏好信息,使用层次分析法对各个指标赋予不同权重,接着使用TOPSIS法对模型的综合表现进行评价和排序,筛选出在员工离职问题数据集下表现最好的算法模型。本论文研究对于员工离职和人才流失的分析和预警研究提供了新的思路,具有一定的理论和应用价值。图27幅,表16个,参考文献46篇。

刘泽嘉[9](2021)在《我国文本与数据挖掘的合理使用制度构建研究》文中研究指明文本与数据挖掘是一项通过算法从海量数据中挖掘提炼知识信息的计算机技术。随着大数据的不断发展,文本与数据挖掘的应用范围愈发广泛,发挥的作用也越来越重要。它所产生的成果有助于科技的进步,文化的繁荣。但是有关文本与数据挖掘的内容在我国新修改的《着作权法》中并未涉及,反观欧美等发达国家,在其版权例外制度中,大都将文本与数据挖掘列为例外情形之一。因此,有必要对我国文本与数据挖掘合理使用制度的构建进行研究。文本与数据挖掘技术合理使用制度的构建首先要明确该技术的概念、流程以及其价值,其次分析该技术涉及到的着作权法律关系,得出这一技术符合合理使用制度的构成要件,并且需要以合理使用制度进行保护。正是由于我国《着作权法》中并未涉及,因此制度的构建有其必要性和可行性。国外一些国家和地区规定了数据挖掘合理使用。美国采用四要素合理使用标准下的“无条件的例外”,英国、欧盟采用合理使用制度法律条款中的“有条件的例外”。两种立法模式有较大差异,我国更适合借鉴“有条件的例外”模式构建文本与数据挖掘合理使用制度。文本与数据挖掘合理使用制度的构建,应当在坚持利益平衡原则的基础上,首先明确主体要件,本文通过对社会上文本与数据挖掘技术的使用主体进行分析,提出不应将主体局限于研究机构。其次,应当对客体要件加以限制,由于在技术运行过程中会涉及海量数据,这些数据都应当是通过合法途径获取的,才能避免着作权侵权。最后,明确以科学研究为目的的使用技术,对于商业性的使用,协调好版权许可协议与合理使用的关系,让文本与数据挖掘发挥更大的作用,实现科技文化的大发展和大繁荣。

李尧君[10](2021)在《大数据侦查中的个人信息保护问题研究》文中进行了进一步梳理当下的信息时代,使犯罪愈发隐蔽化、新型化和虚拟化,基于打击犯罪需要,催生出以大数据驱动的新型侦查模式——大数据侦查。大数据侦查是指通过利用数据技术,对存储于网络平台或计算机系统中的海量数据信息进行收集、整合、比对、挖掘等,进而发现犯罪线索、收集犯罪证据、缉获犯罪嫌疑人和预测犯罪的侦查模式。与传统侦查模式相比较,大数据侦查具备侦查空间数据化、侦查技术智能化、侦查行为主动化等特征,是当下时代的必然选择。然而,由于现阶段我国《刑事诉讼法》并未有大数据侦查的相关规定,加之个人信息保护的法律缺失及数据共享机制的混乱,使大数据侦查运行下对个人信息保护的问题凸显。大数据侦查中的个人信息有其特殊性,主要包括海量性、易获性、动态性及主体多元性,需在权利保障和程序规制等角度探讨大数据侦查中保障个人信息的制度构建,以期在保障个人信息安全的前提下,最大限度的发挥大数据侦查的效能。大数据侦查中保护个人信息的理论基础包括个人信息保护理论、信息隐私权理论、价值平衡理论及分层保护理论。个人信息本身价值呈现多元化特征,其中包含道德价值、商业价值及政治价值。刑事诉讼历来追求惩罚犯罪和保障人权之间的价值平衡,在大数据时代,两者价值体现为侦查机关对个人信息利用与保护。在大数据侦查过程中,通过对个人信息利用促进侦查高效化,其上位利益正是国家打击犯罪的需求,而对个人信息的保护便体现出对公民基本人权的保障。目前,大数据侦查下对个人信息保护的挑战,具体包括:其一,现有立法难以保障刑事程序中的个人信息。虽近年来我国在刑法、民法、行政法中就个人信息保护的相关立法都取得了相应的进展,但因对刑事司法领域中个人信息保护缺乏直接性、有效性及原则相冲突性等,难以在刑事诉讼中直接适用。其二,大数据侦查技术易对个人信息造成“隐秘性”侵犯。传统侦查中,侦查机关侵犯个人权利的违法侦查行为较为集中在讯问和搜查程序中,这种侵权通常有迹可循,但基于大数据侦查的技术层面,对个人信息利用过程的不透明性极易造成侵犯个人信息的隐蔽性。其三,对数据的依赖加深对个人信息的过分收集。信息的充分采集是保障大数据侦查中数据利用发挥其最大效用价值的基础前提,加之大规模数据监控为数据采集提供的有力渠道,加深了司法实践中侦查部门对个人信息的过分采集。其四,数据挖掘等技术应用加大对个人信息保护难度。大数据侦查中数据挖掘技术模糊了信息边界,其对个人信息的深度侵入性特征使个人信息更加难以保护。其五,服务于大数据侦查运行的数据共享大幅度扩张。数据共享平台的搭建虽打破了信息交流壁垒,但也造成侦查机关调取程序被架空,长此以往,将会直接影响个人信息在刑事侦查中的合法有效利用。其六,海量数据存留对个人信息造成风险。数据存留是数据采集的延伸,是不规范数据库的体现,缺乏规范管理加之数据库安全系数问题,有黑客入侵、网络攻击、数据滥用等风险,不利于个人信息保护。大数据侦查中对个人信息保护的路径构建,应对不同信息类别进行分类保护,结合大数据侦查本身兼具任意性和强制性多重属性成分,明确不同侦查阶段的数据适用规则,同时构建针对数据挖掘的特殊程序,完善大数据侦查运行的审批监督机制,规范数据共享平台,健全数据存留管理。

二、数据挖掘技术的应用研究(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、数据挖掘技术的应用研究(论文提纲范文)

(1)数据挖掘技术在软件工程中的应用研究(论文提纲范文)

0引言
1数据挖掘技术概述
2数据挖掘技术在软件工程中的应用问题
    2.1 数据信息复杂度高
    2.2 缺乏一致性评价标准
3数据挖掘技术的应用流程
4数据挖掘技术在软件工程中的应用策略
    4.1 应用分析
    4.2 应用方式
    4.3 软件工程数据检索
5数据挖掘技术应用挑战与未来发展
    5.1 技术应用挑战
    5.2 技术应用发展
6结语

(2)基于需求分析的临床医疗数据挖掘人才胜任力研究(论文提纲范文)

摘要
Abstract
英文缩略语
第一部分:绪论
    1 研究背景与目的
        1.1 研究背景
        1.2 研究目的
    2 研究意义
        2.1 理论应用意义
        2.2 实践管理意义
    3 研究设计
        3.1 研究内容
        3.2 研究方法
        3.3 技术路线
第二部分:基于文本挖掘的临床医疗数据挖掘现实需求分析
    1 前言
    2 研究材料和方法
        2.1 研究材料
        2.2 研究方法
        2.2.1 构造具有不同语义类型的MeSH术语共现矩阵
        2.2.2 双聚类算法分析
    3 结果
    4 讨论与结论
第三部分:知识非常态理论框架下的临床医疗数据挖掘需求分析
    1 前言
    2 理论框架及概念设定
        2.1 数据挖掘过程中的问题与状况
        2.2 临床医疗数据挖掘用户的知识结构
        2.3 数据挖掘的目的和意图
    3 研究方法
        3.1 问卷设计
        3.2 数据收集与样本构成
        3.3 数据分析
        3.3.1 专家权威程度分析
        3.3.2 专家协调程度分析
        3.3.3 信度和效度分析
    4 结果
        4.1 临床医疗数据挖掘主要问题与状况
        4.2 临床医疗数据挖掘用户的知识结构
        4.3 临床医疗数据挖掘目的和意图
    5 讨论
        5.1 德尔菲调查结果对临床医疗数据挖掘的现实需求进行了补充
        5.2 临床医疗数据挖掘用户知识与其数据挖掘目的和意图之间存在着“鸿沟”
    6 结论
第四部分:基于需求分析和冰山模型的临床医疗数据挖掘人才胜任力模型构建
    1 前言
    2 临床医疗数据挖掘人才胜任力定义及其要素
    3 研究方法
        3.1 问卷对象
        3.2 调查方法
    4 结果
        4.1 专家基本信息描述性统计
        4.2 问卷信度和效度分析
        4.3 临床医疗数据挖掘人才胜任力指标总体分析
        4.4 临床医疗数据挖掘人才胜任力指标权重计算
    5 结论
第五部分:临床医疗数据挖掘人才胜任力要素实证研究
    1 研究对象与方法
        1.1 实证研究调查对象
        1.2 调查方法
    2 研究结果
        2.1 调查对象基本情况
        2.2 问卷信度和效度分析
        2.3 临床医疗数据挖掘人才胜任力情况总体分析
        2.4 临床医疗数据挖掘人才胜任力总体情况的单因素分析和多元线性回归分析
        2.5 临床医疗数据挖掘人才胜任力动机情况的单因素分析
        2.6 临床医疗数据挖掘人才胜任力个性和特质情况的单因素分析和多元线性回归分析
        2.7 临床医疗数据挖掘人才胜任力知识技术能力情况的单因素分析和多元线性回归分析
    3 讨论与对策建议
        3.1 讨论
        3.2 对策与建议
        3.2.1 加强临床医疗数据挖掘人员的知识技术能力培训
        3.2.2 注重临床医疗数据挖掘青年人才培养
        3.2.3 激发临床医疗数据挖掘人才内在动机
第六部分:总结
    1 研究总结
    2 本研究的不足
    本研究创新性的自我评价
参考文献
综述 数据挖掘技术在临床医疗数据中的应用
    参考文献
攻读学位期间取得的研究成果
致谢
个人简介
附表1
附表2
附表3

(3)铁路机车设备画像理论及关键技术研究(论文提纲范文)

致谢
摘要
ABSTRACT
前言
1 绪论
    1.1 研究背景及意义
    1.2 必要性及可行性分析
        1.2.1 必要性
        1.2.2 可行性
    1.3 本文拟解决的主要问题
    1.4 本文研究的主要内容
    1.5 本文组织架构及技术路线
    1.6 本章小结
2 国内外研究现状及发展趋势
    2.1 机务大数据研究及应用
        2.1.1 国外
        2.1.2 国内
    2.2 机车检修现状
    2.3 设备画像
        2.3.1 画像的概念
        2.3.2 构成要素
        2.3.3 模型与方法
    2.4 标签技术
        2.4.1 画像标签的定义
        2.4.2 标签分类
        2.4.3 标签构建原则
        2.4.4 标签构建方法
    2.5 设备健康管理
        2.5.1 国外设备健康管理现状
        2.5.2 国内设备健康管理现状
        2.5.3 我国铁路机务专业PHM技术发展差距
    2.6 本章小结
3 铁路机车设备画像理论
    3.1 机车设备画像概述
    3.2 铁路机车设备画像理论构建
        3.2.1 铁路机车设备画像理论的定义与内涵
        3.2.2 铁路机车设备画像理论的构成
        3.2.3 铁路机车设备画像理论的应用架构
    3.3 本章小结
4 基于设备画像的铁路机车标签体系构建
    4.1 问题概述
    4.2 面向设备画像的标签技术
    4.3 机车画像标签体系构建
        4.3.1 机车画像标签体系技术架构
        4.3.2 机车画像标签体系
    4.4 基于聚类的机车第三级标签获取方法
        4.4.1 K-means算法
        4.4.2 K-means算法的改进
        4.4.3 K-means算法与改进算法的比较验证
    4.5 机车画像标签体系构建实例
        4.5.1 K-means改进算法的应用
        4.5.2 机车完整标签体系的产生
    4.6 本章小结
5 基于MsEclat算法的铁路机车事故故障多最小支持度关联规则挖掘
    5.1 问题概述
    5.2 MsEclat算法的背景知识
        5.2.1 垂直格式数据集
        5.2.2 支持度、置信度与提升度
        5.2.3 概念格理论
        5.2.4 多最小支持度下的频繁项集判定
        5.2.5 面向有序项目集合的最小支持度索引表
        5.2.6 基于等价类的可连接性判定
    5.3 MsEclat算法原理
        5.3.1 Eclat算法简述
        5.3.2 改进的Eclat算法—MsEclat算法
    5.4 优化的Ms Eclat算法
        5.4.1 基于布尔矩阵的T_(set)位运算求交
        5.4.2 基于MapReduce的等价类并行运算
        5.4.3 大数据场景下优化的MsEclat算法的频繁项集挖掘步骤
    5.5 算法比较验证
        5.5.1 MsEclat算法与水平挖掘算法的对比
        5.5.2 MsEclat算法与其优化算法的对比
    5.6 机车事故故障关联规则挖掘分析
        5.6.1 待分析项目的选取
        5.6.2 关联规则挖掘结果分析
    5.7 本章小结
6 基于PSO+DE混合优化BP神经网络的铁路机车质量安全态势预测
    6.1 问题概述
    6.2 机车质量等级评价
    6.3 基于机车质量评价项点的特征选择
        6.3.1 灰色关联度分析
        6.3.2 机车质量等级的比较特征选择
    6.4 PSO+DE混合优化BP神经网络
        6.4.1 BP神经网络原理
        6.4.2 PSO算法原理
        6.4.3 DE算法原理
        6.4.4 基于时变概率的PSO+DE混合优化BP神经网络预测模型
    6.5 机车质量安全态势预测分析
        6.5.1 预测模型训练
        6.5.2 预测模型训练结果分析
        6.5.3 预测模型应用分析
    6.6 本章小结
7 基于铁路机车设备画像理论的铁路机车健康管理应用总体设计
    7.1 机务大数据与机车健康管理
    7.2 铁路机车健康管理应用设计
        7.2.1 设计目标及定位
        7.2.2 总体架构设计
        7.2.3 技术架构设计
    7.3 铁路机车健康管理应用的典型应用场景分析
        7.3.1 设备质量综合分析
        7.3.2 人员运用综合把控
        7.3.3 运输生产综合管理
    7.4 本章小结
8 某铁路局机车健康管理应用实践
    8.1 应用开发方案
        8.1.1 系统开发环境
        8.1.2 数据调用方式
        8.1.3 分析模型定时任务调用方式
    8.2 机车数据管理功能
        8.2.1 基本数据管理
        8.2.2 视频数据管理
        8.2.3 机务电子地图
    8.3 机车画像标签生成及分析功能
        8.3.1 机车画像标签管理
        8.3.2 单台机车画像分析
        8.3.3 机车设备画像分析
    8.4 机车事故故障关联分析功能
    8.5 机车质量评价分析功能
        8.5.1 单台机车质量安全分析
        8.5.2 机务段级机车质量安全分析
        8.5.3 机务部级机车质量安全分析
        8.5.4 全局机务专业质量安全综合分析
    8.6 机车质量安全态势预测分析功能
    8.7 本章小结
9 总结与展望
    9.1 本文总结
    9.2 研究展望
参考文献
图索引
FIGURE INDEX
表索引
学位论文数据集
TABLE INDEX
作者简历及攻读博士学位期间取得的科研成果

(6)基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析(论文提纲范文)

中文摘要
英文摘要
常用缩写词中英文对照表
前言
1 绪论
    1.1 研究背景
    1.2 研究目的及意义
    1.3 国内外研究现状
    1.4 论文组织结构
2 《伤寒杂病论》相关知识
    2.1 《伤寒杂病论》的学术渊源与成就
    2.2 《伤寒杂病论》中麻黄、石膏的作用
    2.3 《伤寒杂病论》对治“时行之气”
3 研究对象与方法
    3.1 数据收集
    3.2 数据整理与规范
    3.3 质量控制与数据挖掘方法
    3.4 网络图形构建
4 结果
    4.1 《伤寒论》相关数据
    4.2 《金匮要略》相关数据
    4.3 《伤寒论》《金匮要略》数据汇总
5 讨论
    5.1 方剂部分
    5.2 中药部分
    5.3 症状部分
6 结论与展望
参考文献
综述 中医药体系数据挖掘可视化
    参考文献
致谢
个人简介

(7)基于大数据的大学生日常思想政治教育创新研究(论文提纲范文)

摘要
ABSTRACT
绪论 大数据让大学生日常思想政治教育智能化
    第一节 选题缘由及研究意义
        一、选题缘由
        二、研究意义
    第二节 国内外研究综述
        一、国内研究现状
        二、国外大数据与教育交叉研究综述
        三、研究评析
    第三节 逻辑结构
        一、研究思路
        二、研究方法
        三、内容框架
    第四节 重点、难点及预期创新点
        一、研究重点
        二、研究难点
        三、研究创新点
第一章 基于大数据创新大学生日常思想政治教育的理论基础
    第一节 核心概念解读
        一、大数据
        二、大学生日常思想政治教育
        三、大学生日常思想政治教育大数据
    第二节 大学生日常思想政治教育大数据之马克思主义哲学审视
        一、感性对象性活动之数据生成逻辑
        二、实践的社会历史性之数据发展动因
        三、辩证唯物主义认识论之数据应用的方法论基础
        四、人的全面自由发展之数据应用的价值取向
    第三节 大学生日常思想政治教育大数据自组织系统阐释
        一、大学生日常思想政治教育之复杂自组织系统特征
        二、大学生日常思想政治教育大数据之数据转化
        三、大学生日常思想政治教育大数据之数据转换
        四、大学生日常思想政治教育之数据工作机制
第二章 基于大数据创新大学生日常思想政治教育的现实依据
    第一节 大学生日常思想政治教育存在的现实困境
        一、基于大数据文本挖掘方法的大学生日常思想政治教育现实困境分析
        二、大学生日常思想政治教育者访谈
        三、大学生日常思想政治教育存在的问题及原因剖析
    第二节 新时代大学生日常思想政治教育新要求
        一、新时代大学生日常思想政治教育面临的新课题
        二、新时代大学生日常思想政治教育指导思想与原则
        三、新时代大学生日常思想政治教育教育内容体系
        四、新时代大学生日常思想政治教育的主体转型
    第三节 基于大数据创新大学生日常思想政治教育技术优势
        一、大数据关键技术之大学生日常思想政治教育应用
        二、教育主体与教育客体的数据交互
        三、教育管理平台载体的数据智能
        四、教育管理实践数据的跨域应用
    第四节 基于大数据创新大学生日常思想政治教育可能性分析
        一、基于数据技术的效率提升
        二、基于证据的日常教育管理
        三、基于数据评价的工作改进
第三章 基于大数据促进大学生日常思想政治教育发展转向
    第一节 大学生日常思想政治教育大数据应用呈现
        一、精准画像:大数据精确反映学生行为状态
        二、规律探寻:大数据有效呈现学生活动规律
        三、超前感知:大数据准确研判学生活动趋向
    第二节 基于大数据之由线性思维向系统思维转变
        一、线性思维
        二、系统思维
        三、线性思维向系统思维转变的全面性与准确性
    第三节 基于大数据之由普适教育向个性化培育转变
        一、普适教育
        二、个性化培育
        三、普适教育向个性化培育转变的适应性与有效性
    第四节 基于大数据之由认知培育向实践养成转变
        一、认知培育
        二、实践养成
        三、认知培育向实践养成转变的实效性与长效性
    第五节 基于大数据之由需求侧适应向供给侧发力转变
        一、需求侧适应
        二、供给侧发力
        三、需求侧适应向供给侧发力转变的精准性与有效性
第四章 基于大数据创新大学生日常思想政治教育的实施路径
    第一节 基于大数据创新大学生日常思想政治教育的原则
        一、以人为本原则
        二、守正创新原则
        三、趋利避害原则
        四、循序渐进原则
        五、理论与实践相结合原则
    第二节 大学生日常思想政治教育大数据资源库建设与运行
        一、大学生日常思想政治教育大数据采集
        二、大学生日常思想政治教育大数据预处理与存储
        三、大学生日常思想政治教育大数据挖掘与建模分析
        四、大学生日常思想政治教育大数据可视化与应用
        五、大学生日常思想政治教育大数据解释与反馈
    第三节 利用大数据推进大学生日常思想政治教育实践应用
        一、数据画像
        二、精准资助
        三、异常告警
第五章 基于大数据创新大学生日常思想政治教育的条件保障
    第一节 个体主观条件
        一、培育大数据意识与大数据思维
        二、掌握大数据知识与大数据技能
        三、提升大数据伦理与管理理性
        四、把握大数据应用的价值导向
    第二节 技术条件保障
        一、开发和搭建高校思想政治教育大数据技术平台
        二、培育大学生思想政治教育大数据核心技术团队
    第三节 组织与制度保障
        一、加强组织领导
        二、推进教育政策实施与制度建设
        三、加强体制机制建设
    第四节 文化环境保障
        一、优化校园网络环境
        二、培育校园数据文化
        三、优化校园人文环境
结语:数据智能与教育智慧结合
参考文献
致谢
攻读博士学位期间主要研究成果

(8)基于数据挖掘的A公司员工离职预测研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 选题背景与意义
        1.1.1 选题背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 员工离职模型研究
        1.2.2 数据挖掘研究现状
        1.2.3 数据挖掘在员工离职预测中的应用现状
        1.2.4 研究综述
    1.3 论文的主要研究内容
        1.3.1 研究方法
        1.3.2 研究内容
    1.4 技术路线与创新点
        1.4.1 技术路线图
        1.4.2 关键问题与创新点
2 关键理论与技术
    2.1 分类预测技术概述
        2.1.1 决策树分类方法
        2.1.2 贝叶斯分类方法
        2.1.3 支持向量机分类方法
        2.1.4 集成学习分类方法
    2.2 分类算法的评价指标体系
    2.3 多属性决策理论
        2.3.1 层次分析法
        2.3.2 TOPSIS法
    2.4 本章小结
3 A企业员工离职数据处理
    3.1 数据获取
    3.2 数据预处理
        3.2.1 数据标准化
        3.2.2 数据清洗
        3.2.3 特征编码
    3.3 描述性统计
        3.3.1 数值型变量分布
        3.3.2 分类型变量分布
        3.3.3 变量相关性分析
    3.4 数据均衡化
    3.5 本章小结
4 基于数据挖掘的A企业员工离职预测
    4.1 基于单一算法的员工离职模型预测
        4.1.1 基于决策树的预测
        4.1.2 基于朴素贝叶斯的预测
        4.1.3 基于支持向量机的预测
    4.2 基于集成算法的员工离职模型预测
        4.2.1 基于装袋法集成模型的预测
        4.2.2 基于提升法集成模型的预测
    4.3 本章小结
5 基于用户偏好的多属性决策方法的模型评估
    5.1 评价指标权重的确定
    5.2 基于加权TOPSIS方法的模型综合评估
    5.3 本章小结
6 结论与展望
    6.1 结论
    6.2 展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集

(9)我国文本与数据挖掘的合理使用制度构建研究(论文提纲范文)

中文摘要
Abstract
绪论
第一章 文本与数据挖掘概述
    1.1 文本与数据挖掘的概念
    1.2 文本与数据挖掘的发展
    1.3 文本与数据挖掘的具体流程
    1.4 文本与数据挖掘的重要意义
    1.5 文本与数据挖掘的着作权法律关系
        1.5.1 文本与数据挖掘的主体
        1.5.2 文本与数据挖掘的客体
        1.5.3 文本与数据挖掘的着作权内容
    1.6 小结
第二章 我国构建文本与数据挖掘合理使用制度的必要性和可行性
    2.1 构建文本与数据挖掘合理使用制度的现实必要性
        2.1.1 吴锐与北京世纪读秀技术有限公司侵犯着作权纠纷一案
        2.1.2 谷歌公司与王莘侵害着作权纠纷上诉案
        2.1.3 小结
    2.2 构建文本与数据挖掘合理使用制度的制度必要性
        2.2.1 较难满足“个人使用”
        2.2.2 较难满足“适当引用”
        2.2.3 较难满足“教学使用”
        2.2.4 较难满足“兜底条款”
        2.2.5 小结
    2.3 构建文本与数据挖掘合理使用制度的可行性
        2.3.1 符合我国《着作权法》立法宗旨
        2.3.2 符合“三步检验法”的要求
第三章 国外文本与数据挖掘合理使用制度的实践与启示
    3.1 以美国为代表的“无条件例外”模式——以典型案例为引
    3.2 以英国、欧盟为代表的“有条件的例外”模式——以法律条文为引
        3.2.1 英国版权法中的“有条件的例外”
        3.2.2 欧盟《数字化单一市场版权指令》中的“有条件的例外”
    3.3 国际出版商的主张
    3.4 对我国的启示
第四章 构建我国文本与数据挖掘合理使用制度的建议
    4.1 坚持利益平衡原则
        4.1.1 利益平衡的概念
        4.1.2 《着作权法》中的利益平衡
        4.1.3 文本与数据挖掘适用的利益平衡原则
    4.2 借鉴“有条件的例外”模式构建我国的制度
        4.2.1 将文本与数据挖掘增设为合理使用情形
        4.2.2 主体要件:包括但不限于研究机构
        4.2.3 客体要件:作品通过合法途径获取
        4.2.4 使用目的:以科学研究为目的
    4.3 协调版权例外与版权许可协议之间的关系
结语
参考文献
致谢

(10)大数据侦查中的个人信息保护问题研究(论文提纲范文)

摘要
abstract
引言
一、大数据侦查中个人信息的概述
    (一)大数据侦查的基本理论
        1.大数据侦查的概念
        2.大数据侦查的特征
    (二)个人信息的界定
    (三)大数据侦查中个人信息的特殊性
        1.个人信息的海量性
        2.个人信息的易获性
        3.个人信息的动态性
        4.个人信息的主体多元性
二、大数据侦查中个人信息保护的理论基础
    (一)个人信息保护理论
    (二)信息隐私权理论
    (三)价值平衡理论
    (四)分层保护理论
三、大数据侦查下对个人信息保护的挑战
    (一)现有立法难以保障刑事程序中的个人信息
    (二)大数据侦查易对个人信息造成“隐秘性”侵犯
    (三)对数据的依赖加深对个人信息的过分采集
    (四)数据挖掘等技术应用加大对个人信息保护难度
    (五)服务于大数据侦查运行的数据共享大幅度扩张
    (六)海量数据存留对个人信息造成风险
四、大数据侦查中个人信息保护的路径构建
    (一)对不同信息类别进行分类保护
    (二)明确不同侦查阶段的数据适用规则
    (三)构建针对数据挖掘的特殊程序
    (四)完善大数据侦查运行的审批监督机制
    (五)规范大数据侦查的数据共享平台
    (六)健全数据存留管理机制
参考文献
致谢

四、数据挖掘技术的应用研究(论文参考文献)

  • [1]数据挖掘技术在软件工程中的应用研究[J]. 李娜. 信息记录材料, 2022(01)
  • [2]基于需求分析的临床医疗数据挖掘人才胜任力研究[D]. 方丽. 中国医科大学, 2021
  • [3]铁路机车设备画像理论及关键技术研究[D]. 李鑫. 中国铁道科学研究院, 2021(01)
  • [4]基于数据挖掘的A企业内部审计信息化研究[D]. 孙阳. 太原理工大学, 2021
  • [5]数据挖掘技术在A企业招标审计中的应用研究[D]. 李昊宇. 太原理工大学, 2021
  • [6]基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析[D]. 刘梦柳. 山西医科大学, 2021(01)
  • [7]基于大数据的大学生日常思想政治教育创新研究[D]. 邓晶艳. 贵州师范大学, 2021(09)
  • [8]基于数据挖掘的A公司员工离职预测研究[D]. 杨楠. 北京交通大学, 2021(02)
  • [9]我国文本与数据挖掘的合理使用制度构建研究[D]. 刘泽嘉. 兰州大学, 2021(02)
  • [10]大数据侦查中的个人信息保护问题研究[D]. 李尧君. 江西财经大学, 2021(10)

标签:;  ;  ;  ;  ;  

数据挖掘技术应用研究
下载Doc文档

猜你喜欢