您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 数据挖掘 状态估计 聚类分析 数据处理 线性回归
摘要: 错误的网络参数对状态估计的结果产生较大影响,现在一般认为参数值是常量,但实际上网络参数随周围环境、天气状况及负荷水平等变化而变化。提出基于数据挖掘技术的电力网络参数估计方法,利用大量样本数据估计网络的真实参数值。首先,利用聚类分析技术对SCADA历史数据进行分类,分成不同类型的样本数据;其次,利用数据处理技术对各个样本数据中的孤立点、空缺值、噪声等进行处理;最后,利用线性回归技术估计满足一定条件的网络参数。经过两个算例验证,证明基于数据挖掘技术的状态估计方法是非常有效的。
关键词: 神经网络算法 数据处理 选择与变化 评估解释
摘要: 本文通过对数据挖掘技术的涵义及一般处理过程以及神经网络的原理与算法进行深入的研究,从而将神经网络算法利用在数据挖掘工作中,形成了基于神经网络的数据挖掘算法,并且通过论述神经网络的数据挖掘技术算法具体过程分析,提高了数据挖掘分类工作的效率,增强了数据挖掘的适应性与稳定性.为今后数据挖掘工作提供参考.
关键词: 数据挖掘 海量数据处理 MC-Apriori算法 粒计算 Grc-AR算法
摘要: 数据挖掘就是从大量的数据中提取出有用的、有价值的信息或者人们所感兴趣的知识的一种处理过程。但是随着不断迅速发展的信息互联网和数据库技术,已经迫使海量数据的处理成为数据挖掘领域所要解决的一个重要课题。 本文以“电信数据挖掘系统的设计与开发”的项目为研究背景,通过对海量数据处理技术的研究,提出了使用内存映射文件技术对海量数据进行初步处理的方法;通过对海量数据挖掘算法及粒计算理论知识的研究,本文提出了两种数据挖掘算法:一种是基于矩阵压缩的Apriroi算法(MC-Apriori),这种算法是在经典Apriori算法基础上的改进,把事务数据转化为0-1矩阵,并按照Apriori性质及其推论对矩阵进行反复压缩,进而得到各项频繁项集,此算法也在一定程度上减少了数据规模及其计算量;一种是基于粒计算的关联规则挖掘算法(Grc-AR),此算法是在MC-Apriori算法的基础上引入粒计算的思想,把海量数据集划分成若干个小数据集,然后对各个小数据集进行操作,并对结果进行整合,得到最终结果。本文以某市移动用户的通话记录为数据样本,分别实现了这两种算法,并对实验结果进行了分析与比较。 实验结果证明这两种算法均没有失去算法的有效性,但在实际处理海量数据时,Grc-AR更适合处理海量数据集,算法的可伸缩性好。最后并从海量的电信数据集中,提取出了一些有价值的信息,给电信运营商提供了决策支持。
关键词: 人文社科 社会科学 密集型 数据挖掘 领域 学术社团 人文科学 人文学科 数据分析 数据处理 出版模式 专家
摘要: 如何从瀚如烟海的古籍资料中发掘有价值的信息和知识是人文科学和社会科学工作者所面临的重要挑战。为了探索和创新"大数据"时代人文社科领域的研究模式,2009年英国联合信息系统委员会(Joint Information Systems Committee,JISC)、美国国家人文基金会(National Endowment for the Humanities,NEH)、美国国家科学基金会(National Science Foundation,NSF)和加拿大社会科学与人文科
关键词: X10语言 并行算法 数据挖掘
摘要: X10语言是IBM研究院正在开发的开源编程语言,能够解决分布式计算所带来的架构变化,并且使运行性能有明显提升。 本文通过对X10语言在云端海量数据处理的应用与实现研究,针对X10语言并行性的结构特点,提出了X10语言的MapReduce模型,将大数据块分割成小数据块,充分利用X10语言在海量并发时的优异性能,从而进一步优化X10语言的执行过程。定义了新的数据结构和数据集分配方法,重写并实现了传统的三种数据处理算法:Apriori算法、热点话题提取算法和协同过滤算法。 在设计算法时,发挥X10语言高并行性的特点,有针对性地解决传统高级语言在实现并行算法存在的问题,使设计出的算法能够尽可能的并行执行,并且能够在云平台上高效稳定的运行。 配置实验环境时,集群内配置了9台机器,IDE采用X10for Eclipse平台,对比实验环境采用Java语言的Hadoop开源平台。两种语言均采用MapReduce架构,与传统语言的数据处理算法进行对比测试。 最后利用上述设计出的三种算法搭建了微博推荐系统。实验结果证明了X10语言在云端大规模数据处理中有着良好的挖掘效率。
关键词: 编码(程序设计) 数据格式 数据挖掘 数据处理 数据存储 定义(术语) 图形数据处理 图像文件 图像系统 图像 信息处理 情报检索 信息技术 联合图像专家组(JPEG) 绘制地图 元数据 图象描述信息 研究 检索 静止图象
标准号: ISO/IEC TR 24800-1-2012
关键词: 数据挖掘 技术 光伏电站 海量数据 处理 应用
摘要: 随着计算机科学的发展和技术的不断进步,数字化技术在光伏电站系统中得到了广泛的应用,致使光伏电站系统在运行中产生和积累了大量的数据。将数据挖掘技术应用于光伏电站系统.明确了数据所包括的含义,使光伏电站中的数据得到了有效的应用。以数据挖掘技术的概念为基础。明确了数据挖掘技术在光伏电站海量数据处理中的应用。
关键词: 缺值属性 数据处理 数据挖掘
摘要: 在现实数据库数据挖掘属性值缺失的情况经常发生,对于为决策分析提供支持的数据仓库需要高质量的数据,因此必须对数据进行处理,本文就数据处理提出了新的观点,采用抽样的方法对于缺失数据填补。
关键词: 编码(程序设计) 数据格式 数据挖掘 数据处理 数据存储 定义(术语) 图形数据处理 图像文件 图像系统 图像 信息处理 情报检索 信息技术 联合图像专家组(JPEG) 绘制地图 元数据 图象描述信息 研究 检索 软件 静止图象
标准号: ISO/IEC 24800-6-2012
关键词: 数据挖掘 半监督学习 tri-training 机器学习 数据处理
摘要: 随着数据挖掘在现代社会生产活动中扮演着越来越重要的角色,在计算机科学和其他相关领域中它都受到了很大的重视。在这篇文章中,我将向您简单介绍一个关于机器学习和数据挖掘的前沿领域——半监督学习。为了使数据挖掘的初级读者更好的了解,我将简化一下算法,也就是说,我会忽略一些操作和参数,仅展现一些重要的过程。