您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 大数据 数据处理 数据挖掘 数据服务 图书馆
摘要: 文章首先阐述了大数据的特征与内涵,指出了大数据在图书馆工作中的重要性及两者之间的关系,分析了大数据所带来的数据管理、数据存储、数据挖掘等方面的挑战。然后研究了图书馆应从数据管理、数据技术及数据队伍建设上所采取的策略。最后探讨了大数据驱动下的图书馆服务新模式,如基于数据整合的一站式资源服务,基于数据处理的学科知识服务、信息可视化服务及基于数据挖掘的个性化智慧服务。
关键词: 大数据处理 关键技术 云计算 数据挖掘 可视化技术
摘要: 随着大数据时代的到来,数据的极大丰富成为当前社会的重要特征。对大数据进行分析和处理的技术也不断的丰富起来。本文主要分析了实现大数据处理的关键技术。
关键词: 数据库 数据挖掘 数据处理 网络信息
摘要: 网络信息的财产属性在大数据、云时代毕露无遗,商业的逐利本能和数据挖掘技术的日益成熟联手铺就了一条以牺牲网民隐私为代价的掘金之路央视3.15晚会曝光了网易邮箱偷窥用户邮件内容,就此引发了公众对个人网络信息安全隐患的担忧。一时间人人为自己的隐私惶惶不安,一个广告公司、一个手机软件即可对你的个人信息和行踪了如指掌,
关键词: 数据挖掘 高职院校 技能考证 数据处理
摘要: 随着高职院校毕业生的不断增多和各种学生管理系统的应用,造成了大批的复杂信息数据。本文通过研究数据挖掘算法,应用数据挖掘中的数据预处理技术,以高职院校学生技能培训和证书的数据作为研究对象,帮助高职院校进行学生的技能培训,对学生的就业也具有很大的指导作用。
关键词: “高级数据挖掘与应用国际学术会议” 数据库 数据挖掘 数据处理
摘要: ADMA 2013 will take place in Zhejiang University,Hangzhou,14th-16th December *** is our pleasure to invite you to contribute papers,register and participate at ADMA 2013.
关键词: 图书馆 大数据 数据分析 数据处理 数据挖掘
摘要: 阐述了大数据在我国图书馆界的研究进展,从大数据的产生对科学研究、社会创新的影响角度入手,分析了大数据视角下图书馆的定位,进而提出了拓展数据分析与处理业务、重视用户隐私保护等图书馆的发展策略。
关键词: 高速公路 收费数据 数据挖掘
摘要: 近几年来,随着我国高速公路建设发展脚步的不断加快,高速公路收费工作也得到了巨大的挑战,为了能够将大量的资料有理有序地进行整理和统计,在高速公路收费工作中引进先进技术是不容忽视的。近几年来,随着我国科学技术的不断发展,数据挖掘技术凭借着自身诸多优势在高速公路收费中得到了广泛的应用。本文通过对数据挖掘及其应用进行详细的介绍,并在此基础上分析其在高速公路收费工作中所起到的积极作用。
关键词: 数据挖掘 存储 计算 数据流处理 Web应用 数据流模型 信息技术 数据处理
摘要: 大数据是2012年最火爆的词汇,这股热潮促进了新一代信息技术的融合发展。大数据的处理和分析是核心支撑,数据流处理又是大数据处理中的关键一环。像金融服务、网络监控、电信数据管理、Web应用、生产制造、传感检测等各行业应用,数据通常以大量、快速、时变的流形式持续到达。在这种数据流模型中,单独的数据单元可能是相关的元组,例如网络测量、呼叫记录、网页访问等产生的数据,而且数据在处理之后就会被丢弃(这里涉及时间窗口管理和价值数据的提取)。
关键词: 数据挖掘 遗失填补 粗糙集理论 ROUSTIDA算法 系统开发 功能模块
摘要: 随着数据库和数据仓库的深入应用,各公司都有一套独特且杂乱的数据。这些数据多为历史数据,实时数据寿命短而且通常不作分析用,因此对这些历史数据的分析和处理显得愈发重要。而数据挖掘技术的引入,使得这样的分析处理能为公司提供重要决策指导,甚至是为企业创收。其中,有关如何补全不完备信息系统的缺失数据成为近年来的研究热门问题。这些问题包括缺失数据的去留问题、遗失值的补全问题以及使用何种算法补全等。而本系统正是基于此背景开发。\n 数据补全处理,也即填补遗失值的方法,有平均值法、最大频率法和不完备数据分析方法(ROUSTIDA)等。首先不考虑直接删除缺失数据条的情况,没有研究实现的意义。在众多补遗方法中,ROUS-TIDA算法是基于粗糙集理论(基于二维表的知识表达,用以体现信息决策世界)的一种算法,用于实施填补不完备信息系统中的遗失数据值。作为粗糙集理论中填补性能最好的算法,也是本系统主要研究的内容,针对的是ROUSTIDA算法的实际应用,用以实现对不完备系统的数据填补,同时根据其时间复杂度高的缺点,完成了对ROUS-TIDA算法的改进,大幅降低时间复杂度,并保证原来算法的正确功能,从而达到了现有对数据补全的最佳性能。本系统实现的主要功能就是把读入的、符合粗糙集理论和ROUSTIDA算法要求的数据不完备信息系统,交由ROUSTIDA算法和改进的ROUSTIDA算法进行处理,分析比较二者优劣,最后把补全的完备信息表重新输出。\n 本系统对于实际应用方面的价值就体现在,对于企业有决策意义的数据进行整理,找到决策属性后,即可将数据表中缺失的数据按照算法补齐,这样保证了公司数据库的完整性,同时为以后的研究提供标准的完备数据。本系统最大的特色在于利用最新、最稳定的数据填补算法,自主实现了针对EXCEL文件输入数据进行遗失值填补,分析比较了两种算法,对研究和应用都有指导意义。\n 本文首先介绍了相关技术(粗糙集理论的基本概念、ROUSTIDA算法以及改进的ROUSTIDA算法的描述分析)。随后对系统进行各方面的系统分析、包括整体可行性研究、功能性能方面的需求分析和开发环境的介绍,并在此基础上进行系统设计(包括系统框架流程、UML类图和功能结构的概要设计以及各模块的详细设计)。紧接着就进行最底端的系统实现(每个模块的实现)、主要模块测试(ROUS-TIDA及改进算法测试过程和分析)和实施系统部署(软硬件环境的搭建、数据源的设置)。最后本文对本系统进行了一个总结与展望,总结了项目的创新点和开发过程中的心得经验,展望了系统的优缺点(新技术优势和代码优化问题),以指导今后工作。至此,可以得出结论,本系统完整、健壮地实现了基于ROUSTIDA算法的不完整数据处理分析与实现,对于学习和实用都有重大意义。
关键词: 出租车调度 云计算系统 数据挖掘 聚类算法
摘要: 随着我国经济快速发展,城市交通发展显著,私家车数目不断增加,目前交通拥堵、环境污染等问题已成为备受关注的社会焦点,研究新一代智能交通系统成为改善交通现状的关键工作。基于国内外智能交通系统现状,本文首先对现有系统的组成、主流技术以及存在的问题进行分析,针对现存问题,引入物联网、云计算以及数据挖掘等相关技术优化系统,提出物联网环境下的云智能交通系统架构。物联网技术是现代信息技术的重要组成,通过嵌入射频标签,实现高度信息化;云计算是一门新兴学科,应用分布式架构高效处理大数据。物联网以及云计算技术的不断发展推动智能交通系统进一步完善。\n 本文的研究重点是智能交通中的出租车调度系统的设计与实现。首先,完成系统设计方案以及关键技术的调研,然后,在此基础上针对深圳市出租车行业具体情况,分析智能调度系统的功能及设计需求,提出智能出租车整体设计方案,从采集层、处理层以及发布层分层介绍功能需求以及设计方案,并对重要实施方案作出论证分析。最后,采用模块化设计思想,将数据处理流程分为几个重要模块:信息传输帧格式、云平台搭建、数据预处理、数据存储以及数据聚类,并针对各模块提出满足系统需求的详细设计方案,详细阐述了基于频率过滤算法、基于虚拟路径过滤算法、存储策略以及聚类算法的详细设计以及实现过程。为验证设计方案的正确性,项目组人员搭建测试平台,对深圳市出租车智能调度系统各模块进行测试。论文对测试结果的分析表明,该系统功能完善,性能稳定,满足设计目标。论文最后总结研究工作中存在的问题,提出优化方案,并展望在其他领域的应用前景,规划下一步工作。