您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 大数据 云计算 数据处理 数据分析 信息服务 图书馆服务 数据挖掘
摘要: 大数据与云计算是近两年IT界最为流行的两个关键词,各大IT厂商也都看到了大数据所蕴含的商业价值并展开了一定的产品研发与商业应用。在当前的大数据背景下,在处理数据以及服务方面,图书馆的变化明显,通过数据,对其价值进行重点的挖掘与研究,为图书馆管理人员调整有关建设措施提供依据,同时这也是其关键业务之一,在服务的方法与方式上,图书馆也会根据其不断变化的方案而改进。
关键词: 大数据 数据处理 党校图书馆服务 数据挖掘
摘要: 当前,已步入大数据时代,党校图书馆要顺应这种发展趋势并在发展中越战越勇,就要接纳大数据,让大数据为自己服务。大数据主要的应用在于帮助党校图书馆分析读者数据,建立更适合读者需求的党校图书馆,同时分析馆内书籍数据,使党校图书馆更有价值,更有竞争力,能更好地为读者服务。
关键词: 公安机关 数据仓库技术 数据共享 关联分析 数据处理 非结构化 数据挖掘 信息化
摘要: 近年来,伴随着全国各地公安机关信息化的迅猛发展,数据共享和深化应用的需求空前高涨。但是,随着数据的汇聚和数据量的爆炸式增长,传统的数据库和数据仓库技术出现了诸多瓶颈问题,特别是对于PB级的非结构化数据处理以及多维度关联分析、数据挖掘、情报研判等需求,
关键词: 模糊聚类分析 数据挖掘 数据处理 应用分析
摘要: 数据挖掘是完成数据分析的关键,在数据挖掘中常用的一种方法就是聚类分析,在具体的分类中可遵循一定的原则和规律将重要数据实施分类,从而通过分析发现其应用价值。本文主要探讨的是模糊聚类分析在数据挖掘中的相关运用问题,在具体的分析中首先分析了常用的聚类算法,其次就模糊聚类分析相关内容展开分析,最后重点总结了模糊聚类分析在数据挖掘中的应用。
关键词: 数据挖掘 GPS轨迹 智能公交系统 hadoop
摘要: 公交物联网产生的数据具有量大且冗余数据多、处理所需专业性强、对数据处理准确性要求高、城市路况结构复杂等特点。文中通过hadoop建立分布式数据仓库将每辆车的GPS数据、报警数据、温度数据、班次车次数据、乘客IC卡数据在各自站点的数据仓库中进行保存与管理,对海量公交数据进行实时分析。然后根据得出的路况信息和车辆客流高峰时段等数据来优化公交调度策略,动态调整车辆调配,从而为满足公交车辆、线路、业务不断拓展和智慧城市建设提供一个可借鉴的平台。
关键词: 数据处理 数据挖掘 特征提取 聚类分析
摘要: 伴随着计算机技术和互联网技术的快速发展,人类逐渐积累的数据量急剧增多。为了从海量的数据中挖掘出有用的信息,为用户提供决策支持,聚类算法得到了广泛的关注,并应用于各类数据处理与数据挖掘之中。本项目在分析图像视觉特性的基础之上,通过对图像颜色、纹理和形状多种特征信息的有效融合,利用K-均值算法进行聚类。提出的方法在采集的图像数据集上进行实验,有很好的聚类效果。
关键词: 数据新闻 数据挖掘 数据处理 数据可视化
摘要: 互联网时代,大数据的发展将数据从简单的处理对象变成了一种基本的资源,并成为广泛关注的话题。数据新闻采用多个学科技术手段,挖掘采集数据,把庞大而复杂的数据进行过滤,进而转换为可视化的文本,呈现给读者。
关键词: 实验教学 数据挖掘 异常检测 预测建模 关联分析
摘要: 从回收到的问卷中得到大量数据需要处理。说明了数据处理的目的和任务,并通过实例介绍了部分数据处理的方法。
关键词: 网络信贷 信用风险 评价指标 数据处理
摘要: 近年来,以P2P网贷为代表的互联网金融正日益繁荣壮大,也越来越受到国内外市场的关注和认可。众所周知,P2P行业也酝酿着众多风险,信用风险是其中最主要的风险。一方面,目前我国P2P网贷借款人信用风险指标体系缺乏相对统一的标准;另一方面,作为风控核心的风险评估模型处于初级阶段,并不能真实有效地反映借款者的信用水平。因此,如何为我国P2P借款人建立一套科学合理的信用风险体系,是P2P网贷信用风险管理中一个亟需克服的难题。\n 首先,构建我国P2P网贷借款人信用风险评估指标体系。通过对国内知名P2P网贷平台采用的借款人信用风险水平指标和国内商业银行采用的个人信用风险评估指标类比研究,再结合信用风险评估指标构建的理论方法,确定P2P网贷借款人初选指标。针对初选指标,对初始数据进行预处理,提高后续挖掘过程的时间效率以及预测精度等。\n 其次,构建KM-SMOTE算法进行数据平衡化处理。将K-Means算法与SMOTE算法融合,通过修正插值公式来合成新的少数类样本数据,以达到少数类与多数类样本达到总体均衡的目的。实验分析表明P2P网贷借款人非平衡数据在平衡化后,可以大大提升识别违约客户的准确率。\n 接着,构建随机森林与K折交叉验证组合模型筛选指标。运用随机森林算法获得置换特征前后的袋外数据分类准确率的差值变化,进而得到各指标特征的贡献度排序。再引入K折交叉验证算法,并以测试集的平均OOB误差率最小为评价原则来筛选指标。实验分析表明P2P网贷借款人贡献度排序靠前的13个指标能够使得随机森林模型的误差率最小。\n 最后,构建CM-EnSVM模型评估信用风险。通过Bootstrap方式对数据进行自助抽样,利用复合形算法优化支持向量机参数,并对多个子样本集进行分类,再通过投票方式形成最终的分类结果。实证分析表明,该模型相比于随机森林、支持向量机、Logistic回归都具有较好的预测能力,且稳健性好,能够为P2P网贷行业管理者在风险管理过程中提供良好的决策支持。
关键词: 资料收集 资料分析与评价 数据仓库 数据挖掘 知识表示
摘要: 城市综合性地图集是综合反映一个城市自然、经济、文化、历史、发展状况的信息载体,是人们全面了解该城市最直观、最全面的信息工具,需要通过方方面面的信息进行综合与融合。本文以《武汉城市地图集》为例,从城市综合性地图集的内容、资料和数据情况分析和处理、数据挖掘技术应用和知识表示效果等方面进行展开,充分体现了数据处理技术在综合性图集编制中的重要性。