关键词:
征信信息
MQ集群
多线程
分布式系统
数据挖掘
摘要:
随着大数据时代的到来,银行业的传统集中式开发部署模式已经无法适应于现代大数据量数据加工及存储,再加上银行对静态大数据进行利用的浓烈兴趣,行业内智能化、自动化、大数据化的趋势使金融系统迎来了转型升级的时期,各行也积极开展大数据及智能化平台。同时由于数据量的增长,对于消息中间件的要求也在不断提高,如何能提高可靠性、处理效率,使系统间信息传输更加稳定、快速,是金融系统对消息中间件的主要要求。作为银行业大数据量数据的一种,征信信息近些年已经越来越受到金融及银行业的关注,它贯穿于客户的整个业务周期,对客户征信信息的监控可以有效的控制风险。据在银行业内的调查,银行很多业务如个贷、信用卡、客户识别、公司授信等均需要使用征信信息进行客户的风险把控。面对大数据量的征信信息需求,如何能够正确、快速的处理、存储并且有效的使用这些征信信息,是银行业在这方面急需解决的课题。本文从大数据征信信息的处理、存储及使用入手,以银行对征信信息管理和使用的实际业务需求出发,探讨在大数据环境下金融系统对数据处理、中间件消息传递以及数据挖掘的方法。提出采用分布式技术提高系统的可靠性,并运用其高扩展性解决对大数据的加工,使用IBM WebSphere Message Queue(以下简称MQ)集群及多实例技术提高消息中间件在大数据传输时的可靠性及易扩展性,并基于数据挖掘技术提出针对征信指标的智能校准算法。根据以上研究内容设计并实现了基于MQ多线程处理算法的征信信息管理系统。1.本文对现有金融系统在大数据环境下的现状及可能存在的问题进行分析,对集中式开发部署以及单实例消息中间件的不足进行阐述,提出了运用分布式技术的高可扩展性解决金融系统大数据加工的问题,运用MQ消息中间件的集群及多实例技术提高消息中间件在大数据传输时的传输稳定性并运用其易扩展性配合分布式技术。同时通过对现有征信信息的运用场景进行分析,研究对大数据征信信息的数据挖掘技术,提出一种通过聚类算法运用征信信息对征信指标进行校准的大数据运用场景。2.本文通过对征信信息实际管理及运用业务场景进行调研,对收集的需求进行分析,整理并划分了基于MQ多线程处理算法的征信信息管理系统需要具备的功能,并根据系统技术特点设计了系统的整体架构。对征信信息管理系统分布式处理方法、MQ消息中间件的集群及多实例技术、以及征信指标智能校准算法的设计进行详细阐述,并对系统的数据结构及报文接口进行了设计。3.本文在需求分析及总体设计的基础上,对征信信息管理系统的各功能模块以及MQ消息中间件的集群技术进行详细设计及实现,并阐述各模块的具体实现方式。4.本文模拟实际的业务场景,对MQ传输效率进行测试,对征信信息管理系统的综合性能进行评估。并使用实际业务数据,验证智能校准算法的有效性。最终通过交由实际业务人员进行使用并收集反馈,对系统整体使用效果进行分析。本文通过对面向大数据的征信信息管理系统的设计与实现,为征信信息搭建了一个集处理、存储、管控与智能优化的平台,希望能为金融及银行业在征信信息使用及管理方面提供帮助。