关键词:
数据处理
数据挖掘
糖尿病视网膜
辅助诊断
系统实现
摘要:
随着互联网技术的大力发展,人们的生活水平得到显著提升,而医疗问题始终是与民生息息相关的大问题。在医疗信息化发展的过程中,医疗信息管理平台已经在医疗领域得到广泛的应用,各类医疗信息管理系统积攒了大量医疗数据。医疗数据挖掘发现数据中隐藏的信息,将其转换成医疗健康管理的智能辅助诊疗工具,为医护人员提供辅助诊断决策支持。利用现有技术对医疗信息平台存储的海量医疗数据进行信息挖掘成为医疗信息化建设未来智能化诊疗的大势所趋。糖尿病是以高血糖为特点的代谢性慢性病,由遗传、环境、自身免疫等因素相互作用导致。目前糖尿病患者主要靠药物控制糖尿病的进一步恶化,没有办法完全治愈。但是糖尿病患者的致命危害不是糖尿病本身,而是糖尿病患者后期的并发症。例如糖尿病肾病、糖尿病视网膜等不但严重影响糖尿病患者的日常生活,而且会导致失明等一系列致命风险。由于糖尿病视网膜早期不易发现、后期一旦发生病变药物难以逆转甚至导致失明是糖尿病性视网膜的两大显著特点,所以早发现、早治疗是控制糖尿病视网膜的有效手段。基于糖尿病视网膜的特点与需求,本课题抽取北京市平谷区医院糖尿病并发视网膜相关数据进行研究。本文对糖尿病视网膜辅助诊断模型的研究与实现主要包括三部分:(1)数据预处理。由于医疗数据形式多样保存在不同的医疗系统中,且在存储时格式不一,原始数据含有缺失值等质量问题。本研究在进行医疗信息提取与数据挖掘时,对原始数据进行了一系列预处理操作。(2)糖尿病视网膜辅助诊断模型的构建。对糖尿病视网膜患者数据统计分析,筛选出具有统计意义的属性。利用基于随机森林的递归特征消除法对具有统计意义的属性进行特征选择。针对原始数据集不平衡特点采用基于拔靴法(bootstrap)的上采样方法优化糖尿病视网膜模型。由于随机森林算法的重要参数随机,本研究利用网格搜索法改进随机森林,并结合K近邻算法(K-Nearest Neighbor,KNN)、决策树算法(Decision Tree,DT)等四种医疗领域常见方法进行对比发现,本研究经过优化后的模型分类效果均高于另外四种模型,研究成果具有推广价值。(3)医疗辅助诊断系统的构建与实现。本文经过对系统的需求调研,根据用户需求设计系统框架及主要功能模块,并对系统进行搭建以及可视化展示。并详细介绍了系统的主要功能和各个子模块的功能,并对系统主要功能的页面进行了展示。糖尿病视网膜辅助诊断系统依托于“数字医疗联合实验室”,对糖尿病数据进行整合分析,能够在未来辅助医护人员对糖尿病视网膜这一并发症进行决策支持。为医院节省资源,为患者节省开销,具有实际意义。