关键词:
数据库管理系统
参数调优
深度强化学习
大语言模型
知识嵌入
摘要:
在当今数据驱动时代,优化数据库管理系统(DBMS)的性能对于支撑广泛的商业、科研和技术应用变得越来越重要。随着技术的发展和应用场景的多样化,现代DBMS变得日益复杂,配置参数的适当设置对于确保数据库系统高效运行至关重要。然而,传统手动参数调优不仅耗时且依赖专家经验,不足以应对复杂和动态的工作负载。近年来,随着人工智能技术的发展,特别是机器学习和深度强化学习,为自动化数据库参数调优提供了新的可能性,但现有方法大多采用黑盒模型,仅考虑了数据库性能反馈作为调优依据,效率和效果受限于试验次数和范围。
本论文结合最新的大语言模型(LLM)等人工智能技术,探索基于知识的数据库系统参数调优新途径。论文贡献点如下:1.设计了一个基于大模型的数据库调优知识提取算法,利用RAG流程和LLM的语言理解能力和专家知识,自动提取数据库调优文档和手册中的知识,并且通过提示工程方法提升知识提取的准确性。2.提出了一种名为Ke Tune的支持知识嵌入的深度强化学习(DRL)数据库参数调优方法,结合提取的知识与DDPG模型,设计了支持知识嵌入的调优模型架构。同时还提出基于知识的参数推荐算法初始化、基于过滤等级的奖励值优化策略等方法实现知识的有效嵌入,以提升调优效率和效果。3.基于以上算法设计并实现基于知识的数据库参数调优原型系统。以Llama Index和GPT-4-Turbo实现了从数据库手册和调优文档中提取知识的RAG过程,并在Postgre SQL数据库上验证了知识嵌入的参数调优算法的有效性。
实验结果显示,KeTune在TPC-H和TPC-C两组工作负载下的调优效果均优于传统DDPG模型。在TPC-H工作负载下,当调参旋钮数量为40个时,Ke Tune模型相比DDPG模型降低延迟约21.9%;在TPC-C工作负载下,提升吞吐量约5.7%。实验结果表明,Ke Tune能够有效地利用提取的知识指导调优过程,显著提高数据库性能,同时保证了系统的稳定性和安全性。