关键词:
协同优化
分布式制造
阻塞约束
产品装配
Q-Learning算法
摘要:
在分布式调度中,调度策略的协同优化已逐渐成为分布式调度研究者与分布式制造行业决策者的重点关注方向之一。针对带装配机的分布式阻塞流水车间调度问题DBFSP-A,以最大装配完成时间为优化目标,提出一种基于Q-Learning的协同优化算法QLBC。首先,建立了以最大装配完成时间为优化目标的数学模型,以增强DBFSP-A的可解释性,在算法构造初始化阶段,QLBC充分利用DBFSP-A的问题特征,分别根据加工任务的总处理时间、前置延迟时间等特定的排序规则,构造式地产生高质量的、多样性的可行调度序列作为算法的初始解;其次,在QLBC的后续迭代中,采用基于Q-Learning的协同搜索策略,自主学习地指导当前解根据其各自状态及先验反馈选择合适的搜索操作,从而实现全局搜索和局部搜索、加工过程与组装过程的协同进化与协同优化;最后,在不同实例中,测试和检验了QLBC算法的性能。实验结果表明,相较于其他6种先进算法,QLBC求解的可行调度序列时间平均节省32.09 h,在提高生产效率、节约生产成本方面更具优势。