基于强化学习的自学习遗传算法在船舶调度中的应用
【摘要】:随着船舶大型化趋势的发展及港口货物吞吐量的日益增长,大多数港口的发展现状已无法满足自身的发展需求,船舶滞港现象时有发生,导致港口船舶等待时间较长,有效调度进出港船舶是解决港口拥堵的根本方法。本文提出了一种基于强化学习的自学习遗传算法(Self-learning Genetic Algorithm Based on Reinforcement Learning, GA-RL)求解船舶调度问题。在GA-RL中,以遗传算法为基本优化模型,利用Q-learning算法自适应调整交叉和变异参数来提高算法的搜索能力。同时构建了能动态调参的马尔科夫决策过程(Markov Decision Process, MDP)模型。在MDP模型中,为了全面评估种群性能,提出了基于种群适应度函数的状态集,并设计了有效减少目标值的奖励机制。最后以黄骅港综合港区为例,选取不同组算例进行仿真实验,验证了模型和算法的有效性。本文所提方法可显著减少船舶在港等待时间并提升港口通航效率。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|