经典强化学习算法:分层强化学习算法 —— options算法

Angry Panda / 2024-09-27 / 原文



论文地址:

https://people.cs.umass.edu/~barto/courses/cs687/Sutton-Precup-Singh-AIJ99.pdf



分层强化学习算法options的原论文中的定义:

image-20240927102653738

image-20240927110225485

image-20240927114922763



image-20240927120612917

image-20240927122400658



image-20240927125124396

image-20240927130801565



image-20240927165144578