自动驾驶算法——理解强化学习(二)

动态规划一般需要具备2个性质:最佳子结构→你可以将某些 RL 问题分解为≥2 个部分,然后解决它们,最后将它们组合起来找到最佳问题,从而解决该问题。重叠子问题→子问题可以出现多次,通过将问题分解为子问题,我们可以获得一些好处。

  • 2024-12-18
  • 收藏0
  • 阅读60

方案详情

评价

评分 :
   *