辅导男朋友转算法岗第24天|强化学习1

奔跑的跳跳 2024-09-08 17:34:11
今天我们开启啃强化学习啦,一个相当大的领域,从马尔可夫决策过程(MDP)和贝尔曼方程(bellman)开始一点一点学吧!

0 阅读:0