问题详情

答题翼 > 问答 > 大学本科 > 正文
目录: 标题| 题干| 答案| 搜索| 相关

强化学习中 ()主要探索未知的动作会产生的效果 有利于更新Q值 获得更好的策略。


强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

参考答案
您可能感兴趣的试题