问题详情

答题翼 > 问答 > 大学本科 > 正文
目录: 标题| 题干| 答案| 搜索| 相关

在强化学习过程中 ()表示随机地采取某个动作 以便于尝试各种结果;()表示采取当前认为最优的动


在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

参考答案
您可能感兴趣的试题