问题详情

答题翼 > 问答 > 大学本科 > 正文
目录: 标题| 题干| 答案| 搜索| 相关

在ε-greedy策略当中 ε的值越大 表示采用随机的一个动作的概率越() 采用当前Q函数值最大的动作


在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

参考答案
您可能感兴趣的试题