题目
在强化学习中,“探索与利用”的权衡是指什么?A. 选择已知的最佳行为与尝试新行为之间的决策C. 最大化奖励与最小化惩罚之间的平衡
在强化学习中,“探索与利用”的权衡是指什么?
A. 选择已知的最佳行为与尝试新行为之间的决策
C. 最大化奖励与最小化惩罚之间的平衡
题目解答
答案
A. 选择已知的最佳行为与尝试新行为之间的决策
解析
在强化学习中,“探索与利用”的权衡是指智能体在选择已知的最佳行为(利用)与尝试新行为(探索)之间的决策。这种权衡是智能体在学习过程中需要解决的关键问题之一,因为智能体需要在已知的高回报行为和可能带来更高回报的新行为之间做出选择。