题目
()从交互数据中学习序列决策。A. 监督学习B. 无监督学习C. 强化学习D. 深度学习
()从交互数据中学习序列决策。
A. 监督学习
B. 无监督学习
C. 强化学习
D. 深度学习
题目解答
答案
C. 强化学习
解析
强化学习是一种机器学习方法,它通过与环境的交互来学习如何做出决策。在强化学习中,智能体(agent)通过执行动作(action)来与环境互动,并根据环境的反馈(奖励或惩罚)来调整其行为策略,以最大化累积奖励。这种方法特别适用于需要在一系列决策中学习最优策略的场景,如游戏、机器人导航等。