题目

()从交互数据中学习序列决策。A. 监督学习B. 无监督学习C. 强化学习D. 深度学习

()从交互数据中学习序列决策。

A. 监督学习

B. 无监督学习

C. 强化学习

D. 深度学习

题目解答

C. 强化学习

强化学习是一种机器学习方法，它通过与环境的交互来学习如何做出决策。在强化学习中，智能体（agent）通过执行动作（action）来与环境互动，并根据环境的反馈（奖励或惩罚）来调整其行为策略，以最大化累积奖励。这种方法特别适用于需要在一系列决策中学习最优策略的场景，如游戏、机器人导航等。