题目
以下哪项是强化学习的核心思想?()A. 通过无监督学习聚类数据B. 通过智能体与环境的互动学习C. 通过训练数据学习D. 通过监督学习优化模型
以下哪项是强化学习的核心思想?()
A. 通过无监督学习聚类数据
B. 通过智能体与环境的互动学习
C. 通过训练数据学习
D. 通过监督学习优化模型
题目解答
答案
B. 通过智能体与环境的互动学习
解析
本题考查强化学习的核心思想。强化学习(Reinforcement Learning, RL)是机器学习的一个分支,其核心在于智能体(Agent)与环境(Environment)的互动学习:智能体通过在环境中采取动作(Action)获得奖励(Reward)或惩罚,逐步学习到最优策略(Policy)以最大化长期累积奖励。
选项分析:
- A. 通过无监督学习聚类数据:无监督学习是另一类机器学习,目标是发现数据的潜在结构(如聚类),与强化学习的互动式学习无关,排除。
- B. 通过智能体与环境的互动学习:直接对应强化学习的核心逻辑——智能体在环境中试错、积累经验并优化策略,正确。
- C. 通过训练数据学习:此描述过于宽泛,监督学习、无监督学习等均依赖训练数据,并非强化学习的独特核心,排除。
- D. 通过监督学习优化模型:监督学习需标注数据(输入-输出对),通过最小化损失函数优化模型,与强化学习的“互动试错”核心不同,排除。