题目

以下哪项是强化学习的核心思想？（）A. 通过无监督学习聚类数据B. 通过智能体与环境的互动学习C. 通过训练数据学习D. 通过监督学习优化模型

以下哪项是强化学习的核心思想？（）

A. 通过无监督学习聚类数据

B. 通过智能体与环境的互动学习

C. 通过训练数据学习

D. 通过监督学习优化模型

题目解答

答案

B. 通过智能体与环境的互动学习

解析

本题考查强化学习的核心思想。强化学习（Reinforcement Learning, RL）是机器学习的一个分支，其核心在于智能体（Agent）与环境（Environment）的互动学习：智能体通过在环境中采取动作（Action）获得奖励（Reward）或惩罚，逐步学习到最优策略（Policy）以最大化长期累积奖励。

选项分析：

A. 通过无监督学习聚类数据：无监督学习是另一类机器学习，目标是发现数据的潜在结构（如聚类），与强化学习的互动式学习无关，排除。
B. 通过智能体与环境的互动学习：直接对应强化学习的核心逻辑——智能体在环境中试错、积累经验并优化策略，正确。
C. 通过训练数据学习：此描述过于宽泛，监督学习、无监督学习等均依赖训练数据，并非强化学习的独特核心，排除。
D. 通过监督学习优化模型：监督学习需标注数据（输入-输出对），通过最小化损失函数优化模型，与强化学习的“互动试错”核心不同，排除。