题目

（）有跟环境进行交互，从反馈当中进行不断的学习的过程。A. 监督学习B. 非监督学习C. 强化学习D. 线性回归

（）有跟环境进行交互，从反馈当中进行不断的学习的过程。

A. 监督学习

B. 非监督学习

C. 强化学习

D. 线性回归

题目解答

C. 强化学习

考查要点：本题主要考查对机器学习不同方法核心特点的理解，特别是强化学习与其他学习方法的关键区别。

解题核心思路：
明确题目中“与环境交互”和“从反馈中学习”这两个关键点，对应强化学习的核心机制（通过试错和奖励信号调整行为）。需区分其他方法的特点：

破题关键点：
抓住“交互”和“反馈”这两个关键词，直接对应强化学习的定义。

强化学习的核心在于智能体（Agent）通过与环境交互，采取行动并获得奖励或惩罚的反馈，从而优化自身策略。例如，机器人在迷宫中通过尝试不同路径，根据是否找到出口（奖励）或撞墙（惩罚）调整后续行为。

其他选项分析：