题目
在强化学习中,Q学习属于哪种类型的算法?()A. 基于策略的算法B. 基于价值的算法C. 基于模型的算法D. 基于模拟的算法
在强化学习中,Q学习属于哪种类型的算法?()
A. 基于策略的算法
B. 基于价值的算法
C. 基于模型的算法
D. 基于模拟的算法
题目解答
答案
B. 基于价值的算法
解析
Q学习是一种基于价值的强化学习算法。它通过学习一个动作值函数(Q函数),来评估在给定状态下采取特定动作的长期预期回报。Q学习算法的目标是找到最优的Q函数,从而确定在任何状态下采取的最佳行动。因此,Q学习属于基于价值的算法。