题目

时序差分学习（TD）与蒙特卡洛方法的主要区别是（）A. TD使用自举法更新B. 蒙特卡洛方差更低C. TD需要环境模型D. TD仅适用于离散状态

时序差分学习（TD）与蒙特卡洛方法的主要区别是（）

A. TD使用自举法更新

B. 蒙特卡洛方差更低

C. TD需要环境模型

D. TD仅适用于离散状态

题目解答

知识总结

答案： A