题目时序差分学习(TD)与蒙特卡洛方法的主要区别是()A. 蒙特卡洛方差更低B. TD需要环境模型C. TD使用自举法更新D. TD仅适用于离散状态时序差分学习(TD)与蒙特卡洛方法的主要区别是()A. 蒙特卡洛方差更低B. TD需要环境模型C. TD使用自举法更新D. TD仅适用于离散状态题目解答答案C. TD使用自举法更新