题目
43[判断题](2分)-|||-随机梯度下降法一定能保证获得最优解。() ()-|||-A. 错-|||-B.对

题目解答
答案
随机梯度下降法最终收敛的点不一定是全局最优解。
解析
随机梯度下降法(SGD)是一种优化算法,通过随机采样样本更新模型参数,计算效率高。但其无法保证获得全局最优解的原因包括:
- 非凸优化问题:实际问题(如深度学习)中损失函数常为非凸函数,存在多个局部最小值,SGD可能收敛到局部最优。
- 随机性:随机选择样本导致更新路径的随机性,不同路径可能收敛到不同解。
- 学习率影响:学习率设置不当可能导致震荡或过慢收敛,影响最终解的位置。
随机梯度下降法的核心是通过单个样本梯度近似整体梯度,加速迭代。但以下因素导致其无法保证全局最优:
- 非凸性:若目标函数非凸,全局最优可能不存在,SGD只能找到局部最优。
- 收敛性条件:即使函数凸,SGD需满足严格条件(如学习率递减)才能收敛到全局最优,实际应用中难以完全满足。
- 计算限制:实际训练中迭代次数有限,SGD可能未充分优化即终止。
综上,随机梯度下降法可能收敛到局部最优解或受实际条件限制无法达到全局最优,因此题目说法错误。