从浅层模型到深度模型:概览机器学习优化算法
本篇论文旨在介绍关于将最优化方法应用于机器学习的关键模型、算法、以及一些开放性问题。这篇论文是写给有一定知识储备的读者,尤其是那些熟悉基础优化算法但是不了解机器学习的读者。首先,我们推导出一个监督学习问题的公式,并说明它是如何基于上下文和基本假设产生各种优化问题。然后,我们讨论这些优化问题的一些显著特征,重点讨论 logistic 回归和深层神经网络训练的案例。本文的后半部分重点介绍几种优化算法,首先是凸 logistic 回归,然后讨论一阶方法,包括了随机梯度法(SGD)、方差缩减随机方法(variance reducing stochastic method)和二阶方法的使用。最后,我们将讨论如何将这些方法应用于深层神经网络的训练,并着重描述这些模型的复杂非凸结构所带来的困难。
- 2021-04-18
- 阅读355
- 下载0
- 11页
- pdf