基于TensorFlow的分布式深度学习技术
随着各大企业和研究机构在TensorFlow上训练越来越多的机器学习模型,项目的数据和计算能力需求正在急剧增加。在大部分情况下,模型是可以在单个或多 GPU 平台的服务器上运行的,但随着数据集的增大和训练时间的增长,有些时候训练需要一周甚至更长时间。因此,开发者们不得不寻求分布式训练的方法。
今天分享的内容包括分布式深度学习概述(深度学习模型、分布式计算框架、分布式训练目标),分布式TensorFlow、模型训练优化技术和分布式计算提升方法。
- 2021-08-06
- 阅读55
- 下载0
- 12页
- docx