基于多副本的分布式存储是数据中心的主要数据存储方式,为应用提供可靠、高效的数据读 取服务。针对当前日益增多的大数据分析应用,以及频繁数据读取带来的较大能耗等问题,文章 分析异构存储系统数据读取能耗的差异,提出面向大数据处理的异构存储节能调度问题(Energy Reduction problem on Heterogeneous storage,ERH),并设计具有性能保证的随机任务调度算法。 该算法基于精确计算的概率,选择源存储设备,并证明所提算法以高概率收敛于最优值。大量仿真实 验表明,相较于目前主流的数据调度算法,该算法能降低 40% 的数据读取能耗。