随着能源交易的逐步市场化,含电-气-热的多微网系统中微网服务商的零售价定价策略将影响到系统的运行和所有参与者的利益。为研究微网服务商的定价策略,首先详细描述了电-气-热多微网系统内部交易过程并建立了系统模型。随后这一定价问题被描述为斯塔克尔伯格博弈,并证明了该博弈存在唯一的均衡解。为保护各主体隐私,提出了一种基于强化学习的求解方法以求解存在时间耦合的斯塔克尔伯格博弈。算例研究表明,该方法准确有效地解决了所提出的定价策略问题,微网服务商和各微网均采取了有效策略以保证自身利益。同时,该方法有效保护了市场参与者的隐私并展现了良好的计算性能。