边端融合的终端情境自适应深度感知模型
研究边端融合的深度模型终端情境自适应问题. 提出边端融合增强的模型压缩方法(X-ADMM),利用模型压缩技术简化模型结构,以层为粒度寻找模型最佳分割点,协同边端设备提高运行效率. 为了实现模型分割的动态自适应,提出基于图的自适应深度模型手术刀算法(GADS). 当模型运行情境(如存储、电量、带宽等)发生变化时,优先在邻近分割状态中快速搜索最能满足资源约束的分割点,实现快速自适应调整. 实验结果表明,该模型平均在 0.1 ms 内实现了模型分割点的自适应调优,在保证模型精度下降不超过 2.5% 的情况下,运行总时延最高下降了 56.65%.
- 2021-06-18
- 阅读748
- 下载1
- 13页
- pdf