我的新闻

分享到:
[IEEE TPDS 2022, CCF A类] 祝贺团队论文被并行与分布式计算领域顶刊IEEE TPDS录用!
发布者: 杨树森 | 2022-05-23 | 15264

 CNNPC: End-Edge-Cloud Collaborative CNN Inference with Joint Model Partition and Compression(作者:Shusen Yang, Zhanhua Zhang, Cong Zhao, Xin Song, Siyan Guo, Hailiang Li)。该工作提出了高效的基于联合压缩划分的端边云协同深度学习推理框架CNNPC。该框架支持在任意卷积层之间进行模型划分,并可通过提出的通信驱动的模型压缩方法(剪枝量化)来可靠地减少任意卷积层之间的通信量。配合框架中提出的高效搜索算法,CNNPC可迅速得到满足精度/延时要求下最优的压缩划分方案,实现快速准确的端边云协同推理。通过在大量真实的端边云场景下进行验证,相较于现有单端及边云协同推理方法,CNNPC可以仅4.30%的通信开销在相同精度要求下实现高达5.6倍的推理速度提升。