信息技术 神经网络表示与模型压缩 第 1 部分:卷积神经网络 是非强制性国家标准,您可以免费下载预览页
找不到引用T/AI 115.1-2021 信息技术 神经网络表示与模型压缩 第 1 部分:卷积神经网络 的标准
首先把卷积核通过DCT的变换产生频域系数,然后在频域上做K-Means聚类,挖掘卷积核与卷积核之间的冗余信息,最后利用如L1做通过权值最小的剪枝、量化、差分编码,得到压缩模型的文件。第二行是模型加速。压缩完成之后,我们不希望压缩后的模型在线上推理的时候还要解压缩。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved 京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号