当前位置:首页 > 报告详情

基于 NNI 的 Transformer 系列模型压缩实践-张鑫-V2.pdf

上传人: 张** 编号:153159 2024-01-15 34页 3.27MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了NNI(神经网络压缩工具包)在Transformer系列模型压缩方面的实践和成果。NNI提供了一站式的AutoML工具,集成了量化、剪枝和蒸馏等多种模型压缩技术。实验结果表明,NNI能够有效地减少模型的参数量和计算量,同时保持模型的精度。例如,在BERT-MNLI数据集上,NNI的剪枝方法取得了超越SOTA的模型剪枝结果;在ViT-Cifar10和T5-WMT16(en-ro)数据集上也取得了较好的效果。NNI的压缩模块通过统一的框架融合了模型压缩的多种技术与方法,打通了从模型压缩到模型加速的整个流程,并具有较强的通用性。
"NNI如何优化Transformer模型压缩?" "如何使用NNI实现模型的剪枝和量化?" "NNI在模型压缩领域有哪些优势和应用?"
客服
商务合作
小程序
服务号
折叠