计算参数敏感度
paddlex.slim.cal_params_sensitivities(model, save_file, eval_dataset, batch_size=8)计算模型中可剪裁参数在验证集上的敏感度,并将敏感度信息保存至文件
save_file
- 获取模型中可剪裁卷积Kernel的名称。
- 计算每个可剪裁卷积Kernel不同剪裁率下的敏感度。
【注意】卷积的敏感度是指按照剪裁率将模型剪裁后模型精度的损失。选择合适的敏感度,对应地也能确定最终模型需要剪裁的参数列表和各剪裁参数对应的剪裁率。
参数
导出量化模型
paddlex.slim.export_quant_model(model, test_dataset, batch_size=2, batch_num=10, save_dir='./quant_model', cache_dir='./temp')导出量化模型,该接口实现了Post Quantization量化方式,需要传入测试数据集,并设定
batch_size和batch_num。量化过程中会以数量为batch_sizeXbatch_num的样本数据的计算结果为统计信息完成模型的量化。
参数
使用示例
import paddlex as pdx
model = pdx.load_model('vegetables_mobilenet')
test_dataset = pdx.datasets.ImageNet(
data_dir='vegetables_cls',
file_list='vegetables_cls/train_list.txt',
label_list='vegetables_cls/labels.txt',
transforms=model.eval_transforms)
pdx.slim.export_quant_model(model, test_dataset, save_dir='./quant_mobilenet')