paddlex.slim.cal_params_sensetives(model, save_file, eval_dataset, batch_size=8)
计算模型中可裁剪参数在验证集上的敏感度,并将敏感度信息保存至文件save_file
paddlex.slim.export_quant_model(model, test_dataset, batch_size=2, batch_num=10, save_dir='./quant_model', cache_dir='./temp')
导出量化模型,该接口实现了Post Quantization量化方式,需要传入测试数据集,并设定batch_size和batch_num,模型会以batch_size的大小计算batch_num批样本数据,并以这些样本数据的计算结果为统计信息进行模型量化。
* **model**(paddlex.cls.models/paddlex.det.models/paddlex.seg.models): paddlex加载的模型。
* **test_dataset**(paddlex.dataset): 测试数据集
* **batch_size**(int): 进行前向计算时的批数据大小
* **batch_num**(int): 进行向前计算时批数据数量
* **save_dir**(str): 量化后模型的保存目录
* **cache_dir**(str): 量化过程中的统计数据临时存储目录
import paddlex as pdx
model = pdx.load_model('vegetables_mobilenet')
test_dataset = pdx.datasets.ImageNet(
data_dir='vegetables_cls',
file_list='vegetables_cls/train_list.txt',
label_list='vegetables_cls/labels.txt',
transforms=model.eval_transforms)
pdx.slim.export_quant_model(model, test_dataset, save_dir='./quant_mobilenet')