对图像分类任务的数据进行操作。可以利用Compose类将图像预处理/增强操作进行组合。
paddlex.cls.transforms.Compose(transforms)
根据数据预处理/增强算子对输入数据进行操作。 使用示例
paddlex.cls.transforms.RandomCrop(crop_size=224, lower_scale=0.08, lower_ratio=3. / 4, upper_ratio=4. / 3)
对图像进行随机剪裁,模型训练时的数据增强操作。
paddlex.cls.transforms.RandomHorizontalFlip(prob=0.5)
以一定的概率对图像进行随机水平翻转,模型训练时的数据增强操作。
paddlex.cls.transforms.RandomVerticalFlip(prob=0.5)
以一定的概率对图像进行随机垂直翻转,模型训练时的数据增强操作。
paddlex.cls.transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
对图像进行标准化。
paddlex.cls.transforms.ResizeByShort(short_size=256, max_size=-1)
根据图像的短边调整图像大小(resize)。
paddlex.cls.transforms.CenterCrop(crop_size=224)
以图像中心点扩散裁剪长宽为crop_size的正方形
paddlex.cls.transforms.RandomRotate(rotate_range=30, prob=0.5)
以一定的概率对图像在[-rotate_range, rotaterange]角度范围内进行旋转,模型训练时的数据增强操作。
paddlex.cls.transforms.RandomDistort(brightness_range=0.9, brightness_prob=0.5, contrast_range=0.9, contrast_prob=0.5, saturation_range=0.9, saturation_prob=0.5, hue_range=18, hue_prob=0.5)
以一定的概率对图像进行随机像素内容变换,模型训练时的数据增强操作。
【注意】该数据增强必须在数据增强Normalize之前使用。
paddlex.cls.transforms.ComposedClsTransforms(mode, crop_size=[224, 224], mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
分类模型中已经组合好的数据处理流程,开发者可以直接使用ComposedClsTransforms,简化手动组合transforms的过程, 该类中已经包含了RandomCrop和RandomHorizontalFlip两种数据增强方式,你仍可以通过add_augmenters函数接口添加新的数据增强方式。
ComposedClsTransforms共包括以下几个步骤:
训练阶段:
- 随机从图像中crop一块子图,并resize成crop_size大小
- 将1的输出按0.5的概率随机进行水平翻转
- 将图像进行归一化 验证/预测阶段:
- 将图像按比例Resize,使得最小边长度为crop_size[0] * 1.14
- 从图像中心crop出一个大小为crop_size的图像
- 将图像进行归一化
ComposedClsTransforms.add_augmenters(augmenters)
参数
- augmenters(list): 数据增强方式列表
import paddlex as pdx
from paddlex.cls import transforms
train_transforms = transforms.ComposedClsTransforms(mode='train', crop_size=[320, 320])
eval_transforms = transforms.ComposedClsTransforms(mode='eval', crop_size=[320, 320])
# 添加数据增强
import imgaug.augmenters as iaa
train_transforms.add_augmenters([
transforms.RandomDistort(),
iaa.blur.GaussianBlur(sigma=(0.0, 3.0))
])
上面代码等价于
import paddlex as pdx
from paddlex.cls import transforms
train_transforms = transforms.Composed([
transforms.RandomDistort(),
iaa.blur.GaussianBlur(sigma=(0.0, 3.0)),
# 上面两个为通过add_augmenters额外添加的数据增强方式
transforms.RandomCrop(crop_size=320),
transforms.RandomHorizontalFlip(prob=0.5),
transforms.Normalize()
])
eval_transforms = transforms.Composed([
transforms.ResizeByShort(short_size=int(320*1.14)),
transforms.CenterCrop(crop_size=320),
transforms.Normalize()
])