对用于分割任务的数据进行操作。可以利用Compose类将图像预处理/增强操作进行组合。
paddlex.seg.transforms.Compose(transforms)
根据数据预处理/数据增强列表对输入数据进行操作。使用示例
paddlex.seg.transforms.RandomHorizontalFlip(prob=0.5)
以一定的概率对图像进行水平翻转,模型训练时的数据增强操作。
paddlex.seg.transforms.RandomVerticalFlip(prob=0.1)
以一定的概率对图像进行垂直翻转,模型训练时的数据增强操作。
paddlex.seg.transforms.Resize(target_size, interp='LINEAR')
调整图像大小(resize)。
当目标大小(target_size)类型为list或tuple时,根据插值方式, 将图像resize为target_size, target_size的输入应为[w, h]或(w, h)。
target_size (int|list|tuple): 目标大小
interp (str): resize的插值方式,与opencv的插值方式对应, 可选的值为['NEAREST', 'LINEAR', 'CUBIC', 'AREA', 'LANCZOS4'],默认为"LINEAR"。
paddlex.seg.transforms.ResizeByLong(long_size)
对图像长边resize到固定值,短边按比例进行缩放。
paddlex.seg.transforms.ResizeRangeScaling(min_value=400, max_value=600)
对图像长边随机resize到指定范围内,短边按比例进行缩放,模型训练时的数据增强操作。
paddlex.seg.transforms.ResizeStepScaling(min_scale_factor=0.75, max_scale_factor=1.25, scale_step_size=0.25)
对图像按照某一个比例resize,这个比例以scale_step_size为步长,在[min_scale_factor, max_scale_factor]随机变动,模型训练时的数据增强操作。
paddlex.seg.transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
对图像进行标准化。
1.图像像素归一化到区间 [0.0, 1.0]。 2.对图像进行减均值除以标准差操作。
paddlex.seg.transforms.Padding(target_size, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)
对图像或标注图像进行padding,padding方向为右和下。根据提供的值对图像或标注图像进行padding操作。
paddlex.seg.transforms.RandomPaddingCrop(crop_size=512, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)
对图像和标注图进行随机裁剪,当所需要的裁剪尺寸大于原图时,则进行padding操作,模型训练时的数据增强操作。
paddlex.seg.transforms.RandomBlur(prob=0.1)
以一定的概率对图像进行高斯模糊,模型训练时的数据增强操作。
paddlex.seg.transforms.RandomRotate(rotate_range=15, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)
对图像进行随机旋转, 模型训练时的数据增强操作。
在旋转区间[-rotate_range, rotate_range]内,对图像进行随机旋转,当存在标注图像时,同步进行, 并对旋转后的图像和标注图像进行相应的padding。
paddlex.seg.transforms.RandomScaleAspect(min_scale=0.5, aspect_ratio=0.33)
裁剪并resize回原始尺寸的图像和标注图像,模型训练时的数据增强操作。
按照一定的面积比和宽高比对图像进行裁剪,并reszie回原始图像的图像,当存在标注图时,同步进行。
paddlex.seg.transforms.RandomDistort(brightness_range=0.5, brightness_prob=0.5, contrast_range=0.5, contrast_prob=0.5, saturation_range=0.5, saturation_prob=0.5, hue_range=18, hue_prob=0.5)
以一定的概率对图像进行随机像素内容变换,模型训练时的数据增强操作。
1.对变换的操作顺序进行随机化操作。 2.按照1中的顺序以一定的概率对图像在范围[-range, range]内进行随机像素内容变换。
【注意】该数据增强必须在数据增强Normalize之前使用。
paddlex.det.transforms.ComposedSegTransforms(mode, min_max_size=[400, 600], train_crop_shape=[769, 769], mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225], random_horizontal_flip=True)
语义分割DeepLab和UNet模型中已经组合好的数据处理流程,开发者可以直接使用ComposedSegTransforms,简化手动组合transforms的过程, 该类中已经包含了RandomHorizontalFlip、ResizeStepScaling、RandomPaddingCrop3种数据增强方式,你仍可以通过add_augmenters函数接口添加新的数据增强方式。
ComposedSegTransforms共包括以下几个步骤:
训练阶段:
- 随机对图像以0.5的概率水平翻转,若random_horizontal_flip为False,则跳过此步骤
- 按不同的比例随机Resize原图, 处理方式参考paddlex.seg.transforms.ResizeRangeScaling。若min_max_size为None,则跳过此步骤
- 从原图中随机crop出大小为train_crop_size大小的子图,如若crop出来的图小于train_crop_size,则会将图padding到对应大小
- 图像归一化 预测阶段:
- 将图像的最长边resize至(min_max_size[0] + min_max_size[1])//2, 短边按比例resize。若min_max_size为None,则跳过此步骤
- 图像归一化
train时生效。train时生效。ComposedSegTransforms.add_augmenters(augmenters)
参数
- augmenters(list): 数据增强方式列表
import paddlex as pdx
from paddlex.seg import transforms
train_transforms = transforms.ComposedSegTransforms(mode='train', train_crop_size=[512, 512])
eval_transforms = transforms.ComposedSegTransforms(mode='eval')
# 添加数据增强
import imgaug.augmenters as iaa
train_transforms.add_augmenters([
transforms.RandomDistort(),
iaa.blur.GaussianBlur(sigma=(0.0, 3.0))
])
上面代码等价于
import paddlex as pdx
from paddlex.det import transforms
train_transforms = transforms.Composed([
transforms.RandomDistort(),
iaa.blur.GaussianBlur(sigma=(0.0, 3.0)),
# 上面2行为通过add_augmenters额外添加的数据增强方式
transforms.RandomHorizontalFlip(prob=0.5),
transforms.ResizeStepScaling(),
transforms.PaddingCrop(crop_size=[512, 512]),
transforms.Normalize()
])
eval_transforms = transforms.Composed([
transforms.Normalize()
])