4 gadi atpakaļ · 4e3094afa4
--- a/dygraph/PaddleDetection
+++ b/dygraph/PaddleDetection
@@ -1 +1 @@
 
				-Subproject commit 66d7eefab9aca8243ddf49a52b748b786b80ffb5
			
 
				+Subproject commit c987dc1e543f1e489a32b165d7078b591d2ca363
			
--- a/dygraph/paddlex/cv/datasets/coco.py
+++ b/dygraph/paddlex/cv/datasets/coco.py
@@ -57,12 +57,14 @@ class CocoDetection(VOCDetection):
 
				         super(VOCDetection, self).__init__()
			
 
				         self.data_fields = None
			
 
				         self.transforms = copy.deepcopy(transforms)
			
 
				+        self.num_max_boxes = 50
			
 
				         self.use_mix = False
			
 
				         if self.transforms is not None:
			
 
				             for op in self.transforms.transforms:
			
 
				                 if isinstance(op, MixupImage):
			
 
				                     self.mixup_op = copy.deepcopy(op)
			
 
				                     self.use_mix = True
			
 
				+                    self.num_max_boxes *= 2
			
 
				                     break
			
 
				 
			
 
				         self.batch_transforms = None
			
@@ -153,6 +155,11 @@ class CocoDetection(VOCDetection):
 
				                 **
			
 
				                 label_info
			
 
				             }))
			
 
				+        if self.use_mix:
			
 
				+            self.num_max_boxes = max(self.num_max_boxes, 2 * len(instances))
			
 
				+        else:
			
 
				+            self.num_max_boxes = max(self.num_max_boxes, len(instances))
			
 
				+
			
 
				         if not len(self.file_list) > 0:
			
 
				             raise Exception('not found any coco record in %s' % ann_file)
			
 
				         logging.info("{} samples in file {}".format(
			
--- a/dygraph/paddlex/cv/datasets/voc.py
+++ b/dygraph/paddlex/cv/datasets/voc.py
@@ -56,6 +56,7 @@ class VOCDetection(Dataset):
 
				         super(VOCDetection, self).__init__()
			
 
				         self.data_fields = None
			
 
				         self.transforms = copy.deepcopy(transforms)
			
 
				+        self.num_max_boxes = 50
			
 
				 
			
 
				         self.use_mix = False
			
 
				         if self.transforms is not None:
			
@@ -63,6 +64,7 @@ class VOCDetection(Dataset):
 
				                 if isinstance(op, MixupImage):
			
 
				                     self.mixup_op = copy.deepcopy(op)
			
 
				                     self.use_mix = True
			
 
				+                    self.num_max_boxes *= 2
			
 
				                     break
			
 
				 
			
 
				         self.batch_transforms = None
			
@@ -257,6 +259,11 @@ class VOCDetection(Dataset):
 
				                         'id': int(im_id[0]),
			
 
				                         'file_name': osp.split(img_file)[1]
			
 
				                     })
			
 
				+                if self.use_mix:
			
 
				+                    self.num_max_boxes = max(self.num_max_boxes, 2 * len(objs))
			
 
				+                else:
			
 
				+                    self.num_max_boxes = max(self.num_max_boxes, len(objs))
			
 
				+
			
 
				         if not len(self.file_list) > 0:
			
 
				             raise Exception('not found any voc record in %s' % (file_list))
			
 
				         logging.info("{} samples in file {}".format(
			
--- a/dygraph/paddlex/cv/models/detector.py
+++ b/dygraph/paddlex/cv/models/detector.py
@@ -192,9 +192,10 @@ class BaseDetector(BaseModel):
 
				                 "Evaluation metric {} is not supported, please choose form 'COCO' and 'VOC'"
			
 
				             self.metric = metric.lower()
			
 
				 
			
 
				+        self.labels = train_dataset.labels
			
 
				+        self.num_max_boxes = train_dataset.num_max_boxes
			
 
				         train_dataset.batch_transforms = self._compose_batch_transform(
			
 
				             train_dataset.transforms, mode='train')
			
 
				-        self.labels = train_dataset.labels
			
 
				 
			
 
				         # build optimizer if not defined
			
 
				         if optimizer is None:
			
@@ -334,12 +335,24 @@ class BaseDetector(BaseModel):
 
				             collections.OrderedDict with key-value pairs: {"mAP(0.50, 11point)":`mean average precision`}.
			
 
				 
			
 
				         """
			
 
				-        if eval_dataset.__class__.__name__ == 'VOCDetection':
			
 
				+
			
 
				+        if metric is None:
			
 
				+            if not hasattr(self, 'metric'):
			
 
				+                if eval_dataset.__class__.__name__ == 'VOCDetection':
			
 
				+                    self.metric = 'voc'
			
 
				+                elif eval_dataset.__class__.__name__ == 'CocoDetection':
			
 
				+                    self.metric = 'coco'
			
 
				+        else:
			
 
				+            assert metric.lower() in ['coco', 'voc'], \
			
 
				+                "Evaluation metric {} is not supported, please choose form 'COCO' and 'VOC'"
			
 
				+            self.metric = metric.lower()
			
 
				+
			
 
				+        if self.metric == 'voc':
			
 
				             eval_dataset.data_fields = {
			
 
				                 'im_id', 'image_shape', 'image', 'gt_bbox', 'gt_class',
			
 
				                 'difficult'
			
 
				             }
			
 
				-        elif eval_dataset.__class__.__name__ == 'CocoDetection':
			
 
				+        elif self.metric == 'coco':
			
 
				             if self.__class__.__name__ == 'MaskRCNN':
			
 
				                 eval_dataset.data_fields = {
			
 
				                     'im_id', 'image_shape', 'image', 'gt_bbox', 'gt_class',
			
@@ -380,41 +393,16 @@ class BaseDetector(BaseModel):
 
				                 is_bbox_normalized = any(
			
 
				                     isinstance(t, _NormalizeBox)
			
 
				                     for t in eval_dataset.batch_transforms.batch_transforms)
			
 
				-            if metric is None:
			
 
				-                if getattr(self, 'metric', None) is not None:
			
 
				-                    if self.metric == 'voc':
			
 
				-                        eval_metric = VOCMetric(
			
 
				-                            labels=eval_dataset.labels,
			
 
				-                            coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				-                            is_bbox_normalized=is_bbox_normalized,
			
 
				-                            classwise=False)
			
 
				-                    else:
			
 
				-                        eval_metric = COCOMetric(
			
 
				-                            coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				-                            classwise=False)
			
 
				-                else:
			
 
				-                    if eval_dataset.__class__.__name__ == 'VOCDetection':
			
 
				-                        eval_metric = VOCMetric(
			
 
				-                            labels=eval_dataset.labels,
			
 
				-                            coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				-                            is_bbox_normalized=is_bbox_normalized,
			
 
				-                            classwise=False)
			
 
				-                    elif eval_dataset.__class__.__name__ == 'CocoDetection':
			
 
				-                        eval_metric = COCOMetric(
			
 
				-                            coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				-                            classwise=False)
			
 
				+            if self.metric == 'voc':
			
 
				+                eval_metric = VOCMetric(
			
 
				+                    labels=eval_dataset.labels,
			
 
				+                    coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				+                    is_bbox_normalized=is_bbox_normalized,
			
 
				+                    classwise=False)
			
 
				             else:
			
 
				-                assert metric.lower() in ['coco', 'voc'], \
			
 
				-                    "Evaluation metric {} is not supported, please choose form 'COCO' and 'VOC'"
			
 
				-                if metric.lower() == 'coco':
			
 
				-                    eval_metric = COCOMetric(
			
 
				-                        coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				-                        classwise=False)
			
 
				-                else:
			
 
				-                    eval_metric = VOCMetric(
			
 
				-                        labels=eval_dataset.labels,
			
 
				-                        is_bbox_normalized=is_bbox_normalized,
			
 
				-                        classwise=False)
			
 
				+                eval_metric = COCOMetric(
			
 
				+                    coco_gt=copy.deepcopy(eval_dataset.coco_gt),
			
 
				+                    classwise=False)
			
 
				             scores = collections.OrderedDict()
			
 
				             logging.info(
			
 
				                 "Start to evaluate(total_samples={}, total_steps={})...".
			
@@ -649,8 +637,7 @@ class YOLOv3(BaseDetector):
 
				     def _compose_batch_transform(self, transforms, mode='train'):
			
 
				         if mode == 'train':
			
 
				             default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=-1, pad_gt=False), _NormalizeBox(),
			
 
				+                _BatchPadding(pad_to_stride=-1), _NormalizeBox(),
			
 
				                 _PadBox(getattr(self, 'num_max_boxes', 50)), _BboxXYXY2XYWH(),
			
 
				                 _Gt2YoloTarget(
			
 
				                     anchor_masks=self.anchor_masks,
			
@@ -660,10 +647,11 @@ class YOLOv3(BaseDetector):
 
				                     num_classes=self.num_classes)
			
 
				             ]
			
 
				         else:
			
 
				-            default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=-1, pad_gt=False)
			
 
				-            ]
			
 
				+            default_batch_transforms = [_BatchPadding(pad_to_stride=-1)]
			
 
				+        if mode == 'eval' and self.metric == 'voc':
			
 
				+            collate_batch = False
			
 
				+        else:
			
 
				+            collate_batch = True
			
 
				 
			
 
				         custom_batch_transforms = []
			
 
				         for i, op in enumerate(transforms.transforms):
			
@@ -675,8 +663,9 @@ class YOLOv3(BaseDetector):
 
				                         "Please check the {} transforms.".format(mode))
			
 
				                 custom_batch_transforms.insert(0, copy.deepcopy(op))
			
 
				 
			
 
				-        batch_transforms = BatchCompose(custom_batch_transforms +
			
 
				-                                        default_batch_transforms)
			
 
				+        batch_transforms = BatchCompose(
			
 
				+            custom_batch_transforms + default_batch_transforms,
			
 
				+            collate_batch=collate_batch)
			
 
				 
			
 
				         return batch_transforms
			
 
				 
			
@@ -901,14 +890,14 @@ class FasterRCNN(BaseDetector):
 
				     def _compose_batch_transform(self, transforms, mode='train'):
			
 
				         if mode == 'train':
			
 
				             default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=32 if self.with_fpn else -1, pad_gt=True)
			
 
				+                _BatchPadding(pad_to_stride=32 if self.with_fpn else -1)
			
 
				             ]
			
 
				+            collate_batch = False
			
 
				         else:
			
 
				             default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=32 if self.with_fpn else -1, pad_gt=False)
			
 
				+                _BatchPadding(pad_to_stride=32 if self.with_fpn else -1)
			
 
				             ]
			
 
				+            collate_batch = True
			
 
				         custom_batch_transforms = []
			
 
				         for i, op in enumerate(transforms.transforms):
			
 
				             if isinstance(op, (BatchRandomResize, BatchRandomResizeByShort)):
			
@@ -919,8 +908,9 @@ class FasterRCNN(BaseDetector):
 
				                         "Please check the {} transforms.".format(mode))
			
 
				                 custom_batch_transforms.insert(0, copy.deepcopy(op))
			
 
				 
			
 
				-        batch_transforms = BatchCompose(custom_batch_transforms +
			
 
				-                                        default_batch_transforms)
			
 
				+        batch_transforms = BatchCompose(
			
 
				+            custom_batch_transforms + default_batch_transforms,
			
 
				+            collate_batch=collate_batch)
			
 
				 
			
 
				         return batch_transforms
			
 
				 
			
@@ -1189,7 +1179,6 @@ class PPYOLOTiny(YOLOv3):
 
				         self.anchors = anchors
			
 
				         self.anchor_masks = anchor_masks
			
 
				         self.downsample_ratios = downsample_ratios
			
 
				-        self.num_max_boxes = 100
			
 
				         self.model_name = 'PPYOLOTiny'
			
 
				 
			
 
				 
			
@@ -1313,7 +1302,6 @@ class PPYOLOv2(YOLOv3):
 
				         self.anchors = anchors
			
 
				         self.anchor_masks = anchor_masks
			
 
				         self.downsample_ratios = downsample_ratios
			
 
				-        self.num_max_boxes = 100
			
 
				         self.model_name = 'PPYOLOv2'
			
 
				 
			
 
				 
			
@@ -1542,14 +1530,14 @@ class MaskRCNN(BaseDetector):
 
				     def _compose_batch_transform(self, transforms, mode='train'):
			
 
				         if mode == 'train':
			
 
				             default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=32 if self.with_fpn else -1, pad_gt=True)
			
 
				+                _BatchPadding(pad_to_stride=32 if self.with_fpn else -1)
			
 
				             ]
			
 
				+            collate_batch = False
			
 
				         else:
			
 
				             default_batch_transforms = [
			
 
				-                _BatchPadding(
			
 
				-                    pad_to_stride=32 if self.with_fpn else -1, pad_gt=False)
			
 
				+                _BatchPadding(pad_to_stride=32 if self.with_fpn else -1)
			
 
				             ]
			
 
				+            collate_batch = True
			
 
				         custom_batch_transforms = []
			
 
				         for i, op in enumerate(transforms.transforms):
			
 
				             if isinstance(op, (BatchRandomResize, BatchRandomResizeByShort)):
			
@@ -1560,7 +1548,8 @@ class MaskRCNN(BaseDetector):
 
				                         "Please check the {} transforms.".format(mode))
			
 
				                 custom_batch_transforms.insert(0, copy.deepcopy(op))
			
 
				 
			
 
				-        batch_transforms = BatchCompose(custom_batch_transforms +
			
 
				-                                        default_batch_transforms)
			
 
				+        batch_transforms = BatchCompose(
			
 
				+            custom_batch_transforms + default_batch_transforms,
			
 
				+            collate_batch=collate_batch)
			
 
				 
			
 
				         return batch_transforms
			
--- a/dygraph/paddlex/cv/models/utils/det_metrics/coco_utils.py
+++ b/dygraph/paddlex/cv/models/utils/det_metrics/coco_utils.py
@@ -20,9 +20,8 @@ import sys
 
				 import copy
			
 
				 import numpy as np
			
 
				 import itertools
			
 
				-
			
 
				+from ppdet.metrics.map_utils import draw_pr_curve
			
 
				 from .json_results import get_det_res, get_det_poly_res, get_seg_res, get_solov2_segm_res
			
 
				-from .map_utils import _draw_pr_curve
			
 
				 
			
 
				 import paddlex.utils.logging as logging
			
 
				 
			
@@ -123,7 +122,7 @@ def cocoapi_eval(anns,
 
				                 (str(nm["name"]), '{:0.3f}'.format(float(ap))))
			
 
				             pr_array = precisions[0, :, idx, 0, 2]
			
 
				             recall_array = np.arange(0.0, 1.01, 0.01)
			
 
				-            _draw_pr_curve(
			
 
				+            draw_pr_curve(
			
 
				                 pr_array,
			
 
				                 recall_array,
			
 
				                 out_dir=style + '_pr_curve',
			
@@ -133,7 +132,7 @@ def cocoapi_eval(anns,
 
				         results_flatten = list(itertools.chain(*results_per_category))
			
 
				         headers = ['category', 'AP'] * (num_columns // 2)
			
 
				         results_2d = itertools.zip_longest(
			
 
				-            * [results_flatten[i::num_columns] for i in range(num_columns)])
			
 
				+            *[results_flatten[i::num_columns] for i in range(num_columns)])
			
 
				         table_data = [headers]
			
 
				         table_data += [result for result in results_2d]
			
 
				         table = AsciiTable(table_data)
			
--- a/dygraph/paddlex/cv/models/utils/det_metrics/map_utils.py
+++ b/dygraph/paddlex/cv/models/utils/det_metrics/map_utils.py
@@ -1,305 +0,0 @@
 
				-# Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
			
 
				-#
			
 
				-# Licensed under the Apache License, Version 2.0 (the "License");
			
 
				-# you may not use this file except in compliance with the License.
			
 
				-# You may obtain a copy of the License at
			
 
				-#
			
 
				-#     http://www.apache.org/licenses/LICENSE-2.0
			
 
				-#
			
 
				-# Unless required by applicable law or agreed to in writing, software
			
 
				-# distributed under the License is distributed on an "AS IS" BASIS,
			
 
				-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
			
 
				-# See the License for the specific language governing permissions and
			
 
				-# limitations under the License.
			
 
				-
			
 
				-from __future__ import absolute_import
			
 
				-from __future__ import division
			
 
				-from __future__ import print_function
			
 
				-from __future__ import unicode_literals
			
 
				-
			
 
				-import os
			
 
				-import sys
			
 
				-import numpy as np
			
 
				-import itertools
			
 
				-import paddlex.utils.logging as logging
			
 
				-
			
 
				-__all__ = [
			
 
				-    '_draw_pr_curve', 'bbox_area', 'jaccard_overlap', 'prune_zero_padding',
			
 
				-    'DetectionMAP'
			
 
				-]
			
 
				-
			
 
				-
			
 
				-def _draw_pr_curve(precision,
			
 
				-                   recall,
			
 
				-                   iou=0.5,
			
 
				-                   out_dir='pr_curve',
			
 
				-                   file_name='precision_recall_curve.jpg'):
			
 
				-    if not os.path.exists(out_dir):
			
 
				-        os.makedirs(out_dir)
			
 
				-    output_path = os.path.join(out_dir, file_name)
			
 
				-    try:
			
 
				-        import matplotlib.pyplot as plt
			
 
				-    except Exception as e:
			
 
				-        logging.error('Matplotlib not found, plaese install matplotlib.'
			
 
				-                      'for example: `pip install matplotlib`.')
			
 
				-        raise e
			
 
				-    plt.cla()
			
 
				-    plt.figure('P-R Curve')
			
 
				-    plt.title('Precision/Recall Curve(IoU={})'.format(iou))
			
 
				-    plt.xlabel('Recall')
			
 
				-    plt.ylabel('Precision')
			
 
				-    plt.grid(True)
			
 
				-    plt.plot(recall, precision)
			
 
				-    plt.savefig(output_path)
			
 
				-
			
 
				-
			
 
				-def bbox_area(bbox, is_bbox_normalized):
			
 
				-    """
			
 
				-    Calculate area of a bounding box
			
 
				-    """
			
 
				-    norm = 1. - float(is_bbox_normalized)
			
 
				-    width = bbox[2] - bbox[0] + norm
			
 
				-    height = bbox[3] - bbox[1] + norm
			
 
				-    return width * height
			
 
				-
			
 
				-
			
 
				-def jaccard_overlap(pred, gt, is_bbox_normalized=False):
			
 
				-    """
			
 
				-    Calculate jaccard overlap ratio between two bounding box
			
 
				-    """
			
 
				-    if pred[0] >= gt[2] or pred[2] <= gt[0] or \
			
 
				-        pred[1] >= gt[3] or pred[3] <= gt[1]:
			
 
				-        return 0.
			
 
				-    inter_xmin = max(pred[0], gt[0])
			
 
				-    inter_ymin = max(pred[1], gt[1])
			
 
				-    inter_xmax = min(pred[2], gt[2])
			
 
				-    inter_ymax = min(pred[3], gt[3])
			
 
				-    inter_size = bbox_area([inter_xmin, inter_ymin, inter_xmax, inter_ymax],
			
 
				-                           is_bbox_normalized)
			
 
				-    pred_size = bbox_area(pred, is_bbox_normalized)
			
 
				-    gt_size = bbox_area(gt, is_bbox_normalized)
			
 
				-    overlap = float(inter_size) / (pred_size + gt_size - inter_size)
			
 
				-    return overlap
			
 
				-
			
 
				-
			
 
				-def prune_zero_padding(gt_box, gt_label, difficult=None):
			
 
				-    valid_cnt = 0
			
 
				-    for i in range(len(gt_box)):
			
 
				-        if gt_box[i, 0] == 0 and gt_box[i, 1] == 0 and \
			
 
				-                gt_box[i, 2] == 0 and gt_box[i, 3] == 0:
			
 
				-            break
			
 
				-        valid_cnt += 1
			
 
				-    return (gt_box[:valid_cnt], gt_label[:valid_cnt], difficult[:valid_cnt]
			
 
				-            if difficult is not None else None)
			
 
				-
			
 
				-
			
 
				-class DetectionMAP(object):
			
 
				-    """
			
 
				-    Calculate detection mean average precision.
			
 
				-    Currently support two types: 11point and integral
			
 
				-
			
 
				-    Args:
			
 
				-        class_num (int): The class number.
			
 
				-        overlap_thresh (float): The threshold of overlap
			
 
				-            ratio between prediction bounding box and
			
 
				-            ground truth bounding box for deciding
			
 
				-            true/false positive. Default 0.5.
			
 
				-        map_type (str): Calculation method of mean average
			
 
				-            precision, currently support '11point' and
			
 
				-            'integral'. Default '11point'.
			
 
				-        is_bbox_normalized (bool): Whether bounding boxes
			
 
				-            is normalized to range[0, 1]. Default False.
			
 
				-        evaluate_difficult (bool): Whether to evaluate
			
 
				-            difficult bounding boxes. Default False.
			
 
				-        catid2name (dict): Mapping between category id and category name.
			
 
				-        classwise (bool): Whether per-category AP and draw
			
 
				-            P-R Curve or not.
			
 
				-    """
			
 
				-
			
 
				-    def __init__(self,
			
 
				-                 class_num,
			
 
				-                 overlap_thresh=0.5,
			
 
				-                 map_type='11point',
			
 
				-                 is_bbox_normalized=False,
			
 
				-                 evaluate_difficult=False,
			
 
				-                 catid2name=None,
			
 
				-                 classwise=False):
			
 
				-        self.class_num = class_num
			
 
				-        self.overlap_thresh = overlap_thresh
			
 
				-        assert map_type in ['11point', 'integral'], \
			
 
				-                "map_type currently only support '11point' "\
			
 
				-                "and 'integral'"
			
 
				-        self.map_type = map_type
			
 
				-        self.is_bbox_normalized = is_bbox_normalized
			
 
				-        self.evaluate_difficult = evaluate_difficult
			
 
				-        self.classwise = classwise
			
 
				-        self.classes = []
			
 
				-        for cname in catid2name.values():
			
 
				-            self.classes.append(cname)
			
 
				-        self.reset()
			
 
				-
			
 
				-    def update(self, bbox, score, label, gt_box, gt_label, difficult=None):
			
 
				-        """
			
 
				-        Update metric statics from given prediction and ground
			
 
				-        truth infomations.
			
 
				-        """
			
 
				-        if difficult is None:
			
 
				-            difficult = np.zeros_like(gt_label)
			
 
				-
			
 
				-        # record class gt count
			
 
				-        for gtl, diff in zip(gt_label, difficult):
			
 
				-            if self.evaluate_difficult or int(diff) == 0:
			
 
				-                self.class_gt_counts[int(np.array(gtl))] += 1
			
 
				-
			
 
				-        # record class score positive
			
 
				-        visited = [False] * len(gt_label)
			
 
				-        for b, s, l in zip(bbox, score, label):
			
 
				-            xmin, ymin, xmax, ymax = b.tolist()
			
 
				-            pred = [xmin, ymin, xmax, ymax]
			
 
				-            max_idx = -1
			
 
				-            max_overlap = -1.0
			
 
				-            for i, gl in enumerate(gt_label):
			
 
				-                if int(gl) == int(l):
			
 
				-                    overlap = jaccard_overlap(pred, gt_box[i],
			
 
				-                                              self.is_bbox_normalized)
			
 
				-                    if overlap > max_overlap:
			
 
				-                        max_overlap = overlap
			
 
				-                        max_idx = i
			
 
				-
			
 
				-            if max_overlap > self.overlap_thresh:
			
 
				-                if self.evaluate_difficult or \
			
 
				-                        int(np.array(difficult[max_idx])) == 0:
			
 
				-                    if not visited[max_idx]:
			
 
				-                        self.class_score_poss[int(l)].append([s, 1.0])
			
 
				-                        visited[max_idx] = True
			
 
				-                    else:
			
 
				-                        self.class_score_poss[int(l)].append([s, 0.0])
			
 
				-            else:
			
 
				-                self.class_score_poss[int(l)].append([s, 0.0])
			
 
				-
			
 
				-    def reset(self):
			
 
				-        """
			
 
				-        Reset metric statics
			
 
				-        """
			
 
				-        self.class_score_poss = [[] for _ in range(self.class_num)]
			
 
				-        self.class_gt_counts = [0] * self.class_num
			
 
				-        self.mAP = None
			
 
				-
			
 
				-    def accumulate(self):
			
 
				-        """
			
 
				-        Accumulate metric results and calculate mAP
			
 
				-        """
			
 
				-        mAP = 0.
			
 
				-        valid_cnt = 0
			
 
				-        eval_results = []
			
 
				-        for score_pos, count in zip(self.class_score_poss,
			
 
				-                                    self.class_gt_counts):
			
 
				-            if count == 0: continue
			
 
				-            if len(score_pos) == 0:
			
 
				-                valid_cnt += 1
			
 
				-                continue
			
 
				-
			
 
				-            accum_tp_list, accum_fp_list = \
			
 
				-                    self._get_tp_fp_accum(score_pos)
			
 
				-            precision = []
			
 
				-            recall = []
			
 
				-            for ac_tp, ac_fp in zip(accum_tp_list, accum_fp_list):
			
 
				-                precision.append(float(ac_tp) / (ac_tp + ac_fp))
			
 
				-                recall.append(float(ac_tp) / count)
			
 
				-
			
 
				-            one_class_ap = 0.0
			
 
				-            if self.map_type == '11point':
			
 
				-                max_precisions = [0.] * 11
			
 
				-                start_idx = len(precision) - 1
			
 
				-                for j in range(10, -1, -1):
			
 
				-                    for i in range(start_idx, -1, -1):
			
 
				-                        if recall[i] < float(j) / 10.:
			
 
				-                            start_idx = i
			
 
				-                            if j > 0:
			
 
				-                                max_precisions[j - 1] = max_precisions[j]
			
 
				-                                break
			
 
				-                        else:
			
 
				-                            if max_precisions[j] < precision[i]:
			
 
				-                                max_precisions[j] = precision[i]
			
 
				-                one_class_ap = sum(max_precisions) / 11.
			
 
				-                mAP += one_class_ap
			
 
				-                valid_cnt += 1
			
 
				-            elif self.map_type == 'integral':
			
 
				-                import math
			
 
				-                prev_recall = 0.
			
 
				-                for i in range(len(precision)):
			
 
				-                    recall_gap = math.fabs(recall[i] - prev_recall)
			
 
				-                    if recall_gap > 1e-6:
			
 
				-                        one_class_ap += precision[i] * recall_gap
			
 
				-                        prev_recall = recall[i]
			
 
				-                mAP += one_class_ap
			
 
				-                valid_cnt += 1
			
 
				-            else:
			
 
				-                logging.error("Unspported mAP type {}".format(self.map_type))
			
 
				-                sys.exit(1)
			
 
				-            eval_results.append({
			
 
				-                'class': self.classes[valid_cnt - 1],
			
 
				-                'ap': one_class_ap,
			
 
				-                'precision': precision,
			
 
				-                'recall': recall,
			
 
				-            })
			
 
				-        self.eval_results = eval_results
			
 
				-        self.mAP = mAP / float(valid_cnt) if valid_cnt > 0 else mAP
			
 
				-
			
 
				-    def get_map(self):
			
 
				-        """
			
 
				-        Get mAP result
			
 
				-        """
			
 
				-        if self.mAP is None:
			
 
				-            logging.error("mAP is not calculated.")
			
 
				-        if self.classwise:
			
 
				-            # Compute per-category AP and PR curve
			
 
				-            try:
			
 
				-                from terminaltables import AsciiTable
			
 
				-            except Exception as e:
			
 
				-                logging.error(
			
 
				-                    'terminaltables not found, plaese install terminaltables. '
			
 
				-                    'for example: `pip install terminaltables`.')
			
 
				-                raise e
			
 
				-            results_per_category = []
			
 
				-            for eval_result in self.eval_results:
			
 
				-                results_per_category.append(
			
 
				-                    (str(eval_result['class']),
			
 
				-                     '{:0.3f}'.format(float(eval_result['ap']))))
			
 
				-                _draw_pr_curve(
			
 
				-                    eval_result['precision'],
			
 
				-                    eval_result['recall'],
			
 
				-                    out_dir='voc_pr_curve',
			
 
				-                    file_name='{}_precision_recall_curve.jpg'.format(
			
 
				-                        eval_result['class']))
			
 
				-
			
 
				-            num_columns = min(6, len(results_per_category) * 2)
			
 
				-            results_flatten = list(itertools.chain(*results_per_category))
			
 
				-            headers = ['category', 'AP'] * (num_columns // 2)
			
 
				-            results_2d = itertools.zip_longest(* [
			
 
				-                results_flatten[i::num_columns] for i in range(num_columns)
			
 
				-            ])
			
 
				-            table_data = [headers]
			
 
				-            table_data += [result for result in results_2d]
			
 
				-            table = AsciiTable(table_data)
			
 
				-            logging.info('Per-category of VOC AP: \n{}'.format(table.table))
			
 
				-            logging.info(
			
 
				-                "per-category PR curve has output to voc_pr_curve folder.")
			
 
				-        return self.mAP
			
 
				-
			
 
				-    def _get_tp_fp_accum(self, score_pos_list):
			
 
				-        """
			
 
				-        Calculate accumulating true/false positive results from
			
 
				-        [score, pos] records
			
 
				-        """
			
 
				-        sorted_list = sorted(score_pos_list, key=lambda s: s[0], reverse=True)
			
 
				-        accum_tp = 0
			
 
				-        accum_fp = 0
			
 
				-        accum_tp_list = []
			
 
				-        accum_fp_list = []
			
 
				-        for (score, pos) in sorted_list:
			
 
				-            accum_tp += int(pos)
			
 
				-            accum_tp_list.append(accum_tp)
			
 
				-            accum_fp += 1 - int(pos)
			
 
				-            accum_fp_list.append(accum_fp)
			
 
				-        return accum_tp_list, accum_fp_list
			
--- a/dygraph/paddlex/cv/models/utils/det_metrics/metrics.py
+++ b/dygraph/paddlex/cv/models/utils/det_metrics/metrics.py
@@ -21,8 +21,7 @@ import sys
 
				 from collections import OrderedDict
			
 
				 import paddle
			
 
				 import numpy as np
			
 
				-
			
 
				-from .map_utils import prune_zero_padding, DetectionMAP
			
 
				+from ppdet.metrics.map_utils import prune_zero_padding, DetectionMAP
			
 
				 from .coco_utils import get_infer_results, cocoapi_eval
			
 
				 import paddlex.utils.logging as logging
			
 
				 
			
@@ -88,22 +87,23 @@ class VOCMetric(Metric):
 
				 
			
 
				         if bboxes.shape == (1, 1) or bboxes is None:
			
 
				             return
			
 
				-        gt_boxes = inputs['gt_bbox'].numpy()
			
 
				-        gt_labels = inputs['gt_class'].numpy()
			
 
				-        difficults = inputs['difficult'].numpy(
			
 
				-        ) if not self.evaluate_difficult else None
			
 
				+        gt_boxes = inputs['gt_bbox']
			
 
				+        gt_labels = inputs['gt_class']
			
 
				+        difficults = inputs['difficult'] if not self.evaluate_difficult \
			
 
				+            else None
			
 
				 
			
 
				         scale_factor = inputs['scale_factor'].numpy(
			
 
				         ) if 'scale_factor' in inputs else np.ones(
			
 
				             (gt_boxes.shape[0], 2)).astype('float32')
			
 
				 
			
 
				         bbox_idx = 0
			
 
				-        for i in range(gt_boxes.shape[0]):
			
 
				-            gt_box = gt_boxes[i]
			
 
				+        for i in range(len(gt_boxes)):
			
 
				+            gt_box = gt_boxes[i].numpy()
			
 
				             h, w = scale_factor[i]
			
 
				             gt_box = gt_box / np.array([w, h, w, h])
			
 
				-            gt_label = gt_labels[i]
			
 
				-            difficult = None if difficults is None else difficults[i]
			
 
				+            gt_label = gt_labels[i].numpy()
			
 
				+            difficult = None if difficults is None \
			
 
				+                else difficults[i].numpy()
			
 
				             bbox_num = bbox_lengths[i]
			
 
				             bbox = bboxes[bbox_idx:bbox_idx + bbox_num]
			
 
				             score = scores[bbox_idx:bbox_idx + bbox_num]
			
--- a/dygraph/paddlex/cv/transforms/batch_operators.py
+++ b/dygraph/paddlex/cv/transforms/batch_operators.py
@@ -13,7 +13,6 @@
 
				 # limitations under the License.
			
 
				 
			
 
				 import traceback
			
 
				-import multiprocessing as mp
			
 
				 import random
			
 
				 import numpy as np
			
 
				 try:
			
@@ -27,10 +26,10 @@ from paddlex.utils import logging
 
				 
			
 
				 
			
 
				 class BatchCompose(Transform):
			
 
				-    def __init__(self, batch_transforms=None):
			
 
				+    def __init__(self, batch_transforms=None, collate_batch=True):
			
 
				         super(BatchCompose, self).__init__()
			
 
				         self.batch_transforms = batch_transforms
			
 
				-        self.lock = mp.Lock()
			
 
				+        self.collate_batch = collate_batch
			
 
				 
			
 
				     def __call__(self, samples):
			
 
				         if self.batch_transforms is not None:
			
@@ -46,7 +45,23 @@ class BatchCompose(Transform):
 
				 
			
 
				         samples = _Permute()(samples)
			
 
				 
			
 
				-        batch_data = default_collate_fn(samples)
			
 
				+        extra_key = ['h', 'w', 'flipped']
			
 
				+        for k in extra_key:
			
 
				+            for sample in samples:
			
 
				+                if k in sample:
			
 
				+                    sample.pop(k)
			
 
				+
			
 
				+        if self.collate_batch:
			
 
				+            batch_data = default_collate_fn(samples)
			
 
				+        else:
			
 
				+            batch_data = {}
			
 
				+            for k in samples[0].keys():
			
 
				+                tmp_data = []
			
 
				+                for i in range(len(samples)):
			
 
				+                    tmp_data.append(samples[i][k])
			
 
				+                if not 'gt_' in k and not 'is_crowd' in k and not 'difficult' in k:
			
 
				+                    tmp_data = np.stack(tmp_data, axis=0)
			
 
				+                batch_data[k] = tmp_data
			
 
				         return batch_data
			
 
				 
			
 
				 
			
@@ -133,10 +148,9 @@ class BatchRandomResizeByShort(Transform):
 
				 
			
 
				 
			
 
				 class _BatchPadding(Transform):
			
 
				-    def __init__(self, pad_to_stride=0, pad_gt=False):
			
 
				+    def __init__(self, pad_to_stride=0):
			
 
				         super(_BatchPadding, self).__init__()
			
 
				         self.pad_to_stride = pad_to_stride
			
 
				-        self.pad_gt = pad_gt
			
 
				 
			
 
				     def __call__(self, samples):
			
 
				         coarsest_stride = self.pad_to_stride
			
@@ -155,69 +169,6 @@ class _BatchPadding(Transform):
 
				             padding_im[:im_h, :im_w, :] = im
			
 
				             data['image'] = padding_im
			
 
				 
			
 
				-        if self.pad_gt:
			
 
				-            gt_num = []
			
 
				-            if 'gt_poly' in data and data['gt_poly'] is not None and len(data[
			
 
				-                    'gt_poly']) > 0:
			
 
				-                pad_mask = True
			
 
				-            else:
			
 
				-                pad_mask = False
			
 
				-
			
 
				-            if pad_mask:
			
 
				-                poly_num = []
			
 
				-                poly_part_num = []
			
 
				-                point_num = []
			
 
				-
			
 
				-            for data in samples:
			
 
				-                gt_num.append(data['gt_bbox'].shape[0])
			
 
				-                if pad_mask:
			
 
				-                    poly_num.append(len(data['gt_poly']))
			
 
				-                    for poly in data['gt_poly']:
			
 
				-                        poly_part_num.append(int(len(poly)))
			
 
				-                        for p_p in poly:
			
 
				-                            point_num.append(int(len(p_p) / 2))
			
 
				-            gt_num_max = max(gt_num)
			
 
				-
			
 
				-            for i, data in enumerate(samples):
			
 
				-                gt_box_data = -np.ones([gt_num_max, 4], dtype=np.float32)
			
 
				-                gt_class_data = -np.ones([gt_num_max], dtype=np.int32)
			
 
				-                is_crowd_data = np.ones([gt_num_max], dtype=np.int32)
			
 
				-
			
 
				-                if pad_mask:
			
 
				-                    poly_num_max = max(poly_num)
			
 
				-                    poly_part_num_max = max(poly_part_num)
			
 
				-                    point_num_max = max(point_num)
			
 
				-                    gt_masks_data = -np.ones(
			
 
				-                        [poly_num_max, poly_part_num_max, point_num_max, 2],
			
 
				-                        dtype=np.float32)
			
 
				-
			
 
				-                gt_num = data['gt_bbox'].shape[0]
			
 
				-                gt_box_data[0:gt_num, :] = data['gt_bbox']
			
 
				-                gt_class_data[0:gt_num] = np.squeeze(data['gt_class'])
			
 
				-                if 'is_crowd' in data:
			
 
				-                    is_crowd_data[0:gt_num] = np.squeeze(data['is_crowd'])
			
 
				-                    data['is_crowd'] = is_crowd_data
			
 
				-
			
 
				-                data['gt_bbox'] = gt_box_data
			
 
				-                data['gt_class'] = gt_class_data
			
 
				-
			
 
				-                if pad_mask:
			
 
				-                    for j, poly in enumerate(data['gt_poly']):
			
 
				-                        for k, p_p in enumerate(poly):
			
 
				-                            pp_np = np.array(p_p).reshape(-1, 2)
			
 
				-                            gt_masks_data[j, k, :pp_np.shape[0], :] = pp_np
			
 
				-                    data['gt_poly'] = gt_masks_data
			
 
				-
			
 
				-                if 'gt_score' in data:
			
 
				-                    gt_score_data = np.zeros([gt_num_max], dtype=np.float32)
			
 
				-                    gt_score_data[0:gt_num] = data['gt_score'][:gt_num, 0]
			
 
				-                    data['gt_score'] = gt_score_data
			
 
				-
			
 
				-                if 'difficult' in data:
			
 
				-                    diff_data = np.zeros([gt_num_max], dtype=np.int32)
			
 
				-                    diff_data[0:gt_num] = data['difficult'][:gt_num, 0]
			
 
				-                    data['difficult'] = diff_data
			
 
				-
			
 
				         return samples
			
 
				 
			
 
				 
			
--- a/dygraph/paddlex/utils/__init__.py
+++ b/dygraph/paddlex/utils/__init__.py
@@ -19,6 +19,6 @@ from .utils import (seconds_to_hms, get_encoding, get_single_card_bs, dict2str,
 
				                     DisablePrint)
			
 
				 from .checkpoint import get_pretrain_weights, load_pretrain_weights
			
 
				 from .env import get_environ_info, get_num_workers, init_parallel_env
			
 
				-from .download import download_and_decompress
			
 
				+from .download import download_and_decompress, decompress
			
 
				 from .stats import SmoothedValue, TrainingStats
			
 
				 from .shm import _get_shared_memory_size_in_M
			
--- a/dygraph/tutorials/train/README.md
+++ b/dygraph/tutorials/train/README.md
@@ -12,7 +12,6 @@
 
				 |image_classification/darknet53.py | 图像分类DarkNet53 | 蔬菜分类 |
			
 
				 |image_classification/xception41.py | 图像分类Xception41 | 蔬菜分类 |
			
 
				 |image_classification/densenet121.py | 图像分类DenseNet121 | 蔬菜分类 |
			
 
				-|object_detection/faster_rcnn_r34_fpn.py | 目标检测FasterRCNN | 昆虫检测 |
			
 
				 |object_detection/faster_rcnn_r50_fpn.py | 目标检测FasterRCNN | 昆虫检测 |
			
 
				 |object_detection/ppyolo.py | 目标检测PPYOLO | 昆虫检测 |
			
 
				 |object_detection/ppyolotiny.py | 目标检测PPYOLOTiny | 昆虫检测 |
			
--- a/dygraph/tutorials/train/object_detection/faster_rcnn_hrnet_w18.py
+++ b/dygraph/tutorials/train/object_detection/faster_rcnn_hrnet_w18.py
@@ -40,19 +40,18 @@ eval_dataset = pdx.datasets.VOCDetection(
 
				 # 初始化模型，并进行训练
			
 
				 # 可使用VisualDL查看训练指标，参考https://github.com/PaddlePaddle/PaddleX/tree/release/2.0-rc/tutorials/train#visualdl可视化训练指标
			
 
				 num_classes = len(train_dataset.labels)
			
 
				-model = pdx.models.FasterRCNN(
			
 
				-    num_classes=num_classes, backbone='ResNet34', with_fpn=True)
			
 
				+model = pdx.models.FasterRCNN(num_classes=num_classes, backbone='HRNet_W18')
			
 
				 
			
 
				 # API说明：https://github.com/PaddlePaddle/PaddleX/blob/release/2.0-rc/paddlex/cv/models/detector.py#L154
			
 
				 # 各参数介绍与调整说明：https://paddlex.readthedocs.io/zh_CN/develop/appendix/parameters.html
			
 
				 model.train(
			
 
				-    num_epochs=12,
			
 
				+    num_epochs=24,
			
 
				     train_dataset=train_dataset,
			
 
				     train_batch_size=2,
			
 
				     eval_dataset=eval_dataset,
			
 
				     learning_rate=0.0025,
			
 
				-    lr_decay_epochs=[8, 11],
			
 
				-    warmup_steps=500,
			
 
				+    lr_decay_epochs=[16, 22],
			
 
				+    warmup_steps=1000,
			
 
				     warmup_start_lr=0.00025,
			
 
				-    save_dir='output/faster_rcnn_r50_fpn',
			
 
				+    save_dir='output/faster_rcnn_hrnet_w18',
			
 
				     use_vdl=True)