5 жил өмнө · df84bc6b78
--- a/paddlex/cv/datasets/dataset.py
+++ b/paddlex/cv/datasets/dataset.py
@@ -46,7 +46,7 @@ def is_valid(sample):
 
															                 return False
														
 
															             elif isinstance(s, np.ndarray) and s.size == 0:
														
 
															                 return False
														
 
															-            elif isinstance(s, collections.Sequence) and len(s) == 0:
														
 
															+            elif isinstance(s, collections.abc.Sequence) and len(s) == 0:
														
 
															                 return False
														
 
															     return True
														
@@ -55,6 +55,7 @@ def get_encoding(path):
 
															     f = open(path, 'rb')
														
 
															     data = f.read()
														
 
															     file_encoding = chardet.detect(data).get('encoding')
														
 
															+    f.close()
														
 
															     return file_encoding
														
--- a/paddlex/cv/datasets/easydata_cls.py
+++ b/paddlex/cv/datasets/easydata_cls.py
@@ -18,6 +18,7 @@ import random
 
															 import copy
														
 
															 import json
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .imagenet import ImageNet
														
 
															 from .dataset import is_pic
														
 
															 from .dataset import get_encoding
														
@@ -68,6 +69,8 @@ class EasyDataCls(ImageNet):
 
															             for line in f:
														
 
															                 img_file, json_file = [osp.join(data_dir, x) \
														
 
															                         for x in line.strip().split()[:2]]
														
 
															+                img_file = path_normalization(img_file)
														
 
															+                json_file = path_normalization(json_file)
														
 
															                 if not is_pic(img_file):
														
 
															                     continue
														
 
															                 if not osp.isfile(json_file):
														
--- a/paddlex/cv/datasets/easydata_det.py
+++ b/paddlex/cv/datasets/easydata_det.py
@@ -20,6 +20,7 @@ import json
 
															 import cv2
														
 
															 import numpy as np
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .voc import VOCDetection
														
 
															 from .dataset import is_pic
														
 
															 from .dataset import get_encoding
														
@@ -87,6 +88,8 @@ class EasyDataDet(VOCDetection):
 
															             for line in f:
														
 
															                 img_file, json_file = [osp.join(data_dir, x) \
														
 
															                         for x in line.strip().split()[:2]]
														
 
															+                img_file = path_normalization(img_file)
														
 
															+                json_file = path_normalization(json_file)
														
 
															                 if not is_pic(img_file):
														
 
															                     continue
														
 
															                 if not osp.isfile(json_file):
														
--- a/paddlex/cv/datasets/easydata_seg.py
+++ b/paddlex/cv/datasets/easydata_seg.py
@@ -20,6 +20,7 @@ import json
 
															 import cv2
														
 
															 import numpy as np
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .dataset import Dataset
														
 
															 from .dataset import get_encoding
														
 
															 from .dataset import is_pic
														
@@ -71,6 +72,8 @@ class EasyDataSeg(Dataset):
 
															             for line in f:
														
 
															                 img_file, json_file = [osp.join(data_dir, x) \
														
 
															                         for x in line.strip().split()[:2]]
														
 
															+                img_file = path_normalization(img_file)
														
 
															+                json_file = path_normalization(json_file)
														
 
															                 if not is_pic(img_file):
														
 
															                     continue
														
 
															                 if not osp.isfile(json_file):
														
--- a/paddlex/cv/datasets/imagenet.py
+++ b/paddlex/cv/datasets/imagenet.py
@@ -17,6 +17,7 @@ import os.path as osp
 
															 import random
														
 
															 import copy
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .dataset import Dataset
														
 
															 from .dataset import is_pic
														
 
															 from .dataset import get_encoding
														
@@ -66,6 +67,7 @@ class ImageNet(Dataset):
 
															         with open(file_list, encoding=get_encoding(file_list)) as f:
														
 
															             for line in f:
														
 
															                 items = line.strip().split()
														
 
															+                items[0] = path_normalization(items[0])
														
 
															                 if not is_pic(items[0]):
														
 
															                     continue
														
 
															                 full_path = osp.join(data_dir, items[0])
														
--- a/paddlex/cv/datasets/seg_dataset.py
+++ b/paddlex/cv/datasets/seg_dataset.py
@@ -17,6 +17,7 @@ import os.path as osp
 
															 import random
														
 
															 import copy
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .dataset import Dataset
														
 
															 from .dataset import get_encoding
														
 
															 from .dataset import is_pic
														
@@ -61,10 +62,11 @@ class SegDataset(Dataset):
 
															                 for line in f:
														
 
															                     item = line.strip()
														
 
															                     self.labels.append(item)
														
 
															-
														
 
															         with open(file_list, encoding=get_encoding(file_list)) as f:
														
 
															             for line in f:
														
 
															                 items = line.strip().split()
														
 
															+                items[0] = path_normalization(items[0])
														
 
															+                items[1] = path_normalization(items[1])
														
 
															                 if not is_pic(items[0]):
														
 
															                     continue
														
 
															                 full_path_im = osp.join(data_dir, items[0])
														
--- a/paddlex/cv/datasets/voc.py
+++ b/paddlex/cv/datasets/voc.py
@@ -22,6 +22,7 @@ import numpy as np
 
															 from collections import OrderedDict
														
 
															 import xml.etree.ElementTree as ET
														
 
															 import paddlex.utils.logging as logging
														
 
															+from paddlex.utils import path_normalization
														
 
															 from .dataset import Dataset
														
 
															 from .dataset import is_pic
														
 
															 from .dataset import get_encoding
														
@@ -92,6 +93,8 @@ class VOCDetection(Dataset):
 
															                     break
														
 
															                 img_file, xml_file = [osp.join(data_dir, x) \
														
 
															                         for x in line.strip().split()[:2]]
														
 
															+                img_file = path_normalization(img_file)
														
 
															+                xml_file = path_normalization(xml_file)
														
 
															                 if not is_pic(img_file):
														
 
															                     continue
														
 
															                 if not osp.isfile(xml_file):
														
@@ -106,8 +109,11 @@ class VOCDetection(Dataset):
 
															                     ct = int(tree.find('id').text)
														
 
															                     im_id = np.array([int(tree.find('id').text)])
														
 
															                 pattern = re.compile('<object>', re.IGNORECASE)
														
 
															-                obj_tag = pattern.findall(
														
 
															-                    str(ET.tostringlist(tree.getroot())))[0][1:-1]
														
 
															+                obj_match = pattern.findall(
														
 
															+                    str(ET.tostringlist(tree.getroot())))
														
 
															+                if len(obj_match) == 0:
														
 
															+                    continue
														
 
															+                obj_tag = obj_match[0][1:-1]
														
 
															                 objs = tree.findall(obj_tag)
														
 
															                 pattern = re.compile('<size>', re.IGNORECASE)
														
 
															                 size_tag = pattern.findall(
														
--- a/paddlex/tools/x2coco.py
+++ b/paddlex/tools/x2coco.py
@@ -22,6 +22,7 @@ import shutil
 
															 import numpy as np
														
 
															 import PIL.ImageDraw
														
 
															 from .base import MyEncoder, is_pic, get_encoding
														
 
															+from paddlex.utils import path_normalization
														
 
															 class X2COCO(object):
														
@@ -100,6 +101,7 @@ class LabelMe2COCO(X2COCO):
 
															         image["height"] = json_info["imageHeight"]
														
 
															         image["width"] = json_info["imageWidth"]
														
 
															         image["id"] = image_id + 1
														
 
															+        json_info["imagePath"] = path_normalization(json_info["imagePath"])
														
 
															         image["file_name"] = osp.split(json_info["imagePath"])[-1]
														
 
															         return image
														
@@ -187,6 +189,7 @@ class EasyData2COCO(X2COCO):
 
															         image["height"] = img.shape[0]
														
 
															         image["width"] = img.shape[1]
														
 
															         image["id"] = image_id + 1
														
 
															+        img_path = path_normalization(img_path)
														
 
															         image["file_name"] = osp.split(img_path)[-1]
														
 
															         return image
														
@@ -268,6 +271,7 @@ class JingLing2COCO(X2COCO):
 
															         image["height"] = json_info["size"]["height"]
														
 
															         image["width"] = json_info["size"]["width"]
														
 
															         image["id"] = image_id + 1
														
 
															+        json_info["path"] = path_normalization(json_info["path"])
														
 
															         image["file_name"] = osp.split(json_info["path"])[-1]
														
 
															         return image
														
--- a/paddlex/utils/__init__.py
+++ b/paddlex/utils/__init__.py
@@ -17,6 +17,7 @@ from . import logging
 
															 from . import utils
														
 
															 from . import save
														
 
															 from .utils import seconds_to_hms
														
 
															+from .utils import path_normalization
														
 
															 from .download import download
														
 
															 from .download import decompress
														
 
															 from .download import download_and_decompress
														
--- a/paddlex/utils/utils.py
+++ b/paddlex/utils/utils.py
@@ -20,6 +20,7 @@ import numpy as np
 
															 import six
														
 
															 import yaml
														
 
															 import math
														
 
															+import platform
														
 
															 from . import logging
														
@@ -49,18 +50,26 @@ def get_environ_info():
 
															                 info['num'] = fluid.core.get_cuda_device_count()
														
 
															     return info
														
 
															+def path_normalization(path):
														
 
															+    win_sep = "\\"
														
 
															+    other_sep = "/"
														
 
															+    if platform.system() == "Windows":
														
 
															+        path = win_sep.join(path.split(other_sep))
														
 
															+    else:
														
 
															+        path = other_sep.join(path.split(win_sep))
														
 
															+    return path
														
 
															 def parse_param_file(param_file, return_shape=True):
														
 
															     from paddle.fluid.proto.framework_pb2 import VarType
														
 
															     f = open(param_file, 'rb')
														
 
															-    version = np.fromstring(f.read(4), dtype='int32')
														
 
															-    lod_level = np.fromstring(f.read(8), dtype='int64')
														
 
															+    version = np.frombuffer(f.read(4), dtype='int32')
														
 
															+    lod_level = np.frombuffer(f.read(8), dtype='int64')
														
 
															     for i in range(int(lod_level)):
														
 
															-        _size = np.fromstring(f.read(8), dtype='int64')
														
 
															+        _size = np.frombuffer(f.read(8), dtype='int64')
														
 
															         _ = f.read(_size)
														
 
															-    version = np.fromstring(f.read(4), dtype='int32')
														
 
															+    version = np.frombuffer(f.read(4), dtype='int32')
														
 
															     tensor_desc = VarType.TensorDesc()
														
 
															-    tensor_desc_size = np.fromstring(f.read(4), dtype='int32')
														
 
															+    tensor_desc_size = np.frombuffer(f.read(4), dtype='int32')
														
 
															     tensor_desc.ParseFromString(f.read(int(tensor_desc_size)))
														
 
															     tensor_shape = tuple(tensor_desc.dims)
														
 
															     if return_shape: