zhengchun
/
PaddleX


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256
							// Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//     http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

#include "ultra_infer/pybind/main.h"

namespace ultra_infer {
void BindVisualize(pybind11::module &m) {
  m.def("vis_detection",
        [](pybind11::array &im_data, vision::DetectionResult &result,
           std::vector<std::string> &labels, float score_threshold,
           int line_size, float font_size, std::vector<int> font_color,
           int font_thickness) {
          auto im = PyArrayToCvMat(im_data);
          cv::Mat vis_im;
          if (labels.empty()) {
            vis_im = vision::VisDetection(im, result, score_threshold,
                                          line_size, font_size);
          } else {
            vis_im = vision::VisDetection(im, result, labels, score_threshold,
                                          line_size, font_size, font_color,
                                          font_thickness);
          }
          FDTensor out;
          vision::Mat(vis_im).ShareWithTensor(&out);
          return TensorToPyArray(out);
        })
      .def("vis_perception",
           [](pybind11::array &im_data, vision::PerceptionResult &result,
              const std::string &config_file, float score_threshold,
              int line_size, float font_size) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im =
                 vision::VisPerception(im, result, config_file, score_threshold,
                                       line_size, font_size);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_face_detection",
           [](pybind11::array &im_data, vision::FaceDetectionResult &result,
              int line_size, float font_size) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im =
                 vision::VisFaceDetection(im, result, line_size, font_size);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_face_alignment",
           [](pybind11::array &im_data, vision::FaceAlignmentResult &result,
              int line_size) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisFaceAlignment(im, result, line_size);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_segmentation",
           [](pybind11::array &im_data, vision::SegmentationResult &result,
              float weight) {
             cv::Mat im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisSegmentation(im, result, weight);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("swap_background",
           [](pybind11::array &im_data, pybind11::array &background_data,
              vision::MattingResult &result, bool remove_small_connected_area) {
             cv::Mat im = PyArrayToCvMat(im_data);
             cv::Mat background = PyArrayToCvMat(background_data);
             auto vis_im = vision::SwapBackground(im, background, result,
                                                  remove_small_connected_area);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("swap_background",
           [](pybind11::array &im_data, pybind11::array &background_data,
              vision::SegmentationResult &result, int background_label) {
             cv::Mat im = PyArrayToCvMat(im_data);
             cv::Mat background = PyArrayToCvMat(background_data);
             auto vis_im = vision::SwapBackground(im, background, result,
                                                  background_label);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_ppocr",
           [](pybind11::array &im_data, vision::OCRResult &result) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisOcr(im, result);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_ppocr_curve",
           [](pybind11::array &im_data, vision::OCRCURVEResult &result) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisCURVEOcr(im, result);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_mot",
           [](pybind11::array &im_data, vision::MOTResult &result,
              float score_threshold, vision::tracking::TrailRecorder record) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisMOT(im, result, score_threshold, &record);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_matting",
           [](pybind11::array &im_data, vision::MattingResult &result,
              bool transparent_background, float transparent_threshold,
              bool remove_small_connected_area) {
             cv::Mat im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisMatting(
                 im, result, transparent_background, transparent_threshold,
                 remove_small_connected_area);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           })
      .def("vis_headpose",
           [](pybind11::array &im_data, vision::HeadPoseResult &result,
              int size, int line_size) {
             auto im = PyArrayToCvMat(im_data);
             auto vis_im = vision::VisHeadPose(im, result, size, line_size);
             FDTensor out;
             vision::Mat(vis_im).ShareWithTensor(&out);
             return TensorToPyArray(out);
           });

  pybind11::class_<vision::Visualize>(m, "Visualize")
      .def(pybind11::init<>())
      .def_static("vis_detection",
                  [](pybind11::array &im_data, vision::DetectionResult &result,
                     float score_threshold, int line_size, float font_size) {
                    auto im = PyArrayToCvMat(im_data);
                    auto vis_im = vision::Visualize::VisDetection(
                        im, result, score_threshold, line_size, font_size);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static(
          "vis_keypoint_detection",
          [](pybind11::array &im_data, vision::KeyPointDetectionResult &result,
             float conf_threshold) {
            auto im = PyArrayToCvMat(im_data);
            auto vis_im =
                vision::VisKeypointDetection(im, result, conf_threshold);
            FDTensor out;
            vision::Mat(vis_im).ShareWithTensor(&out);
            return TensorToPyArray(out);
          })
      .def_static("vis_face_detection",
                  [](pybind11::array &im_data,
                     vision::FaceDetectionResult &result, int line_size,
                     float font_size) {
                    auto im = PyArrayToCvMat(im_data);
                    auto vis_im = vision::Visualize::VisFaceDetection(
                        im, result, line_size, font_size);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static(
          "vis_segmentation",
          [](pybind11::array &im_data, vision::SegmentationResult &result) {
            cv::Mat im = PyArrayToCvMat(im_data);
            auto vis_im = vision::Visualize::VisSegmentation(im, result);
            FDTensor out;
            vision::Mat(vis_im).ShareWithTensor(&out);
            return TensorToPyArray(out);
          })
      .def_static("swap_background_matting",
                  [](pybind11::array &im_data, pybind11::array &background_data,
                     vision::MattingResult &result,
                     bool remove_small_connected_area) {
                    cv::Mat im = PyArrayToCvMat(im_data);
                    cv::Mat background = PyArrayToCvMat(background_data);
                    auto vis_im = vision::Visualize::SwapBackgroundMatting(
                        im, background, result, remove_small_connected_area);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static("swap_background_segmentation",
                  [](pybind11::array &im_data, pybind11::array &background_data,
                     int background_label, vision::SegmentationResult &result) {
                    cv::Mat im = PyArrayToCvMat(im_data);
                    cv::Mat background = PyArrayToCvMat(background_data);
                    auto vis_im = vision::Visualize::SwapBackgroundSegmentation(
                        im, background, background_label, result);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static("remove_small_connected_area",
                  [](pybind11::array &alpha_pred_data, float threshold) {
                    cv::Mat alpha_pred = PyArrayToCvMat(alpha_pred_data);
                    auto vis_im = vision::Visualize::RemoveSmallConnectedArea(
                        alpha_pred, threshold);
                  })
      .def_static("vis_ppocr",
                  [](pybind11::array &im_data, vision::OCRResult &result) {
                    auto im = PyArrayToCvMat(im_data);
                    auto vis_im = vision::Visualize::VisOcr(im, result);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static("vis_ppocr_curve",
                  [](pybind11::array &im_data, vision::OCRCURVEResult &result) {
                    auto im = PyArrayToCvMat(im_data);
                    auto vis_im = vision::Visualize::VisCURVEOcr(im, result);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  })
      .def_static(
          "vis_mot",
          [](pybind11::array &im_data, vision::MOTResult &result,
             float score_threshold, vision::tracking::TrailRecorder *record) {
            auto im = PyArrayToCvMat(im_data);
            auto vis_im = vision::VisMOT(im, result, score_threshold, record);
            FDTensor out;
            vision::Mat(vis_im).ShareWithTensor(&out);
            return TensorToPyArray(out);
          })
      .def_static("vis_matting_alpha",
                  [](pybind11::array &im_data, vision::MattingResult &result,
                     bool remove_small_connected_area) {
                    cv::Mat im = PyArrayToCvMat(im_data);
                    auto vis_im = vision::Visualize::VisMattingAlpha(
                        im, result, remove_small_connected_area);
                    FDTensor out;
                    vision::Mat(vis_im).ShareWithTensor(&out);
                    return TensorToPyArray(out);
                  });
}
} // namespace ultra_infer