瀏覽代碼

测试数据

zhch158_admin 4 月之前
父節點
當前提交
551ea3ed35
共有 40 個文件被更改,包括 6606 次插入0 次删除
  1. 二進制
      zhch/sample_data/2023年度报告非上市企业A-母公司-21-22.pdf
  2. 二進制
      zhch/sample_data/2023年度报告非上市企业A-母公司-21.png
  3. 二進制
      zhch/sample_data/2023年度报告非上市企业A-母公司-24.pdf
  4. 二進制
      zhch/sample_data/300674-合并损益变动表-扫描.png
  5. 二進制
      zhch/sample_data/300674-母公司现金流量表-扫描.png
  6. 二進制
      zhch/sample_data/300674-财报数据-扫描.pdf
  7. 二進制
      zhch/sample_data/600916_中国黄金_2002年报_83_94_2.png
  8. 二進制
      zhch/sample_data/600916_中国黄金_2022年报_83_84.pdf
  9. 二進制
      zhch/sample_data/PictureCheckCode.jpeg
  10. 二進制
      zhch/sample_data/general_ocr_001.png
  11. 二進制
      zhch/sample_data/general_ocr_rec_001.png
  12. 5 0
      zhch/sample_data/single_model_output/PP-Chart2Table/1751031834_5799_res.json
  13. 5 0
      zhch/sample_data/single_model_output/PP-Chart2Table/1751035895_3489_res.json
  14. 5 0
      zhch/sample_data/single_model_output/PP-Chart2Table/1751169988_1520_res.json
  15. 3 0
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描.md
  16. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_layout_det_res.png
  17. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_layout_order_res.png
  18. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_overall_ocr_res.png
  19. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_preprocessed_img.png
  20. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_region_det_res.png
  21. 24 0
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_res.json
  22. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_seal_res_region1.png
  23. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_seal_res_region2.png
  24. 0 0
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_1.html
  25. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_1.xlsx
  26. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_cell_img.png
  27. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_seal_box_230_1447_349_1535.jpg
  28. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_seal_box_800_1415_910_1520.jpg
  29. 二進制
      zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_table_box_102_199_973_1412.jpg
  30. 二進制
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_layout_det_res.png
  31. 二進制
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_ocr_res_img.png
  32. 二進制
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_preprocessed_img.png
  33. 6482 0
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_res.json
  34. 0 0
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_1.html
  35. 二進制
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_1.xlsx
  36. 二進制
      zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_cell_img.png
  37. 82 0
      zhch/sample_data/table_recognition_v2.yaml
  38. 二進制
      zhch/sample_data/zh.wav
  39. 二進制
      zhch/sample_data/至远彩色印刷工业有限公司-2022年母公司.pdf
  40. 二進制
      zhch/sample_data/至远彩色印刷工业有限公司-2022年母公司_2.png

二進制
zhch/sample_data/2023年度报告非上市企业A-母公司-21-22.pdf


二進制
zhch/sample_data/2023年度报告非上市企业A-母公司-21.png


二進制
zhch/sample_data/2023年度报告非上市企业A-母公司-24.pdf


二進制
zhch/sample_data/300674-合并损益变动表-扫描.png


二進制
zhch/sample_data/300674-母公司现金流量表-扫描.png


二進制
zhch/sample_data/300674-财报数据-扫描.pdf


二進制
zhch/sample_data/600916_中国黄金_2002年报_83_94_2.png


二進制
zhch/sample_data/600916_中国黄金_2022年报_83_84.pdf


二進制
zhch/sample_data/PictureCheckCode.jpeg


二進制
zhch/sample_data/general_ocr_001.png


二進制
zhch/sample_data/general_ocr_rec_001.png


+ 5 - 0
zhch/sample_data/single_model_output/PP-Chart2Table/1751031834_5799_res.json

@@ -0,0 +1,5 @@
+{
+    "image": "sample_data/300674-母公司现金流量表-扫描.png",
+    "query": "请将图表转换为表格格式",
+    "result": "项目 | 项目 | 项目 | 项目 | 项目 | 项目 | 项目 | 项目\n一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一、经营活动产生的时间数 | 一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一 二、经营活动产生的现金流量 | 二、经营活动产生的现金流量\n销售商品、提供劳务收到的现金 | 42229862246.66 | 3827945430.53 | 3827945430.53 | 38327945430.53 | 38327954543.0 | 38327954543.0 | 3827945430.53\n收到的税费低迷 | 7362170.8 | 2105420.26 | 597182833.78 | 5971828333.78 | 5971828333.77 | 5971828333.77 | 593795716.8\n收到其他与经营活动有关的现金 | 605450559.1 | 5971828333.78 | 4427233684.57 | 4427233684.57 | 4472733684.57 | 4472733683.78 | 4472733683.78\n经营活动现金流流入小时 | 4829173000.84 | 4427233684.57 | 44427233684.57 | 444253684.57 | 444253684.0 | 444253684.0 | 4442723368.0\n购买商品、接受劳务支付的现金 | 1791732494.95 | 2314105033.41 | 2314105033.41 | 2321410503.41 | 2321410503.41.0 | 2321410503.41 | 233214105.0\n支付给职工以及为职工支付的现金 | 1934793712.02 | 136072742.18 | 136072742.18 | 136172742.18 | 1361727421.0 | 136172742.18 | 136217274.0\n支付的余额费 | 77225242.68 | 96478917.61 | 96478917.61 | 964778917.61 | 964778917_61 | 964778917.61 | 973071331.44\n支付其他与经营活动相关的现金 | 4982916133.39 | 653071331.44 | 653071331.44 | 65317957.8 | 65317957.8 | 65317577.8 | 65317577.8 | 65517577.8\n经营活动现金流成本 | 4302043063.04 | 4424379466.01 | 4424379466.01 | 44193797.8 | 44193797.8"
+}

+ 5 - 0
zhch/sample_data/single_model_output/PP-Chart2Table/1751035895_3489_res.json

@@ -0,0 +1,5 @@
+{
+    "image": "sample_data/300674-母公司现金流量表-扫描.png",
+    "query": "请将图表转换为表格格式",
+    "result": "项目 | 项目 | 项目 | 项目 | 项目 | 项目 | 项目 | 项目\n一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一、经营活动产生的时间数 | 一、经营活动产生的现金流量 | 一、经营活动产生的现金流量 | 一 二、经营活动产生的现金流量 | 二、经营活动产生的现金流量\n销售商品、提供劳务收到的现金 | 42229862246.66 | 3827945430.53 | 3827945430.53 | 38327945430.53 | 38327954543.0 | 38327954543.0 | 3827945430.53\n收到的税费低迷 | 7362170.8 | 2105420.26 | 597182833.78 | 5971828333.78 | 5971828333.77 | 5971828333.77 | 593795716.8\n收到其他与经营活动有关的现金 | 605450559.1 | 5971828333.78 | 4427233684.57 | 4427233684.57 | 4472733684.57 | 4472733683.78 | 4472733683.78\n经营活动现金流流入小时 | 4829173000.84 | 4427233684.57 | 44427233684.57 | 444253684.57 | 444253684.0 | 444253684.0 | 4442723368.0\n购买商品、接受劳务支付的现金 | 1791732494.95 | 2314105033.41 | 2314105033.41 | 2321410503.41 | 2321410503.41.0 | 2321410503.41 | 233214105.0\n支付给职工以及为职工支付的现金 | 1934793712.02 | 136072742.18 | 136072742.18 | 136172742.18 | 1361727421.0 | 136172742.18 | 136217274.0\n支付的余额费 | 77225242.68 | 96478917.61 | 96478917.61 | 964778917.61 | 964778917_61 | 964778917.61 | 973071331.44\n支付其他与经营活动相关的现金 | 4982916133.39 | 653071331.44 | 653071331.44 | 65317957.8 | 65317957.8 | 65317577.8 | 65317577.8 | 65517577.8\n经营活动现金流成本 | 4302043063.04 | 4424379466.01 | 4424379466.01 | 44193797.8 | 44193797.8"
+}

+ 5 - 0
zhch/sample_data/single_model_output/PP-Chart2Table/1751169988_1520_res.json

@@ -0,0 +1,5 @@
+{
+    "image": "sample_data/300674-母公司现金流量表-扫描.png",
+    "query": "请将图表转换为表格格式",
+    "result": "项目 | 附注 | 本期金额 | 上期金额\n**一** | **2022年**<br>• 经营活动产生的现金流量 | **4,222,986,224.66**<br>3,827,945,430.53 | **736,217.08**<br>2,105,420.26\n**二** | **2022年**<br>• 收到其他与经营活动有关的现金 | **605,450,559.10**<br>597,182,833.78 | **736,217.08**<br>2,115,420.26\n**三** | **2022年**<br>• 经营活动现金流入小计 | **4,829,173,000.84**<br>4,442,273,233.6847 | **7,191,732,494.95**<br>2,314,105,033.41\n**四** | **2022年**<br>• 2022年**<br>1,394,793,712.02<br>1,360,724,183.55 | **1,394,793,712.02**<br>1,360,724,183.55 | **77,225,242.68**<br>964,789,716.61\n**五** | **2022年**<br>• 2022年 **<br>1,394,793,712.02**<br><br>**498,291,613.39**<br>5,053,071,331.44\n**六** | **2022年**<br>• 经营活动现金流出小计 | **4,302,043,063.04**<br>4,424,379,466.01 | **725,129,937.80**<br>2,854,218.56\n**九** | **2022年**<br>• 2022年 (未标明) | **38,687,360.00**<br>196,872,741.12 | **312,868,625.63**\n**四** | **2022年**<br>• 2021年**<br>1,005,000,000.00 | **1,051,874,591.09**<br>561,862,975.98 | **20150,386.21**<br>1,6728,800.97\n**五** | **2022年**<br>• 2015年**<br>1,579,292,200.00 | **157,292,200.00**<br>70,524,000.00 | **1,005,000,000.00 | **1005,000,000.00)\n**六** | **2022年**<br>• 2015年 (未标明) | **1,005,000,000.00**<br>87,275,280.997 | **182,442,586.21**<br>87,275,280.997\n**五** | **2022年**<br>• 1015年**<br>1,30,567,"
+}

File diff suppressed because it is too large
+ 3 - 0
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描.md


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_layout_det_res.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_layout_order_res.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_overall_ocr_res.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_preprocessed_img.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_region_det_res.png


File diff suppressed because it is too large
+ 24 - 0
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_res.json


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_seal_res_region1.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_seal_res_region2.png


File diff suppressed because it is too large
+ 0 - 0
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_1.html


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_1.xlsx


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/300674-母公司现金流量表-扫描_table_cell_img.png


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_seal_box_230_1447_349_1535.jpg


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_seal_box_800_1415_910_1520.jpg


二進制
zhch/sample_data/single_pipeline_output/PP-StructureV3-zhch/imgs/img_in_table_box_102_199_973_1412.jpg


二進制
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_layout_det_res.png


二進制
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_ocr_res_img.png


二進制
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_preprocessed_img.png


File diff suppressed because it is too large
+ 6482 - 0
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_res.json


File diff suppressed because it is too large
+ 0 - 0
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_1.html


二進制
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_1.xlsx


二進制
zhch/sample_data/single_pipeline_output/table_recognition_v2-zhch/300674-母公司现金流量表-扫描_table_cell_img.png


+ 82 - 0
zhch/sample_data/table_recognition_v2.yaml

@@ -0,0 +1,82 @@
+
+pipeline_name: table_recognition_v2
+
+use_doc_preprocessor: True
+use_layout_detection: True
+use_ocr_model: True
+
+SubModules:
+  LayoutDetection:
+    module_name: layout_detection
+    model_name: PP-DocLayout-L
+    model_dir: null
+  
+  TableOrientationClassify:
+    module_name: doc_text_orientation
+    model_name: PP-LCNet_x1_0_doc_ori
+    model_dir: null
+  
+  TableClassification:
+    module_name: table_classification
+    model_name: PP-LCNet_x1_0_table_cls
+    model_dir: null
+
+  WiredTableStructureRecognition:
+    module_name: table_structure_recognition
+    model_name: SLANeXt_wired
+    model_dir: null
+  
+  WirelessTableStructureRecognition:
+    module_name: table_structure_recognition
+    model_name: SLANeXt_wireless
+    model_dir: null
+  
+  WiredTableCellsDetection:
+    module_name: table_cells_detection
+    model_name: RT-DETR-L_wired_table_cell_det
+    model_dir: null
+  
+  WirelessTableCellsDetection:
+    module_name: table_cells_detection
+    model_name: RT-DETR-L_wireless_table_cell_det
+    model_dir: null
+
+SubPipelines:
+  DocPreprocessor:
+    pipeline_name: doc_preprocessor
+    use_doc_orientation_classify: True
+    use_doc_unwarping: True
+    SubModules:
+      DocOrientationClassify:
+        module_name: doc_text_orientation
+        model_name: PP-LCNet_x1_0_doc_ori
+        model_dir: null
+
+      DocUnwarping:
+        module_name: image_unwarping
+        model_name: UVDoc
+        model_dir: null
+
+  GeneralOCR:
+    pipeline_name: OCR
+    text_type: general
+    use_doc_preprocessor: False
+    use_textline_orientation: False
+    SubModules:
+      TextDetection:
+        module_name: text_detection
+        model_name: PP-OCRv4_server_det
+        model_dir: null
+        limit_side_len: 960
+        limit_type: max
+        max_side_limit: 4000
+        thresh: 0.3
+        box_thresh: 0.4
+        unclip_ratio: 1.5
+        
+      TextRecognition:
+        module_name: text_recognition
+        model_name: PP-OCRv4_server_rec_doc
+        model_dir: null
+        batch_size: 1
+        score_thresh: 0

二進制
zhch/sample_data/zh.wav


二進制
zhch/sample_data/至远彩色印刷工业有限公司-2022年母公司.pdf


二進制
zhch/sample_data/至远彩色印刷工业有限公司-2022年母公司_2.png


Some files were not shown because too many files changed in this diff