config.yaml 3.5 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122
  1. # PDF Converter v2 配置文件
  2. # 所有配置项均为可选,未指定时将使用默认值
  3. # =============================================================================
  4. # 设备环境配置
  5. # =============================================================================
  6. # 设备类型:nvi(NVIDIA GPU)/ npu(华为昇腾 NPU)/ cpu
  7. # 留空则自动检测
  8. device_kind: ""
  9. # =============================================================================
  10. # 默认模型配置
  11. # =============================================================================
  12. # GPU 内存利用率(0.0-1.0)
  13. # 降低到 0.4 为 PaddleOCR VL 预留显存(约 3GB)
  14. default_gpu_memory_utilization: 0.4
  15. # DPI 设置
  16. default_dpi: 200
  17. # 最大页数限制
  18. default_max_pages: 10
  19. # =============================================================================
  20. # API 配置
  21. # =============================================================================
  22. # MinerU API 服务地址
  23. api_url: "http://172.17.0.1:5282"
  24. # 处理后端(留空则根据设备自动选择):
  25. # npu -> vlm-http-client | nvi -> vlm-auto-engine | cpu -> pipeline
  26. # 可选值:pipeline / vlm-auto-engine / vlm-http-client / hybrid-auto-engine / hybrid-http-client
  27. backend: ""
  28. # 解析方法:auto / txt / ocr
  29. parse_method: "auto"
  30. # 起始页ID(从0开始)
  31. start_page_id: 0
  32. # 结束页ID
  33. end_page_id: -1
  34. # 识别语言:ch / en
  35. language: "ch"
  36. # 服务器URL (仅 vlm-http-client / hybrid-http-client 后端需要,留空则根据设备自动选择)
  37. server_url: ""
  38. # 是否启用表格识别
  39. table_enable: true
  40. # 是否启用公式识别
  41. formula_enable: true
  42. # =============================================================================
  43. # API 服务启动配置
  44. # =============================================================================
  45. # API 服务监听地址
  46. api_host: "0.0.0.0"
  47. # API 服务监听端口
  48. api_port: 4214
  49. # =============================================================================
  50. # PaddleOCR 配置
  51. # =============================================================================
  52. # PaddleOCR 可执行命令或路径
  53. paddleocr_cmd: "paddleocr"
  54. # PaddleOCR 推理设备 (例如 "npu:0", "cuda:0", "cpu")
  55. # 留空则根据环境自动选择
  56. paddle_ocr_device: ""
  57. # PaddleOCR 多卡推理设备 (例如 "npu:0,npu:1")
  58. paddle_ocr_devices: ""
  59. # PaddleOCR 文档解析命令
  60. paddle_doc_parser_cmd: "paddleocr"
  61. # PaddleOCR VL 识别后端 (例如 "vllm-server")
  62. # VL 识别后端(留空则根据设备自动选择:npu -> vllm-server,nvi/cpu -> 不使用)
  63. vl_rec_backend: ""
  64. # PaddleOCR VL 识别服务器 URL(留空则根据设备自动选择)
  65. vl_rec_server_url: ""
  66. # =============================================================================
  67. # 返回格式配置
  68. # =============================================================================
  69. # 是否返回ZIP格式
  70. response_format_zip: true
  71. # 是否返回中间JSON
  72. return_middle_json: true
  73. # 是否返回模型输出
  74. return_model_output: false
  75. # 是否返回Markdown
  76. return_md: true
  77. # 是否返回图片
  78. return_images: true
  79. # 是否返回内容列表
  80. return_content_list: true
  81. # =============================================================================
  82. # 日志配置(可选)
  83. # =============================================================================
  84. # 日志目录
  85. log_dir: "./logs"
  86. # 日志级别:DEBUG / INFO / WARNING / ERROR
  87. log_level: "INFO"
  88. # 是否记录到文件
  89. log_to_file: true
  90. # 是否输出到控制台
  91. log_to_console: true