config.yaml 3.4 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127
  1. # PDF Converter v2 配置文件
  2. # 所有配置项均为可选,未指定时将使用默认值
  3. # =============================================================================
  4. # 设备环境配置
  5. # =============================================================================
  6. # 设备类型:nvi(NVIDIA GPU)/ npu(华为昇腾 NPU)/ cpu
  7. # 留空则自动检测
  8. device_kind: ""
  9. # =============================================================================
  10. # 默认模型配置
  11. # =============================================================================
  12. # 默认模型名称
  13. default_model_name: "OpenDataLab/MinerU2.5-2509-1.2B"
  14. # GPU 内存利用率(0.0-1.0)
  15. default_gpu_memory_utilization: 0.9
  16. # DPI 设置
  17. default_dpi: 200
  18. # 最大页数限制
  19. default_max_pages: 10
  20. # =============================================================================
  21. # API 配置
  22. # =============================================================================
  23. # MinerU API 服务地址
  24. api_url: "http://127.0.0.1:5282"
  25. # 处理后端:vlm-vllm-async-engine / pipeline
  26. backend: "vlm-vllm-async-engine"
  27. # 解析方法:auto / txt / ocr
  28. parse_method: "auto"
  29. # 起始页ID(从0开始)
  30. start_page_id: 0
  31. # 结束页ID
  32. end_page_id: 99999
  33. # 识别语言:ch / en
  34. language: "ch"
  35. # 服务器URL
  36. server_url: "string"
  37. # =============================================================================
  38. # API 服务启动配置
  39. # =============================================================================
  40. # API 服务监听地址
  41. api_host: "0.0.0.0"
  42. # API 服务监听端口
  43. api_port: 4214
  44. # =============================================================================
  45. # MinerU 服务管理配置
  46. # =============================================================================
  47. # MinerU API 内部地址(用于健康检查)
  48. mineru_api_host: "127.0.0.1"
  49. # MinerU API 内部端口
  50. mineru_api_port: 5282
  51. # 空闲超时时间(秒),超过此时间无任务则停止服务
  52. mineru_idle_timeout: 60
  53. # 检查间隔(秒)
  54. mineru_check_interval: 60
  55. # 服务启动等待超时(秒)
  56. mineru_start_timeout: 120
  57. # =============================================================================
  58. # PaddleOCR 配置
  59. # =============================================================================
  60. # PaddleOCR 可执行命令或路径
  61. paddleocr_cmd: "paddleocr"
  62. # PaddleOCR 推理设备 (例如 "npu:0", "cuda:0", "cpu")
  63. # 留空则根据环境自动选择
  64. paddle_ocr_device: ""
  65. # PaddleOCR 多卡推理设备 (例如 "npu:0,npu:1")
  66. paddle_ocr_devices: ""
  67. # PaddleOCR 文档解析命令
  68. paddle_doc_parser_cmd: "paddleocr"
  69. # =============================================================================
  70. # 返回格式配置
  71. # =============================================================================
  72. # 是否返回ZIP格式
  73. response_format_zip: true
  74. # 是否返回中间JSON
  75. return_middle_json: false
  76. # 是否返回模型输出
  77. return_model_output: true
  78. # 是否返回Markdown
  79. return_md: true
  80. # 是否返回图片
  81. return_images: false
  82. # 是否返回内容列表
  83. return_content_list: false
  84. # =============================================================================
  85. # 日志配置(可选)
  86. # =============================================================================
  87. # 日志目录
  88. log_dir: "./logs"
  89. # 日志级别:DEBUG / INFO / WARNING / ERROR
  90. log_level: "INFO"
  91. # 是否记录到文件
  92. log_to_file: true
  93. # 是否输出到控制台
  94. log_to_console: true