hewensong
/
Clerk2.5


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121
							# PDF Converter v2 配置文件
# 所有配置项均为可选，未指定时将使用默认值

# =============================================================================
# 设备环境配置
# =============================================================================
# 设备类型：nvi（NVIDIA GPU）/ npu（华为昇腾 NPU）/ cpu
# 留空则自动检测
device_kind: ""

# =============================================================================
# 默认模型配置
# =============================================================================
# GPU 内存利用率（0.0-1.0）
default_gpu_memory_utilization: 0.9

# DPI 设置
default_dpi: 200

# 最大页数限制
default_max_pages: 10

# =============================================================================
# API 配置
# =============================================================================
# MinerU API 服务地址
api_url: "http://172.17.0.1:5282"

# 处理后端（留空则根据设备自动选择）：
#   npu -> vlm-http-client | nvi -> vlm-auto-engine | cpu -> pipeline
#   可选值：pipeline / vlm-auto-engine / vlm-http-client / hybrid-auto-engine / hybrid-http-client
backend: ""

# 解析方法：auto / txt / ocr
parse_method: "auto"

# 起始页ID（从0开始）
start_page_id: 0

# 结束页ID
end_page_id: -1

# 识别语言：ch / en
language: "ch"

# 服务器URL (仅 vlm-http-client / hybrid-http-client 后端需要，留空则根据设备自动选择)
server_url: ""

# 是否启用表格识别
table_enable: true

# 是否启用公式识别
formula_enable: true

# =============================================================================
# API 服务启动配置
# =============================================================================
# API 服务监听地址
api_host: "0.0.0.0"

# API 服务监听端口
api_port: 4214

# =============================================================================
# PaddleOCR 配置
# =============================================================================
# PaddleOCR 可执行命令或路径
paddleocr_cmd: "paddleocr"

# PaddleOCR 推理设备 (例如 "npu:0", "cuda:0", "cpu")
# 留空则根据环境自动选择
paddle_ocr_device: ""

# PaddleOCR 多卡推理设备 (例如 "npu:0,npu:1")
paddle_ocr_devices: ""

# PaddleOCR 文档解析命令
paddle_doc_parser_cmd: "paddleocr"

# PaddleOCR VL 识别后端 (例如 "vllm-server")
# VL 识别后端（留空则根据设备自动选择：npu -> vllm-server，nvi/cpu -> 不使用）
vl_rec_backend: ""

# PaddleOCR VL 识别服务器 URL（留空则根据设备自动选择）
vl_rec_server_url: ""

# =============================================================================
# 返回格式配置
# =============================================================================
# 是否返回ZIP格式
response_format_zip: true

# 是否返回中间JSON
return_middle_json: true

# 是否返回模型输出
return_model_output: false

# 是否返回Markdown
return_md: true

# 是否返回图片
return_images: true

# 是否返回内容列表
return_content_list: true

# =============================================================================
# 日志配置（可选）
# =============================================================================
# 日志目录
log_dir: "./logs"

# 日志级别：DEBUG / INFO / WARNING / ERROR
log_level: "INFO"

# 是否记录到文件
log_to_file: true

# 是否输出到控制台
log_to_console: true