浏览代码

feat: 在调用 MinerU API 前添加格式化的中英文对照参数日志

- 在 converter.py 和 processor/converter.py 中添加参数记录逻辑
- 使用 JSON 格式输出所有传递给 API 的表单参数,并附带中文说明
- 方便开发者在日志中直接核对 API 调用配置

Co-authored-by: Cursor <cursoragent@cursor.com>
何文松 2 周之前
父节点
当前提交
b354395778
共有 2 个文件被更改,包括 40 次插入0 次删除
  1. 20 0
      pdf_converter_v2/converter.py
  2. 20 0
      pdf_converter_v2/processor/converter.py

+ 20 - 0
pdf_converter_v2/converter.py

@@ -219,6 +219,26 @@ async def convert_to_markdown(
             form_data.add_field('response_format_zip', str(response_format_zip).lower())
             form_data.add_field('formula_enable', str(formula_enable).lower())
             
+            # 格式化并记录调用参数(中英文对照)
+            params_log = {
+                "return_middle_json (返回中间JSON)": str(return_middle_json).lower(),
+                "return_model_output (返回模型输出)": str(return_model_output).lower(),
+                "return_md (返回Markdown)": str(return_md).lower(),
+                "return_images (返回图片)": str(return_images).lower(),
+                "end_page_id (结束页码)": str(end_page_id),
+                "parse_method (解析方法)": parse_method,
+                "start_page_id (起始页码)": str(start_page_id),
+                "lang_list (语言列表)": language,
+                "output_dir (输出目录)": "./output",
+                "server_url (服务器URL)": server_url,
+                "return_content_list (返回内容列表)": str(return_content_list).lower(),
+                "backend (处理后端)": backend,
+                "table_enable (启用表格识别)": str(table_enable).lower(),
+                "response_format_zip (响应格式ZIP)": str(response_format_zip).lower(),
+                "formula_enable (启用公式识别)": str(formula_enable).lower(),
+            }
+            logger.info(f"MinerU API 调用参数:\n{json.dumps(params_log, indent=4, ensure_ascii=False)}")
+            
             # 打开文件并添加到表单数据(文件会在请求发送时读取)
             file_obj = open(input_file, 'rb')
             try:

+ 20 - 0
pdf_converter_v2/processor/converter.py

@@ -285,6 +285,26 @@ async def convert_to_markdown(
             form_data.add_field('response_format_zip', str(response_format_zip).lower())
             form_data.add_field('formula_enable', str(formula_enable).lower())
             
+            # 格式化并记录调用参数(中英文对照)
+            params_log = {
+                "return_middle_json (返回中间JSON)": str(return_middle_json).lower(),
+                "return_model_output (返回模型输出)": str(return_model_output).lower(),
+                "return_md (返回Markdown)": str(return_md).lower(),
+                "return_images (返回图片)": str(return_images).lower(),
+                "end_page_id (结束页码)": str(end_page_id),
+                "parse_method (解析方法)": parse_method,
+                "start_page_id (起始页码)": str(start_page_id),
+                "lang_list (语言列表)": language,
+                "output_dir (输出目录)": "./output",
+                "server_url (服务器URL)": server_url,
+                "return_content_list (返回内容列表)": str(return_content_list).lower(),
+                "backend (处理后端)": backend,
+                "table_enable (启用表格识别)": str(table_enable).lower(),
+                "response_format_zip (响应格式ZIP)": str(response_format_zip).lower(),
+                "formula_enable (启用公式识别)": str(formula_enable).lower(),
+            }
+            logger.info(f"MinerU API 调用参数:\n{json.dumps(params_log, indent=4, ensure_ascii=False)}")
+            
             # 打开文件并添加到表单数据(文件会在请求发送时读取)
             file_obj = open(input_file, 'rb')
             try: