Pārlūkot izejas kodu

chore: 切换默认模型为 qwen3-nothink 无思考版本

hoangquan456/qwen3-nothink:4b 默认禁用思考模式,直接输出结果
何文松 1 mēnesi atpakaļ
vecāks
revīzija
7930fda12e

+ 2 - 2
python-services/ner-service/.env.example

@@ -15,10 +15,10 @@ NER_MODEL=ollama
 OLLAMA_URL=http://localhost:11434
 
 # 使用的模型
-# - qwen3:4b(推荐,中文能力强,4B 参数较轻量
+# - hoangquan456/qwen3-nothink:4b(推荐,无思考模式直接输出
 # - qwen3:8b(更强,需要更多内存)
 # - qwen2.5:7b(备选)
-OLLAMA_MODEL=qwen3:4b
+OLLAMA_MODEL=hoangquan456/qwen3-nothink:4b
 
 # 请求超时时间(秒,CPU 模式需要更长)
 OLLAMA_TIMEOUT=180

+ 1 - 1
python-services/ner-service/app/config.py

@@ -26,7 +26,7 @@ class Settings(BaseSettings):
     
     # Ollama 配置(用于 ollama 模式)
     ollama_url: str = "http://localhost:11434"
-    ollama_model: str = "qwen3:4b"  # 推荐中文 NER 使用 qwen3
+    ollama_model: str = "hoangquan456/qwen3-nothink:4b"  # qwen3 无思考版本,直接输出结果
     ollama_timeout: int = 180  # 秒(CPU 模式需要更长时间)
     
     # UniversalNER 专用配置(当 ollama_model 包含 'universal-ner' 时自动启用)