CH5 AI Prompt 互動提示詞生成系統

Part 6:疑難排解與效能優化

常見問題解決方案與系統效能調校

安裝問題 AI 服務 效能優化

🔧 安裝與啟動問題

❓ pip install 時出現錯誤
  • 檢查 Python 版本 ≥ 3.12:python --version
  • 使用國內鏡像:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 使用虛擬環境避免權限問題
  • 建立乾淨虛擬環境解決相依性衝突
❓ 瀏覽器無法訪問 localhost:5001
  • 確認 Flask 是否成功啟動(查看終端機)
  • 檢查防火牆是否阻擋 5001 埠
  • 確認埠未被佔用,或修改 PORT=5002
  • 確保使用 http:// 而非 https://

🤖 AI 服務相關問題

❓ OpenAI API 回傳「Rate limit exceeded」
  • 短期:等待一段時間後重試
  • 長期:升級 API 方案或使用多 Key 輪替
  • 替代:切換到 Gemini(免費額度較多)
❓ AI 生成的提示詞品質不如預期
  • 提供更詳細的需求描述
  • 選擇「詳細」或「超詳細」等級
  • 啟用「使用知識庫增強」選項
  • 使用優化功能取得改進建議
  • 嘗試切換到更強的模型(GPT-4 / Gemini Pro)

📚 RAG 知識庫問題

❓ 首次啟動 RAG 服務很慢

正常現象!需要下載 Sentence Transformers 模型(約 470MB)

# 預先下載模型
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
❓ 上傳文件後搜尋不到內容
  • 確認上傳成功(檢查日誌)
  • 用文件中實際出現的詞彙搜尋測試
  • 降低 RAG_SIMILARITY_THRESHOLD(例如 0.5)
  • 刪除 data/vector_store/ 重建資料庫

⚡ 效能優化策略

🚀
AI 生成速度
  • 使用快速模型:Gemini Flash / GPT-3.5
  • 減少 RAG_TOP_K(例如 5 → 3)
  • 前端顯示進度指示器
  • 考慮使用串流回應
🔍
RAG 搜尋速度
  • 刪除無用文件減少 chunk 數
  • 增大 chunk_size(500 → 1000)
  • 大規模資料考慮 FAISS / Pinecone
  • 實作結果快取
💾
記憶體使用
  • 確認模型只載入一次(單例模式)
  • 使用磁碟持久化模式
  • 關閉不需要的功能:ENABLE_RAG=false
📊
監控與診斷
  • 查看 logs/app.log 日誌
  • 使用系統監控工具
  • 追蹤 API 回應時間

📊 系統監控

記憶體使用情況

  • Sentence Transformers 模型約 500MB-1GB
  • 確認沒有記憶體洩漏
  • 向量資料會佔用部分記憶體
⚠️ 注意:如果記憶體持續增長,檢查是否每次請求都重新載入模型
記憶體監控

📌 本節重點回顧

問題排解要點
  • 查看終端機錯誤訊息
  • 確認環境配置正確
  • 檢查網路與防火牆
  • 善用日誌診斷問題
效能優化原則
  • 選擇適合的模型
  • 減少不必要的資料
  • 善用快取機制
  • 監控資源使用