CH5 AI Prompt 互動提示詞生成系統

Part 6：疑難排解與效能優化

常見問題解決方案與系統效能調校

安裝問題 AI 服務效能優化

🔧 安裝與啟動問題

❓ pip install 時出現錯誤

檢查 Python 版本 ≥ 3.12：python --version
使用國內鏡像：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
使用虛擬環境避免權限問題
建立乾淨虛擬環境解決相依性衝突

❓ 瀏覽器無法訪問 localhost:5001

確認 Flask 是否成功啟動（查看終端機）
檢查防火牆是否阻擋 5001 埠
確認埠未被佔用，或修改 PORT=5002
確保使用 http:// 而非 https://

🤖 AI 服務相關問題

❓ OpenAI API 回傳「Rate limit exceeded」

短期：等待一段時間後重試
長期：升級 API 方案或使用多 Key 輪替
替代：切換到 Gemini（免費額度較多）

❓ AI 生成的提示詞品質不如預期

提供更詳細的需求描述
選擇「詳細」或「超詳細」等級
啟用「使用知識庫增強」選項
使用優化功能取得改進建議
嘗試切換到更強的模型（GPT-4 / Gemini Pro）

📚 RAG 知識庫問題

❓ 首次啟動 RAG 服務很慢

正常現象！需要下載 Sentence Transformers 模型（約 470MB）

# 預先下載模型
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')

❓ 上傳文件後搜尋不到內容

確認上傳成功（檢查日誌）
用文件中實際出現的詞彙搜尋測試
降低 RAG_SIMILARITY_THRESHOLD（例如 0.5）
刪除 data/vector_store/ 重建資料庫

⚡ 效能優化策略

🚀

AI 生成速度

使用快速模型：Gemini Flash / GPT-3.5
減少 RAG_TOP_K（例如 5 → 3）
前端顯示進度指示器
考慮使用串流回應

🔍

RAG 搜尋速度

刪除無用文件減少 chunk 數
增大 chunk_size（500 → 1000）
大規模資料考慮 FAISS / Pinecone
實作結果快取

💾

記憶體使用

確認模型只載入一次（單例模式）
使用磁碟持久化模式
關閉不需要的功能：ENABLE_RAG=false

📊

監控與診斷

查看 logs/app.log 日誌
使用系統監控工具
追蹤 API 回應時間

📊 系統監控

記憶體使用情況

Sentence Transformers 模型約 500MB-1GB
確認沒有記憶體洩漏
向量資料會佔用部分記憶體

⚠️ 注意：如果記憶體持續增長，檢查是否每次請求都重新載入模型

記憶體監控

📌 本節重點回顧

✅

問題排解要點

查看終端機錯誤訊息
確認環境配置正確
檢查網路與防火牆
善用日誌診斷問題

⚡

效能優化原則

選擇適合的模型
減少不必要的資料
善用快取機制
監控資源使用