🚀

快速部署 RAG 平台

Part 2:10-15 分鐘完成部署,立即體驗 RAG 效果

虛擬環境 安裝套件 啟動伺服器 實際測試

🎯 本單元目標

跟著步驟做,10-15 分鐘就能看到成果!

Step 1

確認專案檔案位置

Step 2

建立 Python 虛擬環境

Step 3

安裝必要套件

Step 4

啟動 Flask 伺服器

Step 5

設定 API Key

Step 6

匯入知識庫並測試

先看到效果,再了解原理!
Step 1:確認專案檔案位置

首先確認你已經有專案檔案,應該在以下路徑:

專案路徑
D:\自己架設AI_零基礎到大師\CH3_打造RAG知識庫問答平台\

📁 你應該看到這些檔案:

  • app.py - Flask 後端主程式
  • requirements.txt - 套件清單
  • README.md - 說明文件
  • templates/ - 網頁模板
  • static/ - CSS、JS
  • data/ - 範例知識庫
確認完畢? 接下來建立虛擬環境!
Step 2:建立並啟動虛擬環境

虛擬環境是 Python 專案的獨立空間,避免套件版本衝突。

📌 Windows 用戶

切換到專案資料夾
cd D:\自己架設AI_零基礎到大師\CH3_打造RAG知識庫問答平台
建立虛擬環境
python -m venv venv
啟動虛擬環境
venv\Scripts\activate
成功標誌:看到提示符號前面出現 (venv) 就表示成功!
Step 2:macOS / Linux 用戶
切換到專案資料夾
cd ~/自己架設AI_零基礎到大師/CH3_打造RAG知識庫問答平台
建立虛擬環境
python3 -m venv venv
啟動虛擬環境
source venv/bin/activate
小提醒:每次開啟新的終端機視窗,都要重新啟動虛擬環境!
Step 3:安裝必要套件

確認虛擬環境已啟動(看到 (venv)),然後執行:

安裝所有套件
pip install -r requirements.txt
⚠️ 重要提醒:
首次安裝會下載 AI 模型(約 400MB),需要 5-10 分鐘,請耐心等候!

📦 安裝的主要套件

flask

網頁框架

openai

OpenAI API

google-generativeai

Gemini API

sentence-transformers

向量嵌入核心

Step 4:啟動 Flask 伺服器

套件安裝完成後,只需一行指令就能啟動!

啟動伺服器
python app.py
成功畫面:
 * Serving Flask app 'app'
 * Debug mode: on
 * Running on http://127.0.0.1:5001
Press CTRL+C to quit
📌 小提醒:
  • 終端機會保持運行狀態,不要關閉
  • Ctrl+C 可以停止伺服器
Step 5:開啟網頁介面

保持終端機運行,開啟瀏覽器並輸入:

網址
http://127.0.0.1:5001

🖥️ 你會看到...

主標題

RAG 知識庫 AI 問答平台

功能按鈕

⚙️ 設定、🗄️ 知識庫管理、🗑️ 清空對話

對話區域

中間顯示對話內容

輸入框

下方輸入訊息

Step 6:設定 API Key

點擊右上角 ⚙️ 設定 按鈕,進行以下設定:

1. 選擇 AI 服務

OpenAI 或 Google AI Studio

2. 輸入 API Key

貼上你的 API Key

3. 選擇模型

GPT-4o 或 Gemini 2.0 Flash

4. 選擇角色

建議選「知識庫助理」

⚠️ 最重要!務必勾選:
☑️ 啟用 RAG 知識庫檢索
Step 7:匯入範例知識庫

點擊右上角 🗄️ 知識庫管理 按鈕

  1. 點擊 「📤 匯入 CSV/Excel」 按鈕
  2. 選擇檔案:data/knowledge_base_example.csv
  3. 點擊 「上傳」
  4. 等待 「成功匯入 XX 筆資料」 訊息
匯入完成! 知識庫表格會顯示所有資料,包含問題、答案、分類等欄位。
Step 8:測試 RAG 問答功能!

關閉知識庫管理介面,回到主畫面,試試這些問題:

什麼是 Flask?
RAG 是什麼技術?
Python 虛擬環境有什麼用?
如何學習程式設計?
觀察重點:
  • AI 回答下方會顯示 📚 參考來源
  • 每個來源都有 相似度百分比
  • 這就是 RAG 的精髓!

🎉 恭喜!你成功部署了 RAG 平台

📚 參考來源區塊包含:

  • 問題:知識庫中最相關的問題
  • 分類:這筆知識的分類
  • 相似度:語意相似程度(%)

⚡ RAG 運作過程:

  1. 你的問題 → 轉換成向量
  2. 向量搜尋知識庫
  3. 找到相關內容給 AI
  4. AI 生成精準回答
這就是 RAG 的魔力! AI 不再只靠記憶,而是能參考你的專業知識庫。

❓ 常見問題快速排除

❌ 套件安裝失敗

先升級 pip:
python -m pip install --upgrade pip

❌ 網頁打不開

確認終端機顯示 Running on... 且沒關閉

❌ AI 沒用知識庫

確認設定中勾選了「啟用 RAG 知識庫檢索」

❌ 模型下載很慢

正常現象,約 400MB,請耐心等待

📝 Part 2 總結

✅ 完成項目

  • 建立虛擬環境
  • 安裝套件
  • 啟動伺服器
  • 設定 API Key
  • 匯入知識庫
  • 測試 RAG 問答

🎯 學到了

  • RAG 實際運作效果
  • 參考來源的價值
  • 相似度的意義
  • 知識庫管理基礎

🚀 下一步

Part 3:深入了解向量嵌入與相似度搜尋的原理!