📖

前置階段:Gemini Gem 論文閱讀器

Paper Reader — 你的 AI 讀書夥伴,帶你逐頁讀懂英文論文

在進入 NotebookLM 知識蒸餾之前,先用 Gemini Gem 打造專屬的論文閱讀器,
像學長姐一樣帶你一頁一頁看懂 Chapter W 的每一個段落與專有名詞。

Gemini Gem 逐頁精讀 紅藍筆標註 專有名詞翻譯 14 頁完整攻略

為什麼需要 Gem 論文閱讀器?

NotebookLM 是強大的知識蒸餾工具,但它有一個明顯的短板 — 它擅長「整體分析」,卻不擅長「逐頁陪你讀」。面對一篇 14 頁的英文學術文章,你真正需要的是有人帶你一頁一頁慢慢讀。

  • NotebookLM 的限制:NotebookLM 會把整份文件當成一個整體來分析,它能快速告訴你「這篇論文的主旨是什麼」,但無法帶你逐頁、逐段落地閱讀和理解每一個細節
  • 英文學術論文的挑戰:14 頁的 Chapter W 充滿了學術專有名詞(如 Worked Examples、Cognitive Load Theory、Schema Acquisition),直接丟給 NotebookLM 分析,你可能看得懂結論,卻看不懂過程
  • 需要「陪讀型」的 AI 助手:你需要一個像坐在旁邊的學長姐一樣的工具,逐頁帶你讀、幫你翻譯、替你畫重點、為你解釋上下文脈絡
  • 先讀懂,才能蒸餾:如果你自己都沒讀懂原文,就算 NotebookLM 幫你產出了簡報,你也無法判斷內容是否正確、是否遺漏了重要概念
  • 建立知識基礎:逐頁精讀後,你對每個專有名詞、每段論述邏輯都有基本理解,接下來使用 NotebookLM 時才能提出精準的問題、做出正確的判斷

論文閱讀器的「三色筆」標註系統

  • 🔴 紅筆 — 專有名詞標註:遇到學術專有名詞,自動標出英文原文、中文翻譯、以及白話定義解釋。例如:Worked Examples(工作範例)— 指提供完整解題步驟的教學示範
  • 🔵 藍筆 — 段落核心意思:針對每一個段落,用淺顯易懂的中文寫出「這段到底在講什麼」,幫助你理解論文的論述邏輯與推進方式
  • 💡 每頁摘要 — 重點歸納:每一頁讀完後,給你一段精簡的筆記摘要,幫你快速回顧這一頁的核心內容,也方便日後複習
  • 🔗 前後頁關聯 — 脈絡串接:告訴你這一頁和前一頁、後一頁的關係,讓你不會迷失在論文的長篇論述中
📌 核心概念:Gem 論文閱讀器幫你「逐頁看懂原文」,NotebookLM 負責「把知識重新組織成簡報」。兩個工具各有分工 — Gem 是「讀懂」的工具,NotebookLM 是「產出」的工具。先讀懂再產出,才是正確的學術工作流程。

什麼是 Gem?— Google Gemini 的自訂 AI 助手

Gem 是 Google Gemini 推出的「自訂 AI 助手」功能,讓你可以打造專屬的 AI 工具。你只要幫 Gemini 寫一份「工作說明書」,它就會按照你的指示,用固定的角色、語氣、格式來回答問題。

  • Gem 的本質:你寫一份「工作說明書(Prompt)」給 Gemini,告訴它「你是誰、你要怎麼工作、你的輸出長什麼樣子」,Gemini 就會嚴格按照這份說明書來回應你的每一次提問
  • 可設定的內容:包含角色設定(例如「你是一位專業的論文閱讀筆記助手」)、回答方式(例如「逐頁閱讀模式」)、輸出格式(例如「紅藍筆標註+每頁摘要」)、語言偏好(例如「繁體中文」)
  • 設定一次,永久使用:Gem 建好之後會儲存在你的 Gemini 帳號中,下次要讀另一篇論文時,只要開啟同一個 Gem、上傳新的 PDF,就能直接開始使用,不需要重新設定
  • 跨平台類比:ChatGPT 的對應功能叫 GPTs(自訂 GPT),Gemini 的對應功能叫 Gem。兩者概念相同,都是「讓使用者自訂 AI 的行為模式」
  • 免費即可使用:Gem 功能包含在 Google Gemini 的免費版本中,不需要付費升級也能建立和使用自訂的 Gem
  • 為什麼不直接用 Gemini 聊天?:因為每次對話都重新下指令太麻煩,而且 AI 的回答品質會不穩定。透過 Gem 預先設定好規則,AI 每次都會用相同的格式和品質回答
📌 白話比喻:Gem 就像你為 AI 寫的「標準作業流程(SOP)」。想像你雇了一位助理,你不會每天早上重新教他怎麼做事,而是給他一本工作手冊,讓他照著做。Gem 就是這本工作手冊 — 寫一次,AI 就永遠照著做。

如何建立「論文閱讀器」Gem — 步驟詳解

以下是建立 Gem 的完整步驟,每一步都附有詳細說明,即使是第一次使用 Gemini 的同學也能順利完成。

  1. 開啟 Gemini 網站並登入:在瀏覽器中前往 gemini.google.com,使用你的 Google 帳號登入。如果你已經登入 Gmail 或 Google Drive,通常會自動登入。建議使用 Chrome 或 Edge 瀏覽器以獲得最佳體驗
  2. 進入 Gem 管理員:登入後,看向畫面左側的側邊欄,找到「Gem 管理員」選項並點擊進入。在 Gem 管理員頁面的右上角,點擊「+ 新增 Gem」按鈕,開始建立你的第一個自訂 Gem
  3. 設定 Gem 名稱:在名稱欄位輸入「論文閱讀器 Paper Reader」。取一個中英文混合的名稱,方便日後辨識。你也可以自訂其他名稱,例如「學術論文逐頁助手」等
  4. 貼入指令(下一頁詳解):在「指令」欄位中貼入預先準備好的提示詞(Prompt),這是整個 Gem 最核心的設定,決定了 AI 的行為模式和輸出格式
  5. 儲存 Gem:確認所有設定無誤後,點擊右上角的「儲存」按鈕。儲存完成後,你的 Gem 就會出現在 Gem 管理員的列表中,隨時可以開啟使用
建立小提醒:完成以上五步,就建好了一個完整的論文閱讀器 Gem。整個過程不到 5 分鐘。其中最關鍵的是第四步「貼入指令」,指令的品質直接決定了 Gem 的回答品質。下一頁我們會詳細說明指令的內容與設計邏輯。

貼入 Gem 指令 — 最關鍵的一步

在「指令」欄位中貼入以下核心內容。這份指令就是 Gem 的「靈魂」,它決定了 AI 每次回答的角色、格式和品質。指令的設計邏輯是:透過「角色設定+固定輸出格式+明確標註規則」,確保 AI 每次都以相同的高品質方式回答,大幅降低輸出的不穩定性。

// ===== 論文閱讀器 Gem — 核心指令架構 ===== // 設計邏輯:角色設定 + 工作模式 + 輸出格式 + 標註規則 + 語言設定 // 目的:讓 AI 的輸出穩定可預期,每一頁都用相同格式回答 【角色設定】 你是一位專業的「論文閱讀筆記助手」。 【工作模式】 逐頁閱讀模式 — 使用者每次指定一頁,你就針對該頁進行完整分析。 【每頁輸出格式】 📖 第 X 頁 → 列出該頁的原文重要段落 🔴 紅筆標註 → 專有名詞(英文原文+中文翻譯+白話定義) 🔵 藍筆標註 → 每段落的核心意思解讀 💡 筆記摘要 → 本頁重點歸納(3-5 句) 🔗 前後頁關聯 → 與上一頁和下一頁的邏輯串接 【標註規則】 紅筆:每個專有名詞都要附「英文+中文+一句話定義」 藍筆:用淺顯易懂的中文解釋,避免直譯式翻譯 【語言設定】 全程使用繁體中文回答,專有名詞保留英文原文
  • 為什麼要設定角色?:告訴 AI「你是誰」,它才知道用什麼語氣和深度來回答。設定為「論文閱讀筆記助手」,AI 就會自動採用學術但親切的語調
  • 為什麼要固定格式?:如果不指定格式,AI 每次的回答結構都不同,有時長有時短、有時有標註有時沒有。固定格式讓每一頁的筆記都整齊一致,方便後續整理
  • 為什麼要標註規則?:明確告訴 AI「紅筆標什麼、藍筆標什麼」,它才不會自作主張。標註規則越具體,輸出品質越穩定
📝 重要提醒:完整的指令文字請見教學手冊附錄,此處為核心架構示意。實際使用時,你可以根據自己的需求微調指令,例如增加「用生活化的例子解釋抽象概念」等額外要求。指令寫得越清楚,Gem 的表現就越好。

準備素材 — 抽取 PDF 並轉為逐頁 JPG

在開始使用 Gem 之前,需要完成兩個準備步驟:(1) 將目標章節從整本教科書中抽取出來;(2) 將 PDF 轉換為逐頁 JPG 圖片。Chapter W(Worked Examples 工作範例)位於教科書的第 366–379 頁,共 14 頁

步驟一:抽取 Chapter W 獨立 PDF

  • 瀏覽器列印法:用 Chrome 或 Edge 開啟原始 PDF → 按 Ctrl + P → 目的地選「另存為 PDF」→ 頁碼範圍輸入 366-379 → 儲存為 學習理論Ch.W.pdf

步驟二:將 PDF 轉為逐頁 JPG 圖片

  • 為什麼需要這一步?:Gemini Gem 無法直接對 PDF 進行逐頁閱讀 — 即使你上傳了 PDF 並說「請給我第 1 頁」,Gem 也無法準確定位到特定頁面。必須將每一頁轉為獨立的 JPG 圖片,Gem 才能透過圖片辨識準確閱讀每一頁
  • 操作方法:前往 iLovePDF.com → 選擇「PDF 轉 JPG」功能 → 上傳 學習理論Ch.W.pdf → 選擇「每頁轉一張圖」→ 點擊「轉換為 JPG」→ 下載並解壓縮,得到 14 張 JPG
  • iLovePDF 網址https://www.ilovepdf.com/zh-tw/pdf_to_jpg(免費、免註冊、繁體中文介面)
⚠️ 重要提醒:Gem 每次對話最多只能上傳 10 張圖片,14 頁的章節需要分兩批上傳(第 1–10 頁為第一批,第 11–14 頁為第二批)。兩批都上傳完畢後,才能開始逐頁閱讀。後續上傳到 NotebookLM 時,仍使用原始的 PDF 檔案即可。

實際使用示範 — 分批上傳 JPG 並逐頁閱讀

Gem 建好、14 張 JPG 準備好之後,就可以開始了。操作流程分三步:上傳第一批圖片(第 1–10 頁)上傳第二批圖片(第 11–14 頁)開始逐頁閱讀

上傳流程(分兩批)

  1. 開啟 Gem:回到 Gemini,開啟「論文閱讀器 Paper Reader」Gem
  2. 上傳第一批:點選附件圖示,選取第 1–10 頁的 JPG(共 10 張),送出。Gem 一次最多接受 10 張圖片
  3. 上傳第二批:在同一對話中,再次上傳第 11–14 頁的 JPG(共 4 張),送出。兩批都上傳完畢後才能開始

開始逐頁閱讀

(兩批 JPG 已上傳完畢)→ 輸入「請給我第 1 頁」
📖 第 1 頁
原文段落:本頁介紹 Worked Examples 的定義與教學意義...
🔴 Worked Examples(工作範例):指提供完整解題步驟的教學示範,讓學習者觀察專家的解法過程
🔴 Cognitive Load Theory(認知負荷理論):解釋人類工作記憶容量有限,教學設計應降低不必要的認知負擔
🔵 第 1 段:開宗明義為 Worked Examples 下定義,說明它是教學設計中最常見且最有效的策略之一
🔵 第 2 段:連結到認知負荷理論,說明為什麼工作範例能降低學習者的認知負擔
💡 本頁重點:工作範例=逐步示範專家解法,根植於認知負荷理論,是降低學習負擔的核心教學策略
🔗 本頁為章節開頭,下一頁將進入工作範例的理論基礎
✅ 第 1 頁筆記完成。請說「第 2 頁」繼續閱讀。

使用技巧與注意事項

  • 為什麼要轉 JPG?:Gem 無法直接對 PDF 進行逐頁定位,必須將每頁轉為獨立圖片,Gem 才能透過圖片辨識精準閱讀每一頁的內容
  • 逐頁推進:每次只讀一頁,讀完後輸入「第 2 頁」「第 3 頁」依序推進。不要跳頁,因為 Gem 會追蹤前後頁的關聯
  • 可隨時追問:如果某個專有名詞看不懂,可以直接追問「請更詳細解釋 Cognitive Load Theory」,Gem 會給你更深入的說明
  • 全程約 30-40 分鐘:14 頁論文依序讀完,大約需要 30 到 40 分鐘。每一頁都會產出完整的紅藍筆標註與摘要筆記
  • 筆記可匯出:讀完全部 14 頁後,你可以請 Gem「請幫我整理全部 14 頁的摘要筆記」,它會產出一份完整的閱讀筆記,可以複製貼上保存
時間預估:轉 JPG 約 2 分鐘(iLovePDF 線上完成),上傳兩批約 3 分鐘,逐頁閱讀 14 頁約 30–40 分鐘。完成後你會擁有一份完整的逐頁筆記,這就是接下來使用 NotebookLM 進行知識蒸餾的重要基礎。

Gem vs NotebookLM — 兩個工具,各司其職

很多同學會問:「既然有 NotebookLM,為什麼還要用 Gem?」答案是它們解決的是完全不同的問題。兩個工具互補搭配,才能完成從「讀懂論文」到「產出簡報」的完整流程。

論文閱讀器 Gem

「讀書夥伴」— 我讀懂原文了

功能定位:逐頁標註、翻譯專有名詞、解讀段落意思
回答的問題:「這一頁在講什麼?」「這個名詞是什麼意思?」
產出物:紅藍筆標註筆記、逐頁摘要、專有名詞對照表

📓

NotebookLM 知識蒸餾

「研究助理」— 我把知識變成簡報了

功能定位:萃取精煉、蒸餾組織、重新架構知識
回答的問題:「知識如何變成簡報?」「怎麼組織成有邏輯的報告?」
產出物:學術簡報架構、講稿草稿、重點整理

🍳 料理比喻:Gem 是「把食材洗好切好」 → NotebookLM 是「把食材炒成一道菜」— 沒有前者的準備,後者無法上菜
📌 流程串接:前置階段用 Gem 逐頁讀懂論文 → 第一階段用 NotebookLM 上傳 PDF 進行知識萃取 → 第二階段產出學術簡報與講稿。Gem 建立的閱讀理解基礎,讓你在使用 NotebookLM 時能精準判斷 AI 產出的品質,避免「AI 說什麼就信什麼」的風險。

前置階段完成!

你已經完成了以下準備工作:

✅ 了解 Gem 的功能與定位  |  ✅ 建立論文閱讀器 Gem  |  ✅ 抽取 Chapter W 獨立 PDF  |  ✅ 逐頁閱讀完成

接下來,我們將把讀懂的知識交給 NotebookLM,進行知識萃取與蒸餾!

🏠 回到統整頁 第一階段:上傳 PDF 與知識萃取 →