Google Flow Tutorial

Part 2: 基礎操作與文字轉影片

掌握 Text to Video 核心技巧

Text to Video Prompt 技巧 音訊生成

📂 創建新專案

開始使用 Flow 的第一步是創建專案,讓我們一步步來:

  1. 進入 Flow 主畫面
    登入後,你會看到專案總覽頁面
  2. 點擊「New Project」
    位於畫面右上角或中央的建立按鈕
  3. 為專案命名
    給專案一個容易辨識的名稱,方便後續管理
  4. 選擇創作模式
    在底部提示框選擇「Text to Video」開始
💡 提示: 建議為每個創作主題建立獨立專案,方便後續管理和迭代修改。

📝 Text to Video 功能介紹

Text to Video 是 Flow 最核心的功能,讓你用文字描述直接生成影片。

🎬 基本原理

輸入英文描述,AI 根據文字內容生成對應的影片畫面和音訊。

🎵 Veo 3 音訊

支援原生音效生成,包括環境音、音樂、甚至角色對話。

⏱️ 影片長度

單次生成約 5-10 秒,可透過 Extend 功能延長至一分鐘以上。

⚠️ 注意: 目前 Flow 只接受英文提示詞,中文會影響生成效果。

🔤 提示詞結構五大要素

撰寫好的提示詞需要涵蓋這五個關鍵要素:

要素 說明 範例
Subject(主體) 影片中的主角或物件 A young woman, a golden retriever
Action(動作) 主體正在做什麼 walking slowly, running through
Environment(環境) 場景設定 in a sunlit forest, on a busy street
Lighting(光線) 光線條件 golden hour lighting, soft natural light
Style(風格) 視覺風格 cinematic, photorealistic, 8K

📹 運鏡與構圖描述

專業的運鏡描述能讓生成的影片更具電影感:

🎯 鏡頭類型

  • wide shot - 廣角鏡頭
  • close-up - 特寫
  • medium shot - 中景
  • extreme close-up - 極特寫

🎥 運鏡方式

  • tracking shot - 追蹤鏡頭
  • aerial view - 空拍視角
  • dolly in/out - 推進/拉遠
  • pan left/right - 橫搖

🎬 視角設定

  • first-person POV - 第一人稱
  • bird's eye view - 鳥瞰
  • low angle - 仰角
  • over-the-shoulder - 過肩

💡 提示詞範例 - 自然風景

📝 範例提示詞

"A majestic waterfall cascading down mossy cliffs in a lush tropical rainforest. Mist rising from the pool below, sunlight filtering through the canopy creating god rays. Wide shot, slow pan right, cinematic quality, 8K resolution, ambient forest sounds with rushing water."

🔍 提示詞分析

  • 主體: majestic waterfall(壯觀的瀑布)
  • 動作: cascading down(傾瀉而下)
  • 環境: tropical rainforest, mossy cliffs(熱帶雨林、苔蘚岩壁)
  • 光線: sunlight filtering, god rays(陽光穿透、丁達爾效應)
  • 運鏡: wide shot, slow pan right(廣角、慢慢右搖)
  • 音訊: ambient forest sounds, rushing water(森林環境音、流水聲)

💡 提示詞範例 - 都市場景

📝 範例提示詞

"First-person POV walking through neon-lit streets of Tokyo at night. Rain-soaked pavement reflecting colorful signs, crowds of people with umbrellas. Handheld camera movement, slight shake, cyberpunk aesthetic. Sound of rain, distant traffic, and Japanese pop music from nearby shops."

🔍 提示詞分析

  • 視角: First-person POV(第一人稱視角)
  • 動作: walking through(穿越走過)
  • 環境: neon-lit streets of Tokyo, rain-soaked pavement(霓虹燈東京街道、雨後路面)
  • 風格: cyberpunk aesthetic(賽博龐克美學)
  • 運鏡: Handheld, slight shake(手持、輕微晃動)
  • 音訊: rain, traffic, Japanese pop music(雨聲、車流、日本流行音樂)

🎵 音訊生成技巧

Veo 3 支援原生音訊生成,你可以在提示詞中描述想要的聲音:

🔊 環境音效

描述場景中的自然聲音

birds chirping, wind rustling leaves, waves crashing

🎶 背景音樂

指定音樂風格或氛圍

soft piano music, epic orchestral score, upbeat electronic

💬 對話與人聲

Text to Video 支援角色對話

"Hello, welcome!" a cheerful voice says

🔇 無聲選項

如需無聲影片可標註

silent video, no audio
🎯 Pro Tip: 音訊描述越具體,生成效果越好。例如「distant thunder」比單純「thunder」更能傳達空間感。

🎬 生成與預覽流程

  1. 輸入提示詞
    在底部文字框輸入你的英文描述
  2. 點擊生成按鈕
    按下 Generate 開始 AI 運算
  3. 等待生成
    通常需要 30 秒至數分鐘
  4. 預覽結果
    生成完成後可以立即預覽影片
  5. 迭代修改
    不滿意可調整提示詞重新生成
💡 省積分技巧: 先用較短、較簡單的提示詞測試方向,確認風格後再加入更多細節。

🧠 隨堂測驗

問題: 以下哪個提示詞結構最完整?

  1. "A cat"
  2. "A fluffy orange cat sitting on a windowsill, afternoon sunlight, cozy atmosphere"
  3. "Cat video please"
  4. "貓咪在窗邊曬太陽"

✅ 測驗解答

答案:(2) "A fluffy orange cat sitting on a windowsill, afternoon sunlight, cozy atmosphere"

解釋:

  • (1) 太簡略,缺乏細節
  • (2) ✅ 包含主體描述、動作、環境、光線、氛圍
  • (3) 不是有效的提示詞格式
  • (4) ❌ 中文無法被正確處理

🎉 Part 2 總結

你已經掌握了 Text to Video 的核心技巧!

專案管理

建立專案、命名、選擇創作模式

提示詞五要素

主體、動作、環境、光線、風格

運鏡描述

鏡頭類型、運鏡方式、視角設定

音訊生成

環境音、背景音樂、對話

👉 下一步: 前往 Part 3 學習 Frames to Video、Ingredients 等進階功能!

前往 Part 3 →