跳轉到

Image Generation

Image Generation 適合用在 Agent 需要在對話中直接產生一張全新圖片的情境。

如果使用者要的是插圖、概念視覺、簡單 mockup,或其他 workspace 裡本來不存在的圖片草稿,這個工具就很適合。

什麼情況適合用 Image Generation

適合:

  • 使用者明確要求 Agent 產生一張新圖片
  • 回答不只需要文字,也需要視覺草稿
  • 目前先有一張可討論、可審閱的草稿就夠了,之後可以再由人調整

不適合:

  • 答案其實應該來自 Knowledge Base 或其他既有資料
  • 你需要的是已經存在、已核准的品牌素材
  • 這份工作本來就需要設計師做精準的最終正式稿,不能先用生成內容代替

步驟 1:加入 Image Generation

EditorTools 裡按 Add Tool,選 Image Generation

步驟 2:選擇 Image Model

Image Model 裡選 Agent 要用的圖片模型。

第一版先保持簡單即可,一個模型就夠你驗證整個流程。

步驟 3:把 When to Use 寫窄

不要讓圖片生成變成 Agent 的預設反應,而是要讓它成為一個有條件的行為。

例如:

Use this tool when the user asks for a new visual concept, illustration, or simple mockup that can be created from a text description. Do not use it for factual questions or when an existing approved asset should be reused.

這種寫法的好處是,它同時說清楚了:

  • 哪些需求才該觸發這個工具
  • 哪些情況不該用
  • 什麼時候應該產生新草稿,什麼時候應該重用既有素材

步驟 4:用明確需要圖片的問題來測

例如:

  • 可以幫我做一張法律諮詢 landing page 的 hero image 概念圖嗎?
  • 請用乾淨的 flat style,畫一張 onboarding flow 的簡單插圖。

測試時確認:

  • Agent 真的有呼叫這個工具
  • 產出的圖片方向符合你的要求
  • 面對一般文字問題時,Agent 不會亂產圖

Agent 在執行時還能控制什麼

工具設定表單本身只會讓你選模型,並填寫 When to Use

真正對話時,Agent 還是可以自行決定一些圖片生成細節,例如:

  • 送給模型的文字 prompt
  • 額外的 style 描述
  • 模型支援時可用的 aspect ratio

所以你的設定重點,不是把每個視覺細節都硬寫進工具,而是定義「這個 Agent 什麼情況可以產圖、可以產哪一類圖」。

操作建議

  • 觸發條件要寫窄,避免使用者沒要求圖片時也被誤觸發。
  • 如果圖片要遵守品牌、活動視覺或產品風格,請把這些規則寫進 Instructions,或附上參考素材。
  • 如果你想讓 Agent 具備不同的產圖行為,可以加多個 Image Generation 工具,並替每個工具寫清楚不同的 When to Use
  • 除非你的流程有明確人工審核,不然請把生成圖片視為草稿,而不是最後定稿。

常見錯誤

When to Use 寫太空泛

Use this tool when visuals are helpful 這種寫法太鬆,Agent 很難穩定判斷。

明明有現成素材,卻還是叫 Agent 重畫

如果正確的 logo、示意圖或活動素材已經存在,就應該讓 Agent 參考那份來源,而不是重產一個近似版本。

以為只要換模型就能補救模糊需求

模型選擇很重要,但前提還是要有清楚的請求和明確的產圖邊界。

下一步