Image Generation

Image Generation 適合用在 Agent 需要在對話中直接產生一張全新圖片的情境。

如果使用者要的是插圖、概念視覺、簡單 mockup，或其他 workspace 裡本來不存在的圖片草稿，這個工具就很適合。

什麼情況適合用 `Image Generation`

適合：

使用者明確要求 Agent 產生一張新圖片
回答不只需要文字，也需要視覺草稿
目前先有一張可討論、可審閱的草稿就夠了，之後可以再由人調整

不適合：

答案其實應該來自 Knowledge Base 或其他既有資料
你需要的是已經存在、已核准的品牌素材
這份工作本來就需要設計師做精準的最終正式稿，不能先用生成內容代替

步驟 1：加入 `Image Generation`

在 Editor 的 Tools 裡按 Add Tool，選 Image Generation。

步驟 2：選擇 `Image Model`

在 Image Model 裡選 Agent 要用的圖片模型。

第一版先保持簡單即可，一個模型就夠你驗證整個流程。

步驟 3：把 `When to Use` 寫窄

不要讓圖片生成變成 Agent 的預設反應，而是要讓它成為一個有條件的行為。

例如：

Use this tool when the user asks for a new visual concept, illustration, or simple mockup that can be created from a text description. Do not use it for factual questions or when an existing approved asset should be reused.

這種寫法的好處是，它同時說清楚了：

哪些需求才該觸發這個工具
哪些情況不該用
什麼時候應該產生新草稿，什麼時候應該重用既有素材

步驟 4：用明確需要圖片的問題來測

例如：

可以幫我做一張法律諮詢 landing page 的 hero image 概念圖嗎？
請用乾淨的 flat style，畫一張 onboarding flow 的簡單插圖。

測試時確認：

Agent 真的有呼叫這個工具
產出的圖片方向符合你的要求
面對一般文字問題時，Agent 不會亂產圖

Agent 在執行時還能控制什麼

工具設定表單本身只會讓你選模型，並填寫 When to Use。

真正對話時，Agent 還是可以自行決定一些圖片生成細節，例如：

送給模型的文字 prompt
額外的 style 描述
模型支援時可用的 aspect ratio

所以你的設定重點，不是把每個視覺細節都硬寫進工具，而是定義「這個 Agent 什麼情況可以產圖、可以產哪一類圖」。

操作建議

觸發條件要寫窄，避免使用者沒要求圖片時也被誤觸發。
如果圖片要遵守品牌、活動視覺或產品風格，請把這些規則寫進 Instructions，或附上參考素材。
如果你想讓 Agent 具備不同的產圖行為，可以加多個 Image Generation 工具，並替每個工具寫清楚不同的 When to Use。
除非你的流程有明確人工審核，不然請把生成圖片視為草稿，而不是最後定稿。

常見錯誤

`When to Use` 寫太空泛

像 Use this tool when visuals are helpful 這種寫法太鬆，Agent 很難穩定判斷。

明明有現成素材，卻還是叫 Agent 重畫

如果正確的 logo、示意圖或活動素材已經存在，就應該讓 Agent 參考那份來源，而不是重產一個近似版本。

以為只要換模型就能補救模糊需求

模型選擇很重要，但前提還是要有清楚的請求和明確的產圖邊界。