Image Generation
Image Generation 適合用在 Agent 需要在對話中直接產生一張全新圖片的情境。
如果使用者要的是插圖、概念視覺、簡單 mockup,或其他 workspace 裡本來不存在的圖片草稿,這個工具就很適合。
什麼情況適合用 Image Generation
適合:
- 使用者明確要求 Agent 產生一張新圖片
- 回答不只需要文字,也需要視覺草稿
- 目前先有一張可討論、可審閱的草稿就夠了,之後可以再由人調整
不適合:
- 答案其實應該來自
Knowledge Base或其他既有資料 - 你需要的是已經存在、已核准的品牌素材
- 這份工作本來就需要設計師做精準的最終正式稿,不能先用生成內容代替
步驟 1:加入 Image Generation
在 Editor 的 Tools 裡按 Add Tool,選 Image Generation。
步驟 2:選擇 Image Model
在 Image Model 裡選 Agent 要用的圖片模型。
第一版先保持簡單即可,一個模型就夠你驗證整個流程。
步驟 3:把 When to Use 寫窄
不要讓圖片生成變成 Agent 的預設反應,而是要讓它成為一個有條件的行為。
例如:
Use this tool when the user asks for a new visual concept, illustration, or simple mockup that can be created from a text description. Do not use it for factual questions or when an existing approved asset should be reused.
這種寫法的好處是,它同時說清楚了:
- 哪些需求才該觸發這個工具
- 哪些情況不該用
- 什麼時候應該產生新草稿,什麼時候應該重用既有素材
步驟 4:用明確需要圖片的問題來測
例如:
可以幫我做一張法律諮詢 landing page 的 hero image 概念圖嗎?請用乾淨的 flat style,畫一張 onboarding flow 的簡單插圖。
測試時確認:
- Agent 真的有呼叫這個工具
- 產出的圖片方向符合你的要求
- 面對一般文字問題時,Agent 不會亂產圖
Agent 在執行時還能控制什麼
工具設定表單本身只會讓你選模型,並填寫 When to Use。
真正對話時,Agent 還是可以自行決定一些圖片生成細節,例如:
- 送給模型的文字 prompt
- 額外的 style 描述
- 模型支援時可用的 aspect ratio
所以你的設定重點,不是把每個視覺細節都硬寫進工具,而是定義「這個 Agent 什麼情況可以產圖、可以產哪一類圖」。
操作建議
- 觸發條件要寫窄,避免使用者沒要求圖片時也被誤觸發。
- 如果圖片要遵守品牌、活動視覺或產品風格,請把這些規則寫進
Instructions,或附上參考素材。 - 如果你想讓 Agent 具備不同的產圖行為,可以加多個
Image Generation工具,並替每個工具寫清楚不同的When to Use。 - 除非你的流程有明確人工審核,不然請把生成圖片視為草稿,而不是最後定稿。
常見錯誤
When to Use 寫太空泛
像 Use this tool when visuals are helpful 這種寫法太鬆,Agent 很難穩定判斷。
明明有現成素材,卻還是叫 Agent 重畫
如果正確的 logo、示意圖或活動素材已經存在,就應該讓 Agent 參考那份來源,而不是重產一個近似版本。
以為只要換模型就能補救模糊需求
模型選擇很重要,但前提還是要有清楚的請求和明確的產圖邊界。