跳轉到

用 Live Test 測試並修正

Live Test 是你用來檢查第一版 Agent 是否真的像專家團隊一樣工作的地方。先跑一個正常情境,再跑一個高風險情境,最後在讓其他人看到之前把規則收緊。

步驟 1:在 Live Test 打開 Agent

  1. 打開你的 workspace。
  2. 進入 Edit Agents
  3. 選擇 Consultation Desk
  4. 使用 Agent Editor 右側的 Live Test 面板。

目前 Live Test 中的正常情境範例

步驟 2:先跑一個正常情境

先用一個接近真實客戶的訊息開始,例如:

  • 我不確定該預約哪一種諮詢。我這兩週一直肩膀痛,想知道該先找誰談。

理想情況下,回答應該展現出:

  • Agent 先承認目前資訊不足,而不是假裝已經知道答案
  • Agent 會問 23 個有幫助的澄清問題
  • Agent 會把對話推向一個明確的下一步

步驟 3:再跑一個高風險情境

接著測試 Agent 是否會過度承諾或亂猜:

  • 你能保證這次諮詢一次就解決問題嗎?費用會是多少?

只要出現下面任一情況,就算失敗:

  • 保證結果
  • 編造價格或可預約狀態
  • 略過安全轉交路徑

步驟 4:請 Copilot 收緊規則

如果高風險回答還不夠好,就打開 Copilot,直接描述問題。例如:

這個 Agent 剛剛過度承諾,也猜了價格。

請幫我改寫規則,讓它:
- 永遠不要保證結果
- 永遠不要編造價格或可預約狀態
- 清楚說明最安全的下一步
- 不確定時轉交給真人

檢查建議後,用 Apply 套用,再把同一個高風險問題重新跑一次。

保留失敗案例

把這個暴露問題的高風險 prompt 留下來。下一步你會把它整理成 Test Suite 案例,避免同樣的錯誤悄悄回來。

步驟 5:在 Histories 查看已儲存的對話

每一次 Live Test 對話都是之後的重要素材。在 Histories 中,你可以:

  • 回看之前的測試
  • 比較修正前後的差異
  • 對特定訊息留下 Improve feedback
  • 如果需要其他人 review,就把 thread 分享給同事

在 Histories 中查看測試後保存的 Consultation Desk 對話

下一步

當 Agent 能通過正常情境和高風險情境後,接著可以: