コンテンツにスキップ

安心して反復する

開発中

このセクションは現在積極的に開発中です。ドキュメントが完全に正確でない可能性があります。ご質問がある場合は、お問い合わせください。

Agentの設定を更新したいとき、こう心配するかもしれません:

「この変更で既存の正常な機能が壊れないだろうか?」

このセクションでは「セーフティネット」を構築します — Agentがすべき動作を記録し、更新のたびに素早く検証して、品質が低下せず、ユーザー体験に影響を与えないことを確認します。

反復プロセス

graph LR
    A[問題発見] --> B[基準定義]
    B --> C[設定調整]
    C --> D[品質検証]
    D --> E[安心してリリース]
    E -.-> A
ステップ 説明
問題発見 会話履歴からAgentの回答が理想的でないことを発見
基準定義 「この質問にどう答えるべきか」をテストケースとして記録
設定調整 Instruction、データソース、その他の設定を変更
品質検証 テストを実行し、すべてのケースが基準を満たすことを確認
安心してリリース 問題がないことを確認後、新バージョンを公開

学べること

  • 会話履歴から問題を分析し、改善が必要な箇所を見つける
  • テストケースを作成し、「良い回答」とは何かを定義する
  • 更新後に素早く品質を検証し、変更が既存機能を壊さないことを確認する

ここでの「基準」はあなたが定義します — なぜなら、あなたの顧客にとって何が本当に良い回答なのかを最もよく知っているのはあなただからです。

始めましょう

検証と改善