まずここから

初めて Codeer を評価する人や運用する人は、まずこの流れを進めてください。

Codeer は、顧客との会話や業務フロー上のあらゆる場面に専門家の判断を持ち込むための仕組みです。ここで作るのは、定型文を返すチャットボットでも、prompt を書いてそのまま信じる仕組みでもありません。Agent と検証済みシナリオを一緒に作り、何に答え、何に答えず、いつ handoff するかを決めます。

このガイドでは、狭い first scope に絞ったシンプルな customer service Agent を作ります。例をあえて普通にしているのは、方法を見えやすくするためです。扱いたい質問から始め、境界をテストし、未検証の範囲は後の version まで安全な fallback に残します。

このガイドでは、最初の完全な loop を進めます。Copilot と目的を話し、最初の Agent を作り、Copilot に重要シナリオの初版を作らせ、すぐに Test Suite で 20 から 30 件を試し、pass しない case を直していきます。

ここまで進むと、実際の behavior が見えにくい空の Agent ではなくなります。score がまだ完璧でなくても、重要なシナリオで Agent がどう振る舞うかを確認できます。問題を見つけることが、問題を制御する最初の一歩です。

現在の Agent Editor と Live Test で動く customer service Agent の例

このガイドでできること

この一連の流れを終えると、次の状態になります。

Copilot で作ったシンプルな customer service Agent の初版がある
core、boundary、action scenario を含む最初の scenario set がある
Test Suite で再実行でき、確認可能な Standard を持つ case がある
slug 付きの共有可能な Web channel がある
実際の会話から stakeholder のフィードバックを集めている
次の version で追加する scenario scope が見えている

この customer service Agent がすべきこと

最初の customer service Agent の役割は次のとおりです。

十分にテストされ検証された小さな customer question set に答える
first scope の外にある質問は、拒否、handoff、または form に流す
未承認の policy、price、guarantee、outcome を作り話しない
最初の検証済みシナリオに必要な knowledge と tool だけを使う

重要シナリオから始める

Agent を広げる前に、本当に重視する最初の scenario set を定義します。

Agent が答えるべき core scenarios
Agent が拒否、handoff、または form に流すべき boundary scenarios
tool が必要な action scenarios

信頼できる scope を定義して広げる方法は、検証済みシナリオを読んでください。

前提条件

始める前に、次を確認してください。

Codeer.ai アカウントを持っている
Agent の編集と channel の公開ができる workspace 権限がある
Chrome、Firefox、Edge などのモダンブラウザを使っている

最初に進めるべきおすすめフロー

1ワークスペースを設定

↓

2検証済みシナリオを定義

↓

3最初の草案を作ってデバッグ

↓

4Test Suite でシナリオを検証

↓

5安定した scope を公開

↓

6Production feedback を確認

↓

7Version ごとに scope を広げる

ステップ1：ワークスペースを設定

Agent、channel、フィードバックを 1 か所にまとめるための、きれいな作業場所を用意します。

→ ワークスペースを設定

ステップ2：重要シナリオを定義する

最初に意図する scope をもとに、Copilot に最初の重要シナリオを作らせます。Agent が答えるべき core question だけでなく、boundary と out-of-scope の質問も含めます。

→ 検証済みシナリオ

ステップ3：最初の草案を作ってデバッグする

Copilot を使って customer service Agent の初版を作ります。Knowledge base はできるだけ小さくし、最初の重要シナリオに必要なものだけを入れます。

Live Test は草案を素早くデバッグするために使います。release gate としては扱いません。

→ 最初のバージョンを作る

→ 最初の草案を作ってデバッグ

ステップ4：`Test Suite` でシナリオを検証する

最初の scenario set を再実行できる case にし、すぐに 20 から 30 件を実行します。Copilot と一緒に各 AI response を Standard と照らし、pass しない case を見つけ、重要 case が安定するまで草案を修正します。

→ 検証済みシナリオ

ステップ5：安定した scope を公開する

最初の検証済み scope が安定してから、Agent と Web channel を公開します。first version の範囲外の質問は、拒否、human handoff、または form への誘導にします。

→ 安定した範囲を公開

ステップ6：フィードバックを見て scope を広げる

Histories で実際のユーザーが何を聞いたかを見直します。first version が out-of-scope question を拒否または handoff した場合でも、その質問は次に広げるべき scope を見つける材料になります。

→ フィードバックを見て範囲を広げる

次のステップ

最初の検証済み launch loop が終わったら、次に進めます。

データの接続は、失敗した case が knowledge gap を示したときに使う
Web チャネルでホスト型 channel の公開フローを詳しく学ぶ
検証済みシナリオで、広げる前に Agent behavior を制御する
評価と改善で再現可能な安全確認の仕組みを作る