LLMモデル選択
モデル選択は重要ですが、多くの場合はフローが明確になってから効いてきます。ほとんどの運用担当者にとって最初にすべきことは、まずデフォルトモデルでテストし、失敗の原因がはっきりしてから切り替えることです。

まずはデフォルトモデルから始める
Consultation Desk のような Agent では、第一版はワークスペースのデフォルト、またはバランス型のモデルに留めるのが普通です。最初は挙動そのものに集中してください。
- Agent は確認質問をしているか
- 次の一歩を一つだけ選んでいるか
- Instructions に書いた境界を守っているか
この基本が崩れているなら、モデル変更はたいてい最初の修正ではありません。
理由を説明できる時だけ切り替える
繰り返しのテストで次のような問題が見えた時にだけ、モデル変更を検討します。
| 観測された問題 | 試す方向 |
|---|---|
| この種のフロントドア会話には遅すぎる | より速いモデルを試す |
| ニュアンスを外し、振り分け判断が弱い | より強い推論モデルを試す |
| 目的の言語で不自然な言い回しになる | その用途で言語品質が高いモデルを試す |
利用できるモデルはワークスペースによって異なるため、あなたのドロップダウンはこのスクリーンショットと完全には一致しない場合があります。
安全にモデル比較する方法
比較する時は、条件を固定してください。
- 毎回同じ 3 から 5 個の prompt を使う。
- 変えるのはモデルだけにする。
- 何が良くなり、何が悪くなったかを記録する。
- 結果を
Applyと分かりやすいノートで保存する。
そうしないと、本当にモデルが問題を解決したのか分かりません。
Consultation Desk での実用基準
Consultation Desk のような振り分け型 Agent では、次の失敗が見えた時だけモデル変更を検討する価値があります。
- 確認フローを安定して守れない
- 曖昧なケースでの推薦が弱い
- 対象言語で簡潔かつ専門的なトーンを保てない
デフォルトモデルで正しい判断ができているなら、より強いモデルが存在するだけで切り替える必要はありません。
以前のモデルが使えなくなったら
以前使っていたモデルがドロップダウンから消えていたら、最も近い代替モデルを選び、再公開の前にコアテストをもう一度通してください。
Copilot のモデル提案は出発点として使う
第一版を作る時、Copilot はツール利用の有無、推論の重さ、応答速度、トーン品質などを見て、最初のモデル候補を提案することがあります。これは有用ですが、あくまで出発点です。公開前には同じテスト prompt で必ず検証してください。
次のステップ
- Version Management でモデル変更を安全に保存する
- Attachments で問題が資料不足ではないか確認する
- Agent Editor で
Live Testを続ける