コンテンツにスキップ

LLMモデル選択

モデル選択は重要ですが、多くの場合はフローが明確になってから効いてきます。ほとんどの運用担当者にとって最初にすべきことは、まずデフォルトモデルでテストし、失敗の原因がはっきりしてから切り替えることです。

LLM model dropdown

まずはデフォルトモデルから始める

Consultation Desk のような Agent では、第一版はワークスペースのデフォルト、またはバランス型のモデルに留めるのが普通です。最初は挙動そのものに集中してください。

  • Agent は確認質問をしているか
  • 次の一歩を一つだけ選んでいるか
  • Instructions に書いた境界を守っているか

この基本が崩れているなら、モデル変更はたいてい最初の修正ではありません。

理由を説明できる時だけ切り替える

繰り返しのテストで次のような問題が見えた時にだけ、モデル変更を検討します。

観測された問題 試す方向
この種のフロントドア会話には遅すぎる より速いモデルを試す
ニュアンスを外し、振り分け判断が弱い より強い推論モデルを試す
目的の言語で不自然な言い回しになる その用途で言語品質が高いモデルを試す

利用できるモデルはワークスペースによって異なるため、あなたのドロップダウンはこのスクリーンショットと完全には一致しない場合があります。

安全にモデル比較する方法

比較する時は、条件を固定してください。

  1. 毎回同じ 3 から 5 個の prompt を使う。
  2. 変えるのはモデルだけにする。
  3. 何が良くなり、何が悪くなったかを記録する。
  4. 結果を Apply と分かりやすいノートで保存する。

そうしないと、本当にモデルが問題を解決したのか分かりません。

Consultation Desk での実用基準

Consultation Desk のような振り分け型 Agent では、次の失敗が見えた時だけモデル変更を検討する価値があります。

  • 確認フローを安定して守れない
  • 曖昧なケースでの推薦が弱い
  • 対象言語で簡潔かつ専門的なトーンを保てない

デフォルトモデルで正しい判断ができているなら、より強いモデルが存在するだけで切り替える必要はありません。

以前のモデルが使えなくなったら

以前使っていたモデルがドロップダウンから消えていたら、最も近い代替モデルを選び、再公開の前にコアテストをもう一度通してください。

Copilot のモデル提案は出発点として使う

第一版を作る時、Copilot はツール利用の有無、推論の重さ、応答速度、トーン品質などを見て、最初のモデル候補を提案することがあります。これは有用ですが、あくまで出発点です。公開前には同じテスト prompt で必ず検証してください。

次のステップ