DocsAIプロバイダーモデル選択とトークンモード
ドキュメントに戻る
AIプロバイダー

モデル選択とトークンモード

AIモデルの選択と切り替え、フェイルオーバーの設定、ノーマルモードとセーバーモードによるトークン使用量の管理

最終更新: 2026年3月1日

YeePilotでは、セッションを駆動するAIモデルを選択できます。設定でデフォルトモデルを設定したり、コマンドごとにオーバーライドしたり、インタラクティブセッション中にモデルをオンザフライで切り替えたりできます。トークンモードと組み合わせることで、AI能力とトークン使用量のバランスを完全に制御できます。

モデルの確認と変更

セッション中に /model を使用

インタラクティブセッション中に /model スラッシュコマンドを使用して、現在のモデルを確認するか別のモデルに切り替えます:

plaintext
/model                          # 現在のモデルとプロバイダーを表示
/model gpt-4o                   # GPT-4oに切り替え
/model claude-sonnet-4-20250514 # Claude Sonnet 4に切り替え

変更はセッションの残りに即座に反映されます。

設定による変更

~/.yeepilot/config.yaml でデフォルトモデルを設定します:

yaml
ai:
  provider: openai
  model: gpt-4o

このモデルは、別のモデルを指定せずに新しいYeePilotセッションを開始するたびに使用されます。

コマンドごとのオーバーライド

--model フラグを使用して、単一のコマンドのモデルをオーバーライドします:

bash
yeepilot exec --model claude-sonnet-4-20250514 "analyze disk usage and suggest cleanup"

デフォルト設定を変更せずに、指定したモデルでタスクが実行されます。

プロバイダー固有のモデルID

各プロバイダーは独自のモデル識別子形式を使用しています。よく使用されるモデルは以下の通りです:

OpenRouter

plaintext
openai/gpt-oss-120b:free       # 無料枠(デフォルト)
openai/gpt-4o                   # OpenRouter経由のGPT-4o
anthropic/claude-sonnet-4-20250514  # OpenRouter経由のClaude
meta-llama/llama-3-70b           # Llama 3 70B

OpenRouterは各種ラボの100以上のモデルにアクセスできます。全リストは openrouter.ai/models (opens in new tab) で確認できます。

OpenAI

plaintext
gpt-4o                          # GPT-4o(デフォルト)
gpt-4                           # GPT-4
gpt-4o-mini                     # GPT-4o Mini(高速・低コスト)

Anthropic

plaintext
claude-sonnet-4-20250514        # Claude Sonnet 4(デフォルト)
claude-opus-4-20250514          # Claude Opus 4

フェイルオーバーの設定

フェイルオーバーシステムは複数のプロバイダーバックエンドをラップし、プロバイダーがダウンしてもYeePilotが動作し続けるようにします。プライマリプロバイダーが失敗すると、YeePilotはリスト内の次のプロバイダーを自動的に試行します。

yaml
ai:
  provider: anthropic
  model: claude-sonnet-4-20250514
  api_key: sk-ant-...
  failover:
    - provider: openai
      model: gpt-4o
      api_key: sk-...
    - provider: openrouter
      model: openai/gpt-oss-120b:free
      api_key: sk-or-...

主要なフェイルオーバーの動作:

  • クールダウン期間 -- 失敗したプロバイダーは繰り返しエラーを防ぐため一時的にローテーションから外される
  • 自動回復 -- クールダウン期間が過ぎるとプロバイダーはローテーションに再参入
  • 透過的な切り替え -- フェイルオーバーはバックグラウンドで行われ、セッションは中断されない

トークンモード

YeePilotは2つのトークンモードを提供し、コマンド出力の処理方法を制御できます。AI強化されたサマリーと効率性のトレードオフを選択できます。

ノーマルモード(デフォルト)

ノーマルモードでは、AIがコマンド出力を要約してから提示します。コマンドが冗長な出力を生成し、AIに重要な部分を強調してほしい場合に便利です。

plaintext
> Check all listening ports and summarize what services are running
 
Running: ss -tlnp
[AI Summary] Found 7 listening services:
  - nginx on ports 80 and 443
  - PostgreSQL on port 5432
  - Redis on port 6379
  - SSH on port 22
  ...

セーバーモード

セーバーモードでは、AIの要約なしにコマンド出力が直接表示されます。トークン使用量が少なく、生の出力を確認したい単純なコマンドに最適です。

plaintext
> Show disk usage
 
Running: df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda1       100G   45G   55G  45% /
/dev/sdb1       500G  200G  300G  40% /data
tmpfs           7.8G  1.2M  7.8G   1% /run

トークンモードの切り替え

セッション中に /tokenmode スラッシュコマンドを使用します:

plaintext
/tokenmode              # 現在のモードを表示
/tokenmode normal       # ノーマルに切り替え(AI要約出力)
/tokenmode saver        # セーバーに切り替え(生出力、トークン節約)

または設定で指定します:

yaml
ai:
  token_mode: normal    # normalまたはsaver

各モードの使い分け

シナリオ推奨モード
複雑な診断タスクnormal
簡単なステータス確認saver
コマンドの動作を学習中normal
馴染みのあるコマンドを実行saver
APIトークン使用量を節約saver
マルチステップのトラブルシューティングnormal