思考モード
拡張思考を有効にして、AIが複雑なタスクに応答する前にステップバイステップで推論するようにします
拡張思考により、AIは応答を生成する前に問題をステップバイステップで推論できます。複雑なマルチステップのサーバータスクでは、これにより大幅に優れたプランが生成され、ミスが減ります。単純なクエリでは、オフにしてより高速な応答を得ることもできます。
動作の仕組み
思考モードが有効な場合、AIは応答を生成する前に内部で推論パスを実行します。この間、短い「thinking」インジケーターが表示されます。結果として、依存関係、エッジケース、潜在的な落とし穴を考慮した、より慎重に検討されたプランが生成されます。
例えば、「migrate the database to a new server」を依頼された場合、拡張思考を持つモデルは以下を考慮します:
- 実行中のデータベースエンジンの種類
- 一貫したバックアップの作成方法
- サーバー間のネットワーク接続性
- 移行中にアプリケーションを停止すべきか
- 転送後のデータ整合性の検証方法
- 新しいサーバーを指すようにアプリケーション設定を更新する方法
思考なしでは、AIはこれらの前提条件を確認せずに pg_dump コマンドに直接ジャンプする可能性があります。
思考レベル
YeePilotは5つの思考レベルをサポートしています:
| レベル | 説明 | トークン使用量 | 適した用途 |
|---|---|---|---|
off | 拡張思考なし | 最小 | 単純なクエリ、ステータス確認 |
on | デフォルトの思考を有効化 | 中程度 | 一般的なタスク |
low | 軽い推論パス | やや少〜中程度 | 単純なマルチステップタスク |
medium | 徹底的な推論 | やや多〜多い | 複雑なトラブルシューティング、移行 |
high | 深い推論 | 最大 | 重要な操作、アーキテクチャの決定 |
思考モードの設定
セッション中に /think を使用
インタラクティブセッション中に思考モードを切り替えます:
/think # 現在の思考モードを表示
/think off # 拡張思考を無効化
/think on # デフォルトの思考を有効化
/think low # 軽い推論
/think medium # 徹底的な推論
/think high # 深い推論変更は同じセッション内の以降のプロンプトに即座に適用されます。
設定による変更
~/.yeepilot/config.yaml でデフォルトの思考モードを設定します:
ai:
think_mode: mediumセッション中に /think でオーバーライドしない限り、すべての新しいセッションに適用されます。
プロバイダーサポート
拡張思考は、推論や思考機能を提供するプロバイダーでサポートされています:
- Anthropic -- Claudeモデルは設定可能なバジェットでネイティブに思考をサポート
- OpenAI -- GPTモデルは互換性のある思考レベルで推論をサポート
現在のプロバイダーまたはモデルが特定の思考レベルをサポートしていない場合、YeePilotはサポートされている最も近いレベルにグレースフルにフォールバックします。
実践的な推奨事項
単純なタスクには off を使用
クイックなステータス確認や単純なコマンドを実行する場合、思考は大きなメリットなくレイテンシーを追加します:
> What's the current CPU usage?
> Show me the last 20 lines of the nginx error log
> How much disk space is free?複雑なタスクには medium を使用
手順の正確さが重要なマルチステップ操作では、mediumの思考が品質と速度の強力なバランスを提供します:
> Set up a reverse proxy with nginx for my Node.js app on port 3000 with SSL
> Diagnose why the PostgreSQL replication lag keeps increasing
> Configure fail2ban to protect SSH, nginx, and postfix重要な操作には high を使用
ミスがコストがかかるか、元に戻すのが難しい操作にはhighの思考を予約します:
> Plan a zero-downtime migration from MySQL 5.7 to MySQL 8.0
> Audit the firewall rules and recommend changes for PCI compliance
> Redesign the backup strategy for a 3-node database cluster思考モードとトークン使用量
より高い思考レベルはインタラクションごとにより多くのトークンを消費します。予算の参考となるおおよそのガイドは以下の通りです:
| 思考レベル | おおよそのオーバーヘッド |
|---|---|
off | 追加トークンなし |
on / low | 約20〜40%増加 |
medium | 約50〜80%増加 |
high | 約100〜150%増加 |
実際の使用量はプロンプトの複雑さとモデルによって異なります。深い推論は必要だがAI要約のコマンド出力は不要な場合、思考モードとトークンセーバーモード(/tokenmode saver)を組み合わせてコストを相殺できます。
例:思考あり・なしの比較
思考なし(/think off):
> Set up automated backups for PostgreSQL
I'll set up a cron job for pg_dump:
sudo -u postgres pg_dump mydb > /backups/mydb.backup思考あり(/think medium):
> Set up automated backups for PostgreSQL
Let me plan a robust backup strategy:
1. Create backup directory with proper permissions
2. Use pg_dump with custom format for compression and selective restore
3. Add a cron job running at 2 AM daily
4. Include backup rotation to keep the last 7 daily and 4 weekly backups
5. Add a verification step that checks backup integrity
6. Set up a simple email alert if a backup fails
Shall I proceed with this plan?思考モードにより、より徹底的で本番環境向けのアプローチが生成されます。