Modes de reflexion
Activez la reflexion etendue pour que l'IA raisonne etape par etape avant de repondre aux taches complexes
La reflexion etendue permet a l'IA de raisonner etape par etape sur un probleme avant de repondre. Pour les taches complexes multi-etapes sur les serveurs, cela produit des plans significativement meilleurs et moins d'erreurs. Pour les requetes simples, vous pouvez la desactiver pour obtenir des reponses plus rapides.
Comment ca fonctionne
Lorsque le mode de reflexion est active, l'IA effectue une passe de raisonnement interne avant de generer sa reponse. Vous verrez un bref indicateur "reflexion en cours" pendant ce temps. Le resultat est un plan plus soigneusement reflechi qui prend en compte les dependances, les cas limites et les pieges potentiels.
Par exemple, lorsqu'on lui demande de "migrer la base de donnees vers un nouveau serveur", un modele avec reflexion etendue considerera :
- Quel moteur de base de donnees est en cours d'execution
- Comment creer une sauvegarde coherente
- La connectivite reseau entre les serveurs
- S'il faut arreter l'application pendant la migration
- Comment verifier l'integrite des donnees apres le transfert
- Comment mettre a jour la configuration de l'application pour pointer vers le nouveau serveur
Sans reflexion, l'IA pourrait passer directement a une commande pg_dump sans verifier ces prerequis.
Niveaux de reflexion
YeePilot supporte cinq niveaux de reflexion :
| Niveau | Description | Utilisation de tokens | Ideal pour |
|---|---|---|---|
off | Pas de reflexion etendue | La plus basse | Requetes simples, verifications d'etat |
on | Reflexion par defaut activee | Moderee | Taches generales |
low | Passe de raisonnement legere | Basse-moderee | Taches multi-etapes simples |
medium | Raisonnement approfondi | Moderee-haute | Depannage complexe, migrations |
high | Raisonnement profond | La plus haute | Operations critiques, decisions d'architecture |
Definir le mode de reflexion
En session avec /think
Changez de mode de reflexion pendant une session interactive :
/think # Afficher le mode de reflexion actuel
/think off # Desactiver la reflexion etendue
/think on # Activer la reflexion par defaut
/think low # Raisonnement leger
/think medium # Raisonnement approfondi
/think high # Raisonnement profondLe changement s'applique immediatement aux requetes suivantes dans la meme session.
Via la configuration
Definissez un mode de reflexion par defaut dans ~/.yeepilot/config.yaml :
ai:
think_mode: mediumCela s'applique a toutes les nouvelles sessions sauf remplacement avec /think pendant la session.
Support par fournisseur
La reflexion etendue est supportee par les fournisseurs qui offrent des capacites de raisonnement :
- Anthropic -- Les modeles Claude supportent la reflexion nativement avec un budget configurable
- OpenAI -- Les modeles GPT supportent le raisonnement avec des niveaux de reflexion compatibles
Si votre fournisseur ou modele actuel ne supporte pas un niveau de reflexion particulier, YeePilot bascule gracieusement vers le niveau supporte le plus proche.
Recommandations pratiques
Utiliser off pour les taches simples
Lorsque vous effectuez des verifications d'etat rapides ou des commandes simples, la reflexion ajoute de la latence sans grand benefice :
> Quelle est l'utilisation actuelle du CPU ?
> Montre-moi les 20 dernieres lignes du journal d'erreurs nginx
> Combien d'espace disque est libre ?Utiliser medium pour les taches complexes
Pour les operations multi-etapes ou l'ordre d'execution est important, la reflexion medium offre un bon equilibre entre qualite et vitesse :
> Configurer un reverse proxy avec nginx pour mon application Node.js sur le port 3000 avec SSL
> Diagnostiquer pourquoi le retard de replication PostgreSQL ne cesse d'augmenter
> Configurer fail2ban pour proteger SSH, nginx et postfixUtiliser high pour les operations critiques
Reservez la reflexion high pour les operations ou les erreurs sont couteuses ou difficiles a inverser :
> Planifier une migration sans temps d'arret de MySQL 5.7 vers MySQL 8.0
> Auditer les regles de pare-feu et recommander des changements pour la conformite PCI
> Repenser la strategie de sauvegarde pour un cluster de base de donnees a 3 noeudsMode de reflexion et utilisation des tokens
Les niveaux de reflexion superieurs consomment plus de tokens par interaction. Voici un guide approximatif pour vous aider a budgetiser :
| Niveau de reflexion | Surcout approximatif |
|---|---|
off | Pas de tokens supplementaires |
on / low | ~20-40 % de tokens en plus |
medium | ~50-80 % de tokens en plus |
high | ~100-150 % de tokens en plus |
L'utilisation reelle depend de la complexite de votre requete et du modele. Combinez les modes de reflexion avec le mode economique de tokens (/tokenmode saver) pour compenser les couts lorsque vous voulez un raisonnement approfondi mais n'avez pas besoin d'une sortie de commande resumee par l'IA.
Exemple : avec et sans reflexion
Sans reflexion (/think off) :
> Configurer des sauvegardes automatisees pour PostgreSQL
Je vais configurer une tache cron pour pg_dump :
sudo -u postgres pg_dump mydb > /backups/mydb.backupAvec reflexion (/think medium) :
> Configurer des sauvegardes automatisees pour PostgreSQL
Laissez-moi planifier une strategie de sauvegarde robuste :
1. Creer le repertoire de sauvegarde avec les bonnes permissions
2. Utiliser pg_dump avec le format personnalise pour la compression et la restauration selective
3. Ajouter une tache cron executee tous les jours a 2h
4. Inclure la rotation des sauvegardes pour garder les 7 dernieres quotidiennes et 4 hebdomadaires
5. Ajouter une etape de verification qui controle l'integrite de la sauvegarde
6. Configurer une alerte e-mail simple en cas d'echec d'une sauvegarde
Souhaitez-vous que je procede avec ce plan ?Le mode de reflexion produit une approche plus complete et prete pour la production.