Modos de pensamiento
Active el pensamiento extendido para que la IA razone paso a paso antes de responder a tareas complejas
El pensamiento extendido permite a la IA razonar a traves de un problema paso a paso antes de responder. Para tareas complejas de multiples pasos en servidores, esto produce planes significativamente mejores y menos errores. Para consultas simples, puede desactivarlo para obtener respuestas mas rapidas.
Como funciona
Cuando el modo de pensamiento esta habilitado, la IA realiza un paso de razonamiento interno antes de generar su respuesta. Vera un breve indicador de "thinking" mientras esto sucede. El resultado es un plan mas cuidadosamente considerado que tiene en cuenta dependencias, casos extremos y posibles problemas.
Por ejemplo, cuando se le pide "migrate the database to a new server", un modelo con pensamiento extendido considerara:
- Que motor de base de datos esta ejecutandose
- Como crear una copia de seguridad consistente
- Conectividad de red entre servidores
- Si detener la aplicacion durante la migracion
- Como verificar la integridad de los datos despues de la transferencia
- Como actualizar la configuracion de la aplicacion para apuntar al nuevo servidor
Sin pensamiento, la IA podria saltar directamente a un comando pg_dump sin verificar estos prerrequisitos.
Niveles de pensamiento
YeePilot soporta cinco niveles de pensamiento:
| Nivel | Descripcion | Uso de tokens | Mejor para |
|---|---|---|---|
off | Sin pensamiento extendido | Mas bajo | Consultas simples, verificaciones de estado |
on | Pensamiento predeterminado habilitado | Moderado | Tareas generales |
low | Paso de razonamiento ligero | Bajo-moderado | Tareas directas de multiples pasos |
medium | Razonamiento exhaustivo | Moderado-alto | Solucion de problemas complejos, migraciones |
high | Razonamiento profundo | Mas alto | Operaciones criticas, decisiones de arquitectura |
Configurar el modo de pensamiento
En sesion con /think
Cambie los modos de pensamiento durante una sesion interactiva:
/think # Mostrar modo de pensamiento actual
/think off # Desactivar pensamiento extendido
/think on # Activar pensamiento predeterminado
/think low # Razonamiento ligero
/think medium # Razonamiento exhaustivo
/think high # Razonamiento profundoEl cambio se aplica inmediatamente a los prompts subsiguientes en la misma sesion.
Via configuracion
Establezca un modo de pensamiento predeterminado en ~/.yeepilot/config.yaml:
ai:
think_mode: mediumEsto se aplica a todas las sesiones nuevas a menos que se anule con /think durante la sesion.
Soporte por proveedor
El pensamiento extendido es compatible con proveedores que ofrecen capacidades de razonamiento o pensamiento:
- Anthropic -- Los modelos Claude soportan pensamiento de forma nativa con presupuesto configurable
- OpenAI -- Los modelos GPT soportan razonamiento con niveles de pensamiento compatibles
Si su proveedor o modelo actual no soporta un nivel de pensamiento particular, YeePilot retrocede graciosamente al nivel compatible mas cercano.
Recomendaciones practicas
Use off para tareas simples
Cuando ejecuta verificaciones rapidas de estado o comandos simples, el pensamiento agrega latencia sin mucho beneficio:
> What's the current CPU usage?
> Show me the last 20 lines of the nginx error log
> How much disk space is free?Use medium para tareas complejas
Para operaciones de multiples pasos donde acertar la secuencia importa, el pensamiento medium proporciona un fuerte equilibrio entre calidad y velocidad:
> Set up a reverse proxy with nginx for my Node.js app on port 3000 with SSL
> Diagnose why the PostgreSQL replication lag keeps increasing
> Configure fail2ban to protect SSH, nginx, and postfixUse high para operaciones criticas
Reserve el pensamiento high para operaciones donde los errores son costosos o dificiles de revertir:
> Plan a zero-downtime migration from MySQL 5.7 to MySQL 8.0
> Audit the firewall rules and recommend changes for PCI compliance
> Redesign the backup strategy for a 3-node database clusterModo de pensamiento y uso de tokens
Los niveles de pensamiento mas altos consumen mas tokens por interaccion. Aqui hay una guia aproximada para ayudarle a presupuestar:
| Nivel de pensamiento | Sobrecarga aproximada |
|---|---|
off | Sin tokens adicionales |
on / low | ~20-40% mas tokens |
medium | ~50-80% mas tokens |
high | ~100-150% mas tokens |
El uso real depende de la complejidad de su prompt y el modelo. Combine los modos de pensamiento con el modo de ahorro de tokens (/tokenmode saver) para compensar los costos cuando desee razonamiento profundo pero no necesite salida de comandos resumida por IA.
Ejemplo: Con y sin pensamiento
Sin pensamiento (/think off):
> Set up automated backups for PostgreSQL
I'll set up a cron job for pg_dump:
sudo -u postgres pg_dump mydb > /backups/mydb.backupCon pensamiento (/think medium):
> Set up automated backups for PostgreSQL
Let me plan a robust backup strategy:
1. Create backup directory with proper permissions
2. Use pg_dump with custom format for compression and selective restore
3. Add a cron job running at 2 AM daily
4. Include backup rotation to keep the last 7 daily and 4 weekly backups
5. Add a verification step that checks backup integrity
6. Set up a simple email alert if a backup fails
Shall I proceed with this plan?El modo de pensamiento produce un enfoque mas completo y listo para produccion.