Chain of Thought (CoT) Prompting
El Chain of Thought Prompting DEBE implementarse como un proceso estructurado de razonamiento paso a paso que obliga al modelo a exponer su proceso de pensamiento antes de llegar a una conclusión. Todo prompt DEBE incluir una instrucción explícita de razonamiento secuencial y DEBE estructurar la respuesta en pasos numerados.
Ejemplos
✅ Ejemplo Correcto
Objetivo del Prompt
Resolver un problema matemático mostrando el razonamiento paso a paso antes de dar la respuesta final.
Parámetros Recomendados
- Temperature: 0.5
- Top-K: 20
- Top-P: 0.8
- Token Limit: 50
Prompt
Pregunta: Si tengo 3 manzanas y compro 2 más, ¿cuántas manzanas tengo en total?
Instrucciones:
1. Analiza el problema paso a paso
2. Explica tu razonamiento en cada paso
3. Verifica la lógica de cada paso
4. Llega a una conclusión basada en el análisis
Resolución paso a paso:
Output
Paso 1: Inicialmente tengo 3 manzanas.
Paso 2: Compro 2 manzanas más.
Paso 3: Sumo 3 + 2 = 5.
Conclusión: Tengo 5 manzanas en total.
❌ Ejemplo Incorrecto
Objetivo del Prompt
Resolver un problema matemático, pero sin pedir razonamiento ni pasos intermedios.
Parámetros Recomendados
- Temperature: 0.5
- Top-K: 20
- Top-P: 0.8
- Token Limit: 50
Prompt
Responde a esta pregunta: Si tengo 3 manzanas y compro 2 más, ¿cuántas manzanas tengo en total?
Output
5
Justificación
La implementación consistente de Chain of Thought es necesaria porque:
- Mejora la precisión en tareas que requieren razonamiento lógico
- Hace el proceso de decisión más transparente y verificable
- Reduce errores por atajos heurísticos
- Facilita la depuración y validación de respuestas
Reglas de Uso
1. Estructura del Prompt
- DEBE incluir la instrucción "Pensemos paso a paso"
- DEBE solicitar explícitamente el razonamiento intermedio
- DEBE estructurar la respuesta en pasos numerados
- DEBE incluir verificación de cada paso
2. Proceso de Razonamiento
- DEBE descomponer el problema en subpasos
- DEBE justificar cada inferencia
- DEBE verificar la consistencia lógica
- DEBE llegar a una conclusión basada en el análisis
3. Validación
- DEBE verificar la coherencia entre pasos
- DEBE comprobar la validez de las premisas
- DEBE asegurar que la conclusión se deriva lógicamente
- DEBE incluir contraejemplos cuando sea relevante
Cuándo Aplicar
- Resolución de problemas matemáticos
- Análisis lógico y deducción
- Toma de decisiones complejas
- Evaluación de argumentos
- Resolución de problemas de múltiples pasos
Cuándo Evitar
- Tareas que requieren respuesta inmediata
- Procesamiento de lenguaje natural simple
- Clasificación básica sin justificación
- Tareas que no requieren razonamiento explícito
Métricas de Calidad
| Métrica | Descripción | Umbral Mínimo |
|---|---|---|
| Coherencia | Consistencia entre pasos | 100% |
| Completitud | Pasos necesarios incluidos | ≥ 90% |
| Precisión | Exactitud de conclusiones | ≥ 95% |
| Claridad | Legibilidad del razonamiento | ≥ 85% |
Implementación Recomendada
class ChainOfThoughtSystem:
def __init__(self, config):
self.step_validator = config.validator
self.reasoning_checker = config.checker
self.conclusion_verifier = config.verifier
def generate_reasoning(self, question):
return self._structure_reasoning(question)
def validate_steps(self, steps):
return self._verify_step_sequence(steps)
def verify_conclusion(self, reasoning, conclusion):
return self._check_conclusion_validity(reasoning, conclusion)
Referencias Técnicas
- Modelos de razonamiento: GPT-4, Claude
- Frameworks de validación: Minerva, PaLM
- Métricas de evaluación: ROUGE, BLEU
- Herramientas de análisis: Prover9, Z3