Saltar al contenido principal

Chain of Thought (CoT) Prompting

El Chain of Thought Prompting DEBE implementarse como un proceso estructurado de razonamiento paso a paso que obliga al modelo a exponer su proceso de pensamiento antes de llegar a una conclusión. Todo prompt DEBE incluir una instrucción explícita de razonamiento secuencial y DEBE estructurar la respuesta en pasos numerados.

Ejemplos

✅ Ejemplo Correcto

Objetivo del Prompt

Resolver un problema matemático mostrando el razonamiento paso a paso antes de dar la respuesta final.

Parámetros Recomendados

  • Temperature: 0.5
  • Top-K: 20
  • Top-P: 0.8
  • Token Limit: 50

Prompt

Pregunta: Si tengo 3 manzanas y compro 2 más, ¿cuántas manzanas tengo en total?

Instrucciones:
1. Analiza el problema paso a paso
2. Explica tu razonamiento en cada paso
3. Verifica la lógica de cada paso
4. Llega a una conclusión basada en el análisis

Resolución paso a paso:

Output

Paso 1: Inicialmente tengo 3 manzanas.
Paso 2: Compro 2 manzanas más.
Paso 3: Sumo 3 + 2 = 5.
Conclusión: Tengo 5 manzanas en total.

❌ Ejemplo Incorrecto

Objetivo del Prompt

Resolver un problema matemático, pero sin pedir razonamiento ni pasos intermedios.

Parámetros Recomendados

  • Temperature: 0.5
  • Top-K: 20
  • Top-P: 0.8
  • Token Limit: 50

Prompt

Responde a esta pregunta: Si tengo 3 manzanas y compro 2 más, ¿cuántas manzanas tengo en total?

Output

5

Justificación

La implementación consistente de Chain of Thought es necesaria porque:

  1. Mejora la precisión en tareas que requieren razonamiento lógico
  2. Hace el proceso de decisión más transparente y verificable
  3. Reduce errores por atajos heurísticos
  4. Facilita la depuración y validación de respuestas

Reglas de Uso

1. Estructura del Prompt

  • DEBE incluir la instrucción "Pensemos paso a paso"
  • DEBE solicitar explícitamente el razonamiento intermedio
  • DEBE estructurar la respuesta en pasos numerados
  • DEBE incluir verificación de cada paso

2. Proceso de Razonamiento

  • DEBE descomponer el problema en subpasos
  • DEBE justificar cada inferencia
  • DEBE verificar la consistencia lógica
  • DEBE llegar a una conclusión basada en el análisis

3. Validación

  • DEBE verificar la coherencia entre pasos
  • DEBE comprobar la validez de las premisas
  • DEBE asegurar que la conclusión se deriva lógicamente
  • DEBE incluir contraejemplos cuando sea relevante

Cuándo Aplicar

  1. Resolución de problemas matemáticos
  2. Análisis lógico y deducción
  3. Toma de decisiones complejas
  4. Evaluación de argumentos
  5. Resolución de problemas de múltiples pasos

Cuándo Evitar

  1. Tareas que requieren respuesta inmediata
  2. Procesamiento de lenguaje natural simple
  3. Clasificación básica sin justificación
  4. Tareas que no requieren razonamiento explícito

Métricas de Calidad

MétricaDescripciónUmbral Mínimo
CoherenciaConsistencia entre pasos100%
CompletitudPasos necesarios incluidos≥ 90%
PrecisiónExactitud de conclusiones≥ 95%
ClaridadLegibilidad del razonamiento≥ 85%

Implementación Recomendada

class ChainOfThoughtSystem:
def __init__(self, config):
self.step_validator = config.validator
self.reasoning_checker = config.checker
self.conclusion_verifier = config.verifier

def generate_reasoning(self, question):
return self._structure_reasoning(question)

def validate_steps(self, steps):
return self._verify_step_sequence(steps)

def verify_conclusion(self, reasoning, conclusion):
return self._check_conclusion_validity(reasoning, conclusion)

Referencias Técnicas

  • Modelos de razonamiento: GPT-4, Claude
  • Frameworks de validación: Minerva, PaLM
  • Métricas de evaluación: ROUGE, BLEU
  • Herramientas de análisis: Prover9, Z3