Skip to main content
Esta guía está ajustada a Agents Studio y resume patrones prácticos para minimizar respuestas incorrectas (“wrong response”), mejorar la precisión y proteger acciones sensibles.

Objetivos

  • Reducir respuestas incorrectas o alucinadas.
  • Evitar acciones no deseadas en Tools/APIs.
  • Escalar a humano cuando sea necesario.
  • Mantener trazabilidad y aprendizaje continuo.

Patrones recomendados

1) Prompts y Tools bien definidos

  • Mantén un System Prompt claro: objetivo, límites, tono y cuándo decir “no sé”.
  • Restringe al asistente a un conjunto cerrado de intenciones y Tools permitidas.
  • Usa salidas estructuradas (JSON Schema) cuando el resultado deba validarse antes de ejecutar una acción.

2) Validación previa a acciones críticas

  • Aplica políticas: no ejecutar pagos/cambios sensibles sin confirmación.
  • Requiere doble confirmación o DTMF (en voz) para operaciones riesgosas.
  • Implementa lógicas de revisión (ej. verificación humana) por monto/impacto.

3) Recuperación de conocimiento segura

  • Usa retrieval o snippets autorizados; evita contenido ambiguo.
  • Versiona tu base de conocimiento y prueba regresiones tras cambios.

4) Fallbacks y escalamiento

  • Si la confianza es baja: pide aclaración o responde “No estoy seguro, ¿puedes reformular?”
  • Configura reglas de rechazo (mejor no responder que inventar).
  • Escala a humano con traspaso de contexto cuando corresponda.

5) Voz y telefonía

  • Maneja ASR (errores de reconocimiento): confirma datos críticos (nombres, números).
  • Usa DTMF para confirmar/ingresar dígitos sensibles.
  • Define pausas/timeout, barge-in y política de repetición (máx. intentos antes de cerrar o escalar).

Señales de confianza y verificación

  • Valida schemas de salidas del asistente antes de llamar Tools.
  • Aplica listas blancas/regex para campos estructurados (p. ej., email, fechas, montos).
  • Calcula un score de confianza (heurístico o del modelo) y usa umbrales para decidir: responder, pedir aclaración o escalar.

Manejo de errores de API

  • 400: entrada inválida u horario fuera de servicio → informa y ofrece alternativas.
  • 401: falta de credenciales → verifica tu X-API-Key (ver API reference → Keys).
  • 429: límites de tasa → reintentos con backoff y límites de turnos.
  • 5xx: fallback seguro + registro para investigación.
  • Webhooks: firma y reintentos (ver API reference → Notifications).

Observabilidad y aprendizaje

  • Registra eventos clave: entrada, Tools llamadas, salidas y decisiones de política.
  • Etiqueta conversaciones con resultado (éxito, rechazo, escalado) para análisis.
  • Reproduce casos problemáticos y mejora prompts, snippets o políticas.

Pruebas y evals

  • Define casos dorados (happy path) y anti-patrones (edge cases).
  • Automatiza regresiones al cambiar prompts, Tools o conocimiento.
  • Incluye datos ruidosos: acentos, errores ortográficos, audio con ruido.

Configuración sugerida

  • Timeouts por canal (chat/voz) y máx. turnos por sesión.
  • Límites por Tool y idempotencia en tu backend.
  • Políticas de horario de servicio y mensajes “no disponible”.

Checklists

Antes de producción

  • System Prompt revisado, intenciones y límites claros.
  • Validación de outputs (schema/regex) y confirmaciones críticas.
  • Fallbacks configurados (aclaración, rechazo, mano humana).
  • Tests de regresión y casos de ruido/voz.

En producción

  • Monitorea métricas: tasa de éxito, rechazos, escalados, 4xx/5xx.
  • Reentrena o ajusta prompts según hallazgos.
  • Revisión periódica de Knowledge y Tools.

Recursos

  • Autenticación por workspace: API reference → Keys.
  • Chat webhook, llamadas y notificaciones: API reference → Endpoints.