Fiabilidad - Agents Studio Docs

Objetivos
Patrones recomendados
1) Prompts y Tools bien definidos
2) Validación previa a acciones críticas
3) Recuperación de conocimiento segura
4) Fallbacks y escalamiento
5) Voz y telefonía
Señales de confianza y verificación
Manejo de errores de API
Observabilidad y aprendizaje
Pruebas y evals
Configuración sugerida
Checklists
Antes de producción
En producción
Recursos

Esta guía está ajustada a Agents Studio y resume patrones prácticos para minimizar respuestas incorrectas (“wrong response”), mejorar la precisión y proteger acciones sensibles.

Objetivos

Reducir respuestas incorrectas o alucinadas.
Evitar acciones no deseadas en Tools/APIs.
Escalar a humano cuando sea necesario.
Mantener trazabilidad y aprendizaje continuo.

Patrones recomendados

1) Prompts y Tools bien definidos

Mantén un System Prompt claro: objetivo, límites, tono y cuándo decir “no sé”.
Restringe al asistente a un conjunto cerrado de intenciones y Tools permitidas.
Usa salidas estructuradas (JSON Schema) cuando el resultado deba validarse antes de ejecutar una acción.

2) Validación previa a acciones críticas

Aplica políticas: no ejecutar pagos/cambios sensibles sin confirmación.
Requiere doble confirmación o DTMF (en voz) para operaciones riesgosas.
Implementa lógicas de revisión (ej. verificación humana) por monto/impacto.

3) Recuperación de conocimiento segura

Usa retrieval o snippets autorizados; evita contenido ambiguo.
Versiona tu base de conocimiento y prueba regresiones tras cambios.

4) Fallbacks y escalamiento

Si la confianza es baja: pide aclaración o responde “No estoy seguro, ¿puedes reformular?”
Configura reglas de rechazo (mejor no responder que inventar).
Escala a humano con traspaso de contexto cuando corresponda.

5) Voz y telefonía

Maneja ASR (errores de reconocimiento): confirma datos críticos (nombres, números).
Usa DTMF para confirmar/ingresar dígitos sensibles.
Define pausas/timeout, barge-in y política de repetición (máx. intentos antes de cerrar o escalar).

Señales de confianza y verificación

Valida schemas de salidas del asistente antes de llamar Tools.
Aplica listas blancas/regex para campos estructurados (p. ej., email, fechas, montos).
Calcula un score de confianza (heurístico o del modelo) y usa umbrales para decidir: responder, pedir aclaración o escalar.

Manejo de errores de API

400: entrada inválida u horario fuera de servicio → informa y ofrece alternativas.
401: falta de credenciales → verifica tu X-API-Key (ver API reference → Keys).
429: límites de tasa → reintentos con backoff y límites de turnos.
5xx: fallback seguro + registro para investigación.
Webhooks: firma y reintentos (ver API reference → Notifications).

Observabilidad y aprendizaje

Registra eventos clave: entrada, Tools llamadas, salidas y decisiones de política.
Etiqueta conversaciones con resultado (éxito, rechazo, escalado) para análisis.
Reproduce casos problemáticos y mejora prompts, snippets o políticas.

Pruebas y evals

Define casos dorados (happy path) y anti-patrones (edge cases).
Automatiza regresiones al cambiar prompts, Tools o conocimiento.
Incluye datos ruidosos: acentos, errores ortográficos, audio con ruido.

Configuración sugerida

Timeouts por canal (chat/voz) y máx. turnos por sesión.
Límites por Tool y idempotencia en tu backend.
Políticas de horario de servicio y mensajes “no disponible”.

Checklists

Antes de producción

System Prompt revisado, intenciones y límites claros.
Validación de outputs (schema/regex) y confirmaciones críticas.
Fallbacks configurados (aclaración, rechazo, mano humana).
Tests de regresión y casos de ruido/voz.

En producción

Monitorea métricas: tasa de éxito, rechazos, escalados, 4xx/5xx.
Reentrena o ajusta prompts según hallazgos.
Revisión periódica de Knowledge y Tools.

Recursos

Autenticación por workspace: API reference → Keys.
Chat webhook, llamadas y notificaciones: API reference → Endpoints.

Navegación SLA Customer Support