Esta guía está ajustada a Agents Studio y resume patrones prácticos para
minimizar respuestas incorrectas (“wrong response”), mejorar la precisión y
proteger acciones sensibles.
Objetivos
- Reducir respuestas incorrectas o alucinadas.
- Evitar acciones no deseadas en Tools/APIs.
- Escalar a humano cuando sea necesario.
- Mantener trazabilidad y aprendizaje continuo.
Patrones recomendados
1) Prompts y Tools bien definidos
- Mantén un System Prompt claro: objetivo, límites, tono y cuándo decir “no sé”.
- Restringe al asistente a un conjunto cerrado de intenciones y Tools permitidas.
- Usa salidas estructuradas (JSON Schema) cuando el resultado deba validarse antes de ejecutar una acción.
2) Validación previa a acciones críticas
- Aplica políticas: no ejecutar pagos/cambios sensibles sin confirmación.
- Requiere doble confirmación o DTMF (en voz) para operaciones riesgosas.
- Implementa lógicas de revisión (ej. verificación humana) por monto/impacto.
3) Recuperación de conocimiento segura
- Usa retrieval o snippets autorizados; evita contenido ambiguo.
- Versiona tu base de conocimiento y prueba regresiones tras cambios.
4) Fallbacks y escalamiento
- Si la confianza es baja: pide aclaración o responde “No estoy seguro, ¿puedes reformular?”
- Configura reglas de rechazo (mejor no responder que inventar).
- Escala a humano con traspaso de contexto cuando corresponda.
5) Voz y telefonía
- Maneja ASR (errores de reconocimiento): confirma datos críticos (nombres, números).
- Usa DTMF para confirmar/ingresar dígitos sensibles.
- Define pausas/timeout, barge-in y política de repetición (máx. intentos antes de cerrar o escalar).
Señales de confianza y verificación
- Valida schemas de salidas del asistente antes de llamar Tools.
- Aplica listas blancas/regex para campos estructurados (p. ej., email, fechas, montos).
- Calcula un score de confianza (heurístico o del modelo) y usa umbrales para decidir: responder, pedir aclaración o escalar.
Manejo de errores de API
- 400: entrada inválida u horario fuera de servicio → informa y ofrece alternativas.
- 401: falta de credenciales → verifica tu
X-API-Key(ver API reference → Keys). - 429: límites de tasa → reintentos con backoff y límites de turnos.
- 5xx: fallback seguro + registro para investigación.
- Webhooks: firma y reintentos (ver API reference → Notifications).
Observabilidad y aprendizaje
- Registra eventos clave: entrada, Tools llamadas, salidas y decisiones de política.
- Etiqueta conversaciones con resultado (éxito, rechazo, escalado) para análisis.
- Reproduce casos problemáticos y mejora prompts, snippets o políticas.
Pruebas y evals
- Define casos dorados (happy path) y anti-patrones (edge cases).
- Automatiza regresiones al cambiar prompts, Tools o conocimiento.
- Incluye datos ruidosos: acentos, errores ortográficos, audio con ruido.
Configuración sugerida
- Timeouts por canal (chat/voz) y máx. turnos por sesión.
- Límites por Tool y idempotencia en tu backend.
- Políticas de horario de servicio y mensajes “no disponible”.
Checklists
Antes de producción
- System Prompt revisado, intenciones y límites claros.
- Validación de outputs (schema/regex) y confirmaciones críticas.
- Fallbacks configurados (aclaración, rechazo, mano humana).
- Tests de regresión y casos de ruido/voz.
En producción
- Monitorea métricas: tasa de éxito, rechazos, escalados, 4xx/5xx.
- Reentrena o ajusta prompts según hallazgos.
- Revisión periódica de Knowledge y Tools.
Recursos
- Autenticación por workspace: API reference → Keys.
- Chat webhook, llamadas y notificaciones: API reference → Endpoints.