👻 Shadow mode (semana 0)
Agente gera resposta mas só pra champion ler. Champion compara com o que ele teria respondido. Ajusta antes de cliente ver.
⏱️ Duração
3-5 dias. 50-100 mensagens reais processadas em shadow.
👤 Champion presente
Champion fica perto do painel. Compara resposta gerada vs o que ele teria respondido. Anota divergências.
✅ Ajuste final
Divergências geram último ciclo de ajuste antes do tráfego real. Última checagem.
💡 Bateria automatizada ≠ tráfego real
Bateria pega cenários previstos. Tráfego real surpreende. Shadow mode pega esses casos antes do cliente ver.
📈 Rampa de tráfego — 10% → 50% → 100%
Cada estágio com revisão de métricas. 100% no dia 1 = se algo der errado, 100% do cliente sofre.
| Semana | % tráfego | Critério | Revisão |
|---|---|---|---|
| Semana 0 | 0% (shadow) | Champion aprova divergências | Diária |
| Semana 1 | 10% | Override < 30%, escalação < 20% | Diária |
| Semana 2 | 50% | Override < 20%, escalação < 15% | A cada 2 dias |
| Semana 3+ | 100% | Override < 15%, escalação < 10% | Semanal |
🔧 Feature flag
Roteamento por % feito no n8n (random < 0.1 vai pro agente, resto pro humano). Permite reverter em segundos.
🎚️ HITL no nível mais conservador inicialmente
Semanas 1-2: N2 Sugestão (humano aprova cada resposta). Conforme estabiliza, sobe pra N3 (execução com gate) e depois N4 (autônomo com auditoria).
Estratégia conservadora
- • Sem 1: N2 (sugestão sempre)
- • Sem 2: N3 (gate p/ exceções)
- • Sem 3+: N4 selectivo
- • Cenário X só sobe se 90% acerto em 50+ casos
Erro do junior
- • Vai direto pra N4 "pra economizar tempo"
- • Cliente real vê erro do agente
- • Reputação destruída
- • Champion não tem tempo de adaptar
💡 Critério explícito de promoção
"Cenário X sobe de N2 pra N3 quando: ≥50 amostras + acerto ≥95% + zero erro crítico em 30 dias." Documentado. Conservador.
👀 Job shadowing presencial
Implementador passa 2-3 dias presencialmente na empresa cliente nos primeiros dias do go-live. Resolve dúvida na hora, vê adoção real, capta ajuste fino.
📅 Dia 1 — presença total
Você ao lado do champion. Observa cada interação. Anota dúvidas. Treina na hora.
📅 Dia 2 — manhã presencial
Presencial 8h-12h. Tarde remoto. Sessão de retro com champion.
📅 Dia 3 — só remoto
Remoto. WhatsApp grupo ativo. Reponde dúvidas em <1h.
📅 Semana 2-3 — visitas periódicas
2 visitas/semana. Reduz pra 1 conforme adoção estabiliza.
⚠️ Dia 1 sem você presente
80% de chance de adoção quebrar no dia 1. Sua presença ancora confiança. Champion não age sozinho na 1ª crise.
📡 Observabilidade em produção — dashboard live
Dashboard com: volume · taxa de override · taxa de escalação · tempo de resposta · custo · top RTs. Metabase ou Grafana.
📊 Widgets essenciais
Volume hora a hora · Top intents · Latência p50/p95 · Custo acumulado dia/mês · Taxa override por cenário.
🚨 Alertas no Telegram
Erro > 5% em 1h · latência > 5s · custo > R$ X/dia · escalação > 30% · override > 40%.
📅 Cadência de revisão
Semana 1: dashboard a cada 4h. Semana 2-3: 2x/dia. Mês 2+: diária. Mês 6+: semanal.
👥 Compartilhado com cliente
Dono e champion têm acesso ao dashboard. Transparência total. Vira ferramenta de apresentação trimestral.
🚨 Plano de contingência — rollback em 2 min
Feature flag pra desligar agente em 1 clique. Mensagens voltam ao roteamento humano. Plano comunicado ao cliente antes de subir.
⚙️ Kill switch
- • Comando no n8n: 1 toggle desliga agente
- • OU comando do champion via WhatsApp: "PAUSAR AGENTE" pra número admin
- • Mensagens roteadas pro grupo de humanos
- • Resposta automática: "Estamos com manutenção rápida. Volto logo."
📋 Quando acionar
Bug grave que afeta >5% das conversas · agente respondendo errado críticamente · API do Bling down por >15 min · solicitação do sponsor.
📞 Comunicação durante incidente
Telefone direto sponsor + champion. Update a cada 30 min. Comunica causa raiz quando confirmada. Não esconde.
🔧 Post-mortem <24h
Após incidente, doc de 1 página: o que aconteceu · causa raiz · ação corretiva · prevenção. Compartilhado com cliente.
💡 Rollback rápido = competência percebida
Cliente que vê implementador resolvendo incidente em 5 min ganha confiança. Sem rollback fácil, qualquer bug vira crise.
🚀 Resumo do módulo
Próximo módulo:
5.4 — Medição e resultado · contra baseline em 30/60/90 dias · payback · apresentação trimestral · KPI não bate.