⚡ AutomationsAI|Portal de Cursos →

Verificando acesso...

MÓDULO 5.3

🚀 Deploy em produção

Rampa progressiva: shadow mode → 10% tráfego → 50% → 100%. HITL no nível mais conservador no início. Job shadowing presencial. Observabilidade live. Plano de contingência.

6
Tópicos
55
Minutos
Aplic.
Nível
Deploy
Tipo
1

👻 Shadow mode (semana 0)

Agente gera resposta mas só pra champion ler. Champion compara com o que ele teria respondido. Ajusta antes de cliente ver.

⏱️ Duração

3-5 dias. 50-100 mensagens reais processadas em shadow.

👤 Champion presente

Champion fica perto do painel. Compara resposta gerada vs o que ele teria respondido. Anota divergências.

✅ Ajuste final

Divergências geram último ciclo de ajuste antes do tráfego real. Última checagem.

💡 Bateria automatizada ≠ tráfego real

Bateria pega cenários previstos. Tráfego real surpreende. Shadow mode pega esses casos antes do cliente ver.

2

📈 Rampa de tráfego — 10% → 50% → 100%

Cada estágio com revisão de métricas. 100% no dia 1 = se algo der errado, 100% do cliente sofre.

Semana% tráfegoCritérioRevisão
Semana 00% (shadow)Champion aprova divergênciasDiária
Semana 110%Override < 30%, escalação < 20%Diária
Semana 250%Override < 20%, escalação < 15%A cada 2 dias
Semana 3+100%Override < 15%, escalação < 10%Semanal

🔧 Feature flag

Roteamento por % feito no n8n (random < 0.1 vai pro agente, resto pro humano). Permite reverter em segundos.

3

🎚️ HITL no nível mais conservador inicialmente

Semanas 1-2: N2 Sugestão (humano aprova cada resposta). Conforme estabiliza, sobe pra N3 (execução com gate) e depois N4 (autônomo com auditoria).

Estratégia conservadora

  • • Sem 1: N2 (sugestão sempre)
  • • Sem 2: N3 (gate p/ exceções)
  • • Sem 3+: N4 selectivo
  • • Cenário X só sobe se 90% acerto em 50+ casos

Erro do junior

  • • Vai direto pra N4 "pra economizar tempo"
  • • Cliente real vê erro do agente
  • • Reputação destruída
  • • Champion não tem tempo de adaptar

💡 Critério explícito de promoção

"Cenário X sobe de N2 pra N3 quando: ≥50 amostras + acerto ≥95% + zero erro crítico em 30 dias." Documentado. Conservador.

4

👀 Job shadowing presencial

Implementador passa 2-3 dias presencialmente na empresa cliente nos primeiros dias do go-live. Resolve dúvida na hora, vê adoção real, capta ajuste fino.

📅 Dia 1 — presença total

Você ao lado do champion. Observa cada interação. Anota dúvidas. Treina na hora.

📅 Dia 2 — manhã presencial

Presencial 8h-12h. Tarde remoto. Sessão de retro com champion.

📅 Dia 3 — só remoto

Remoto. WhatsApp grupo ativo. Reponde dúvidas em <1h.

📅 Semana 2-3 — visitas periódicas

2 visitas/semana. Reduz pra 1 conforme adoção estabiliza.

⚠️ Dia 1 sem você presente

80% de chance de adoção quebrar no dia 1. Sua presença ancora confiança. Champion não age sozinho na 1ª crise.

5

📡 Observabilidade em produção — dashboard live

Dashboard com: volume · taxa de override · taxa de escalação · tempo de resposta · custo · top RTs. Metabase ou Grafana.

📊 Widgets essenciais

Volume hora a hora · Top intents · Latência p50/p95 · Custo acumulado dia/mês · Taxa override por cenário.

🚨 Alertas no Telegram

Erro > 5% em 1h · latência > 5s · custo > R$ X/dia · escalação > 30% · override > 40%.

📅 Cadência de revisão

Semana 1: dashboard a cada 4h. Semana 2-3: 2x/dia. Mês 2+: diária. Mês 6+: semanal.

👥 Compartilhado com cliente

Dono e champion têm acesso ao dashboard. Transparência total. Vira ferramenta de apresentação trimestral.

6

🚨 Plano de contingência — rollback em 2 min

Feature flag pra desligar agente em 1 clique. Mensagens voltam ao roteamento humano. Plano comunicado ao cliente antes de subir.

⚙️ Kill switch

  • • Comando no n8n: 1 toggle desliga agente
  • • OU comando do champion via WhatsApp: "PAUSAR AGENTE" pra número admin
  • • Mensagens roteadas pro grupo de humanos
  • • Resposta automática: "Estamos com manutenção rápida. Volto logo."

📋 Quando acionar

Bug grave que afeta >5% das conversas · agente respondendo errado críticamente · API do Bling down por >15 min · solicitação do sponsor.

📞 Comunicação durante incidente

Telefone direto sponsor + champion. Update a cada 30 min. Comunica causa raiz quando confirmada. Não esconde.

🔧 Post-mortem <24h

Após incidente, doc de 1 página: o que aconteceu · causa raiz · ação corretiva · prevenção. Compartilhado com cliente.

💡 Rollback rápido = competência percebida

Cliente que vê implementador resolvendo incidente em 5 min ganha confiança. Sem rollback fácil, qualquer bug vira crise.

🚀 Resumo do módulo

Shadow mode 3-5 dias. Champion compara resposta gerada com o que faria. Última checagem antes de tráfego real.
Rampa 0% → 10% → 50% → 100%. Cada estágio com critério explícito. Feature flag pra reverter.
HITL conservador no início. N2 sugestão · N3 gate · N4 selectivo. Promoção com critério.
Job shadowing 2-3 dias presencial. Sua presença ancora confiança. Sem isso, adoção quebra no dia 1.
Observabilidade live + alertas. Dashboard Metabase. Telegram pra erros. Compartilhado com cliente.
Kill switch + post-mortem. Rollback em 2 min. Comunicação ativa. Post-mortem <24h.

Próximo módulo:

5.4 — Medição e resultado · contra baseline em 30/60/90 dias · payback · apresentação trimestral · KPI não bate.