5.3 Deploy em produção | T5 | Profissional 2027

👻 Shadow mode (semana 0)

Agente gera resposta mas só pra champion ler. Champion compara com o que ele teria respondido. Ajusta antes de cliente ver.

⏱️ Duração

3-5 dias. 50-100 mensagens reais processadas em shadow.

👤 Champion presente

Champion fica perto do painel. Compara resposta gerada vs o que ele teria respondido. Anota divergências.

✅ Ajuste final

Divergências geram último ciclo de ajuste antes do tráfego real. Última checagem.

💡 Bateria automatizada ≠ tráfego real

Bateria pega cenários previstos. Tráfego real surpreende. Shadow mode pega esses casos antes do cliente ver.

📈 Rampa de tráfego — 10% → 50% → 100%

Cada estágio com revisão de métricas. 100% no dia 1 = se algo der errado, 100% do cliente sofre.

Semana	% tráfego	Critério	Revisão
Semana 0	0% (shadow)	Champion aprova divergências	Diária
Semana 1	10%	Override < 30%, escalação < 20%	Diária
Semana 2	50%	Override < 20%, escalação < 15%	A cada 2 dias
Semana 3+	100%	Override < 15%, escalação < 10%	Semanal

🔧 Feature flag

Roteamento por % feito no n8n (random < 0.1 vai pro agente, resto pro humano). Permite reverter em segundos.

🎚️ HITL no nível mais conservador inicialmente

Semanas 1-2: N2 Sugestão (humano aprova cada resposta). Conforme estabiliza, sobe pra N3 (execução com gate) e depois N4 (autônomo com auditoria).

Estratégia conservadora

• Sem 1: N2 (sugestão sempre)
• Sem 2: N3 (gate p/ exceções)
• Sem 3+: N4 selectivo
• Cenário X só sobe se 90% acerto em 50+ casos

Erro do junior

• Vai direto pra N4 "pra economizar tempo"
• Cliente real vê erro do agente
• Reputação destruída
• Champion não tem tempo de adaptar

💡 Critério explícito de promoção

"Cenário X sobe de N2 pra N3 quando: ≥50 amostras + acerto ≥95% + zero erro crítico em 30 dias." Documentado. Conservador.

👀 Job shadowing presencial

Implementador passa 2-3 dias presencialmente na empresa cliente nos primeiros dias do go-live. Resolve dúvida na hora, vê adoção real, capta ajuste fino.

📅 Dia 1 — presença total

Você ao lado do champion. Observa cada interação. Anota dúvidas. Treina na hora.

📅 Dia 2 — manhã presencial

Presencial 8h-12h. Tarde remoto. Sessão de retro com champion.

📅 Dia 3 — só remoto

Remoto. WhatsApp grupo ativo. Reponde dúvidas em <1h.

📅 Semana 2-3 — visitas periódicas

2 visitas/semana. Reduz pra 1 conforme adoção estabiliza.

⚠️ Dia 1 sem você presente

80% de chance de adoção quebrar no dia 1. Sua presença ancora confiança. Champion não age sozinho na 1ª crise.

📡 Observabilidade em produção — dashboard live

Dashboard com: volume · taxa de override · taxa de escalação · tempo de resposta · custo · top RTs. Metabase ou Grafana.

📊 Widgets essenciais

Volume hora a hora · Top intents · Latência p50/p95 · Custo acumulado dia/mês · Taxa override por cenário.

🚨 Alertas no Telegram

Erro > 5% em 1h · latência > 5s · custo > R$ X/dia · escalação > 30% · override > 40%.

📅 Cadência de revisão

Semana 1: dashboard a cada 4h. Semana 2-3: 2x/dia. Mês 2+: diária. Mês 6+: semanal.

👥 Compartilhado com cliente

Dono e champion têm acesso ao dashboard. Transparência total. Vira ferramenta de apresentação trimestral.

🚨 Plano de contingência — rollback em 2 min

Feature flag pra desligar agente em 1 clique. Mensagens voltam ao roteamento humano. Plano comunicado ao cliente antes de subir.

⚙️ Kill switch

• Comando no n8n: 1 toggle desliga agente
• OU comando do champion via WhatsApp: "PAUSAR AGENTE" pra número admin
• Mensagens roteadas pro grupo de humanos
• Resposta automática: "Estamos com manutenção rápida. Volto logo."

📋 Quando acionar

Bug grave que afeta >5% das conversas · agente respondendo errado críticamente · API do Bling down por >15 min · solicitação do sponsor.

📞 Comunicação durante incidente

Telefone direto sponsor + champion. Update a cada 30 min. Comunica causa raiz quando confirmada. Não esconde.

🔧 Post-mortem <24h

Após incidente, doc de 1 página: o que aconteceu · causa raiz · ação corretiva · prevenção. Compartilhado com cliente.

💡 Rollback rápido = competência percebida

Cliente que vê implementador resolvendo incidente em 5 min ganha confiança. Sem rollback fácil, qualquer bug vira crise.

🚀 Resumo do módulo

✓

Shadow mode 3-5 dias. Champion compara resposta gerada com o que faria. Última checagem antes de tráfego real.

✓

Rampa 0% → 10% → 50% → 100%. Cada estágio com critério explícito. Feature flag pra reverter.

✓

HITL conservador no início. N2 sugestão · N3 gate · N4 selectivo. Promoção com critério.

✓

Job shadowing 2-3 dias presencial. Sua presença ancora confiança. Sem isso, adoção quebra no dia 1.

✓

Observabilidade live + alertas. Dashboard Metabase. Telegram pra erros. Compartilhado com cliente.

✓

Kill switch + post-mortem. Rollback em 2 min. Comunicação ativa. Post-mortem <24h.

Próximo módulo:

5.4 — Medição e resultado · contra baseline em 30/60/90 dias · payback · apresentação trimestral · KPI não bate.

← Módulo 5.2 Módulo 5.4 →