Escala como requisito
Um sistema de staffing com 40 mil médicos pode ter milhares de conversas ativas simultaneamente. A arquitetura precisa suportar essa carga sem degradar a experiência.
Componentes-chave
Message broker para gerenciar filas de conversas. Cache distribuído para memória de contexto. Banco vetorial para busca semântica de perfis. Workers assíncronos para processamento de IA.
Resiliência
Circuit breakers para lidar com indisponibilidade de APIs externas. Retry com backoff exponencial. Fallbacks graceful — se a IA falha, a mensagem é encaminhada para um humano.
Uma arquitetura bem projetada é invisível para o usuário final — médicos e gestores nunca percebem a complexidade por trás de uma conversa simples no WhatsApp.