Velocidade mata a ilusão
Um humano leva 30 segundos a 2 minutos para responder uma mensagem. Se a IA responde em 1 segundo, parece robótica. Se leva 30 segundos, o modelo de linguagem está lento demais.
Timing variável
A IA simula tempo de digitação variável: mensagens curtas (2-5 segundos), mensagens médias (5-15 segundos), mensagens longas (15-30 segundos). Variação aleatória impede padrões detectáveis.
Otimizações técnicas
Streaming de tokens para começar a "digitar" enquanto processa. Cache de respostas para perguntas frequentes. Modelos menores para triagem rápida, modelos maiores para conversas complexas.
O objetivo é estar na faixa de naturalidade: rápido o suficiente para ser útil, lento o suficiente para parecer humano.