O problema dos dados
Treinar IA conversacional requer grandes volumes de conversas reais. Mas conversas com médicos contêm dados pessoais sensíveis que não podem ser usados livremente.
Dados sintéticos como solução
Modelos de linguagem podem gerar conversas sintéticas que imitam padrões reais sem conter dados de pessoas reais. Cenários variados (aceite, recusa, negociação, dúvida) são simulados com diferentes perfis.
Qualidade dos dados sintéticos
A chave é a diversidade: variações regionais, especialidades diferentes, tons de conversa variados, edge cases improváveis mas possíveis.
Dados sintéticos complementam (não substituem) dados reais anonimizados, criando um dataset robusto e privacidade-compliant para treinamento contínuo.