Testes automatizados para respostas de LLMs
Testar respostas de Large Language Models (LLMs) difere fundamentalmente do teste de software tradicional. Enquanto sistemas convencionais produzem saídas determinísticas baseadas em regras fixas, LLMs geram respostas probabilísticas que variam a cada execução. Essa natureza não-determinística introduz desafios únicos: alucinações (informações falsas apresentadas como fatos), viés embutido nos dados de treinamento e inconsistências semânticas.