Modelos de linguagem foram treinados para sempre gerar resposta plausível, mesmo quando não têm informação. Para conversa casual isso é tolerável (no máximo erram um fato trivial). Para direito, é desastre: a IA inventa números de processo, ementas inteiras, súmulas inexistentes, com a mesma confiança com que cita coisas reais.
Como ferramentas sérias previnem alucinação:
- Grounding em base verificada: a IA só pode citar coisas que estão na base de dados real (não inventa do treino).
- Citações obrigatórias com link: cada afirmação factual aponta para a fonte primária clicável.
- Filtros de saída: pós-processamento detecta e remove citações que não batem com a base.
- Verificação humana opcional: para casos críticos, segunda passagem por modelo diferente checa cada citação.
Na prática, mesmo a melhor ferramenta exige revisão humana. A diferença é que com ferramenta séria a revisão é cosmética (concordância, tom); com ferramenta ruim a revisão é forense (verificar cada citação).