TCE
INTELIGÊNCIA ARTIFICAL DA META

MetaAI permitia conversas inapropriadas e discurso de ódio, revela documento interno

Política de IA da Meta foi corrigida após vazamento de diretrizes polêmicas sobre interações com crianças e crimes raciais

14 agosto 2025 - 19h15Mariana Cury*
Documento interno da Meta revela políticas de treinamento da MetaAI.
Documento interno da Meta revela políticas de treinamento da MetaAI. - (Foto: Jason Henry/NYT)

Um documento interno da Meta, vazado e analisado pela Reuters, revelou que as diretrizes de comportamento da MetaAI, o chatbot de inteligência artificial da empresa, permitiam interações problemáticas, como conversas sensuais com crianças e até a defesa de crimes raciais. Após o vazamento, a Meta corrigiu a ferramenta e afirmou ter removido as diretrizes inadequadas.

Canal WhatsApp

O documento, denominado "GenAI: Padrões de risco de conteúdo", detalhava as permissões para o chatbot em diversas situações. De acordo com as normas, a IA estava autorizada a se envolver em conversas românticas ou sensuais com crianças, gerar informações médicas falsas e até defender ideias discriminatórias. A Meta confirmou a autenticidade do documento, mas reforçou que tais diretrizes eram inconsistentes com suas políticas e foram removidas.

Entre os exemplos mais graves, a IA foi orientada a permitir descrições sensuais de crianças, como afirmar que a aparência de uma criança é uma “obra de arte”. A empresa também reconheceu que as orientações permitiam respostas inapropriadas quando menores pediam interações “românticas” com o chatbot. Após o vazamento, a Meta declarou que esses exemplos eram erros e que revisaria a política da IA.

Em relação ao discurso de ódio, o documento mostrou que a MetaAI poderia gerar respostas argumentando que pessoas negras seriam “menos inteligentes” que pessoas brancas, algo que foi igualmente classificado como inaceitável pela Meta. A empresa alegou que, apesar das falhas iniciais, as políticas corretas já foram implementadas para garantir que a IA não produza conteúdo discriminatório ou sexualize crianças.

A Meta afirmou que as diretrizes e exemplos encontrados no documento foram inadequados e foram corrigidos para manter as interações da IA dentro de padrões éticos e responsáveis.

Assine a Newsletter
Banner Whatsapp Desktop