Detecção de spam

Subtarefa de moderação focada em identificar contribuições promocionais, automatizadas, cheias de links ou fora de tópico, distinta da detecção de toxicidade, mas geralmente tratada pelo mesmo pipeline.

A detecção de spam é a subtarefa de moderação que captura contribuições que não são tóxicas no sentido de discurso de ódio, mas que mesmo assim não têm lugar ali: conteúdo promocional, publicidade copiada e colada, fazendas de links, texto de preenchimento gerado por IA, cargas políticas fora de tópico.

Como o spam se manifesta em um site de imprensa

  • Promocional: “Compre na XYZ.com !!” com links de afiliados.
  • Fazendas de links: a mesma URL postada em 50 artigos por uma conta recém-criada.
  • Coordenado: o mesmo parágrafo repostado em dezenas de artigos em poucos minutos (muitas vezes automatizado).
  • Preenchimento gerado por IA: recentemente, um aumento de comentários sem graça gerados por LLM, criados para “envelhecer” contas antes de abusos mais agressivos.

Como a Logora lida com isso

O modelo de spam da Logora roda no mesmo pipeline que a detecção de toxicidade, mas com sinais diferentes: reputação da URL, velocidade de postagem por conta, similaridade entre contribuições recentes, idade da conta, impressão digital do idioma. Acima de um limite, as contribuições são bloqueadas automaticamente. Os casos limítrofes vão para a fila de moderação.

Para ataques coordenados (uma enxurrada de conteúdo similar em várias contas), a combinação de limitação de taxa (rate-limiting) e pontuação de similaridade da Logora detecta o padrão já nas primeiras 5 a 10 postagens e aplica um período temporário de resfriamento.

Veja moderação por IA, moderação de conteúdo e detecção de toxicidade.

⌘K / Ctrl+K para abrir