Lista de bloqueio (e filtro de palavrões)

Lista de termos que rejeitam ou sinalizam automaticamente uma contribuição, distinta de uma lista de palavras suspeitas que encaminha o conteúdo para a revisão humana conforme o contexto.

Uma lista de bloqueio (ou filtro de palavrões) é uma lista de termos que rejeitam, ou sinalizam, automaticamente uma contribuição assim que um deles aparece. É a ferramenta de moderação mais antiga e simples: um insulto ou uma palavra proibida dispara uma ação fixa, sem qualquer juízo de contexto.

Lista de bloqueio vs lista de palavras suspeitas

Essas duas listas fazem tarefas bem diferentes.

  • Lista de bloqueio (rejeição automática): termos tão raramente aceitáveis que sua presença justifica bloquear a contribuição de imediato. A ação é automática.
  • Lista de palavras suspeitas (encaminha para humanos): termos ambíguos que dependem do contexto. Uma palavra como “vítima” não deve ser bloqueada, pode sinalizar um depoimento sensível tanto quanto um insulto, então encaminha a contribuição para a fila humana para uma leitura mais atenta.

A distinção importa: rejeitar automaticamente uma palavra ambígua silencia falas legítimas, enquanto enviar cada insulto proibido a um humano desperdiça o tempo dos moderadores.

Limites

Listas de palavras-chave são fáceis de contornar. Os usuários as driblam com espaços, acentos, leetspeak ou homóglifos (escrevendo em volta do filtro). Elas também produzem falsos positivos: o caso clássico é uma subcadeia proibida escondida dentro de uma palavra mais longa e inofensiva. Uma lista de bloqueio é, portanto, um primeiro filtro, não uma estratégia de moderação completa.

Como a Logora lida com isso

A Logora dá a cada editor uma lista de bloqueio editável: a redação decide quais termos são rejeitados automaticamente e pode adaptar a lista ao seu público e à sua linha editorial. Ao lado dela, a Logora mantém uma lista de palavras suspeitas contextual que não bloqueia, mas encaminha as contribuições sinalizadas para a fila de moderação, onde um humano as lê em contexto. Ambas as listas complementam os modelos de moderação por IA em vez de substituí-los.

Veja detecção de spam, moderação de conteúdo, detecção de toxicidade e fila de moderação.

⌘K / Ctrl+K para abrir