Moderação e segurança
Lista de bloqueio (e filtro de palavrões)
Lista de termos que rejeitam ou sinalizam automaticamente uma contribuição, distinta de uma lista de palavras suspeitas que encaminha o conteúdo para a revisão humana conforme o contexto.
Uma lista de bloqueio (ou filtro de palavrões) é uma lista de termos que rejeitam, ou sinalizam, automaticamente uma contribuição assim que um deles aparece. É a ferramenta de moderação mais antiga e simples: um insulto ou uma palavra proibida dispara uma ação fixa, sem qualquer juízo de contexto.
Lista de bloqueio vs lista de palavras suspeitas
Essas duas listas fazem tarefas bem diferentes.
- Lista de bloqueio (rejeição automática): termos tão raramente aceitáveis que sua presença justifica bloquear a contribuição de imediato. A ação é automática.
- Lista de palavras suspeitas (encaminha para humanos): termos ambíguos que dependem do contexto. Uma palavra como “vítima” não deve ser bloqueada, pode sinalizar um depoimento sensível tanto quanto um insulto, então encaminha a contribuição para a fila humana para uma leitura mais atenta.
A distinção importa: rejeitar automaticamente uma palavra ambígua silencia falas legítimas, enquanto enviar cada insulto proibido a um humano desperdiça o tempo dos moderadores.
Limites
Listas de palavras-chave são fáceis de contornar. Os usuários as driblam com espaços, acentos, leetspeak ou homóglifos (escrevendo em volta do filtro). Elas também produzem falsos positivos: o caso clássico é uma subcadeia proibida escondida dentro de uma palavra mais longa e inofensiva. Uma lista de bloqueio é, portanto, um primeiro filtro, não uma estratégia de moderação completa.
Como a Logora lida com isso
A Logora dá a cada editor uma lista de bloqueio editável: a redação decide quais termos são rejeitados automaticamente e pode adaptar a lista ao seu público e à sua linha editorial. Ao lado dela, a Logora mantém uma lista de palavras suspeitas contextual que não bloqueia, mas encaminha as contribuições sinalizadas para a fila de moderação, onde um humano as lê em contexto. Ambas as listas complementam os modelos de moderação por IA em vez de substituí-los.
Veja detecção de spam, moderação de conteúdo, detecção de toxicidade e fila de moderação.