Spam-Erkennung

Teilaufgabe der Moderation zur Identifizierung werblicher, automatisierter, linklastiger oder themenfremder Beiträge, getrennt von der Toxizitätserkennung, aber meist über dieselbe Pipeline abgewickelt.

Spam-Erkennung ist die Teilaufgabe der Moderation, die Beiträge erfasst, die nicht im Sinne von Hassrede toxisch sind, aber dennoch nicht hierhergehören: werbliche Inhalte, Copy-Paste-Werbung, Linkfarmen, KI-generierter Fülltext, themenfremde politische Botschaften.

Wie Spam auf einer Presseseite aussieht

  • Werblich : “Kaufen Sie bei XYZ.com !!” mit Affiliate-Links.
  • Linkfarmen : dieselbe URL, von einem frisch angelegten Konto unter 50 Artikeln gepostet.
  • Koordiniert : derselbe Absatz, innerhalb von Minuten über Dutzende Artikel hinweg erneut gepostet (oft automatisiert).
  • KI-generierter Fülltext : in jüngster Zeit eine Zunahme belangloser, von LLMs generierter Kommentare, die Konten altern lassen sollen, bevor aggressiverer Missbrauch folgt.

Wie Logora damit umgeht

Das Spam-Modell von Logora läuft über dieselbe Pipeline wie die Toxizitätserkennung, jedoch mit anderen Signalen : URL-Reputation, Posting-Geschwindigkeit pro Konto, Ähnlichkeit über aktuelle Beiträge hinweg, Kontoalter, Sprach-Fingerprint. Oberhalb eines Schwellenwerts werden Beiträge automatisch blockiert. Grenzfälle landen in der Moderationswarteschlange.

Bei koordinierten Angriffen (einer Flut ähnlicher Inhalte über mehrere Konten hinweg) erkennt Logoras Rate-Limiting + Ähnlichkeitsbewertung das Muster bereits innerhalb der ersten 5-10 Beiträge und wendet eine vorübergehende Abkühlphase an.

Siehe KI-Moderation, Content-Moderation und Toxizitätserkennung.

⌘K / Strg+K zum Öffnen