Moderation & Sicherheit
Spam-Erkennung
Teilaufgabe der Moderation zur Identifizierung werblicher, automatisierter, linklastiger oder themenfremder Beiträge, getrennt von der Toxizitätserkennung, aber meist über dieselbe Pipeline abgewickelt.
Spam-Erkennung ist die Teilaufgabe der Moderation, die Beiträge erfasst, die nicht im Sinne von Hassrede toxisch sind, aber dennoch nicht hierhergehören: werbliche Inhalte, Copy-Paste-Werbung, Linkfarmen, KI-generierter Fülltext, themenfremde politische Botschaften.
Wie Spam auf einer Presseseite aussieht
- Werblich : “Kaufen Sie bei XYZ.com !!” mit Affiliate-Links.
- Linkfarmen : dieselbe URL, von einem frisch angelegten Konto unter 50 Artikeln gepostet.
- Koordiniert : derselbe Absatz, innerhalb von Minuten über Dutzende Artikel hinweg erneut gepostet (oft automatisiert).
- KI-generierter Fülltext : in jüngster Zeit eine Zunahme belangloser, von LLMs generierter Kommentare, die Konten altern lassen sollen, bevor aggressiverer Missbrauch folgt.
Wie Logora damit umgeht
Das Spam-Modell von Logora läuft über dieselbe Pipeline wie die Toxizitätserkennung, jedoch mit anderen Signalen : URL-Reputation, Posting-Geschwindigkeit pro Konto, Ähnlichkeit über aktuelle Beiträge hinweg, Kontoalter, Sprach-Fingerprint. Oberhalb eines Schwellenwerts werden Beiträge automatisch blockiert. Grenzfälle landen in der Moderationswarteschlange.
Bei koordinierten Angriffen (einer Flut ähnlicher Inhalte über mehrere Konten hinweg) erkennt Logoras Rate-Limiting + Ähnlichkeitsbewertung das Muster bereits innerhalb der ersten 5-10 Beiträge und wendet eine vorübergehende Abkühlphase an.
Siehe KI-Moderation, Content-Moderation und Toxizitätserkennung.