AddOn


Spamfilter

Beschreibung

Bayesscher Spamfilter, der mit statistischer Analyse die Wahrscheinlichkeit berechnet, mit der ein zu übergebender Text Spam ist.
Ziel: Verzicht auf captchas.
Basiert auf b8.

Features:

  • Vollständige Unterstützung für Mehrsprachigkeit
  • Unterscheidung zwischen verschiedenen Sprachen im Filter
  • Stopwörter: Bei zu viel Stopwörtern in einem Text wird der Eintrag als Spam kategorisiert
  • Ignorierte Wörter: Diese Wörter werden aus der Bewertung herausgenommen
  • Protokoll mit manueller Kategorisierungsmöglichkeit (auch falsch einsortierte Texte können korrigiert werden).
  • Auto-Lernfunktion: Automatisch eingestufte Texte werden schon bei der nächsten Anfrage berücksichtigt.
  • Vielfältig konfigurierbar
  • Backend passt sich durch Verwendung der rex_* css-Klassen automatisch dem Look and Feel des eigenen Redaxo-Skins an.

@TODO:

  • Wartungsoptionen mit Reduktion der Datenbankgröße bei sehr vielen erlernten Texten. (Unter bestimmten Umständen können sehr viele Einträge entfernt werden, ohne dass sich das Ergebnis der Spamanalyse wesentlich verändert). In das Wartungstool soll auch der bisherige Menüpunkt Initialisieren/Bereinigen integriert werden.
  • Noch mehr Einstellungsmöglichkeiten (z.B. Protokollieren abhängig von Spamwahrscheinlichkeit und/oder Stopwörtern, Automatisches Ausführen von Wartungsarbeiten ab einer bestimmten Datenbankgröße oder in regelmäßigen Zeitabständen)
  • Bessere Dokumentation im Code selbst und Erstellen eines Manuals bzw. einer API-Referenz

Umsetzung

complanar webdesign und -programmierung

Ernst-Kohl-Straße 9 99423 Weimar www.complanar.de

Versionen

Für REDAXO
4.2.x
Veröffentlicht am
14.04.2010

Bearbeiten von mehreren Protokolleinträgen gleichzeitig implementiert.

@upgrade:
Einfach in den Ordner redaxo/include/addons entpacken und alle vorhandenen Dateien überschreiben - Fertig.
!!! Nicht in der Addonverwaltung auf reinstallieren klicken, dadurch gehen sämtliche erlernte und gespeicherte Protokolle und Texte bzw. Wortlisten verloren !!!

Ein Upgrade wird unbedingt empfohlen! In der Filterfunktion keine Änderungen, aber die Protokollfunktionen zur Bearbeitung sind in Version 0.1 nur rudimentär ausgebildet, langwierig zu bedienen und bieten keinerlei Komfort, da sich zunächst nur die Filterfunktionen im Betatest bewähren mussten.

Für REDAXO
Veröffentlicht am
14.04.2010

Validate-Klasse, die das Testen eines Feldes mit dem Spamfilter-AddOn bereitstellt.

Die Datei class.xform.validate_spamfilter.inc.php einfach in das Verzeichnis
redaxo/include/addons/xform/classes/validate kopieren - Fertig.

Zugriff auf den Validations-Typ mit validate|spamfilter|fieldLabel|warningMessage

Getestet mit XForm 1.4.1, funktioniert möglicherweise auch mit älteren Versionen.
Benötigt Spamfilter >= 0.1Beta

Für REDAXO
4.2.x
Veröffentlicht am
22.03.2010

Bisher nur mit Redaxo 4.2 getestet. Der Filter selbst funktioniert nahezu unabhängig von Redaxo und benutzt nur die rex_sql-Klasse für die Datenbankaktionen sowie $REX['CLANG'] für die Erkennung aktiver Sprachen.

Achtung: Nach dem Installieren unbedingt initialisieren (muss bei jeder Sprache einzeln vorgenommen werden), damit von Anfang an ordentliche Ergebnisse erzielt werden können.
Entweder über das entsprechende Menü oder durch manuelles Kategorisieren der ersten Protokolleinträge.
Ohne Initialisierung kann die Spamwahrscheinlichkeit nicht richtig berechnet werden!

Tests mit anderen Redaxo-Versionen sind willkommen, genauso wie Anregungen zu Verbesserungen.

Achtung: Der Spamfilter befindet sich noch im Beta-Stadium. Er wurde von mir bereits umfangreich getestet, aber man ist ja oft betriebsblind...