Ignorieren/Überwachen-Filter manuell erstellen

Top  Previous  Next

Alternativ zum Auto-Filter System und dem Filter-Assistent können Ignorieren- bzw. Überwachen-Filter auch manuell erstellt werden.

 

Pro Zeile muss ein ein Filter-Ausdruck definiert werden. Die Groß/Kleinschreibung spielt dabei keine Rolle und wird nicht berücksichtigt.

 

filter-assistant08

 

Das Button "Neuer Filter: Ignorieren" (bzw. "Neuer Filter: Überwachen") öffnet einen Dialog, in dem Sie einen Filter-Ausdruck eingeben und sofort testen können. Mit dem Button "Selektierte Zeile testen" kann die Zeile, in der sich der Cursor befindet, getestet werden. Das Button "Teste Filter..." testet die gesamten Filter-Einstellungen, indem der gefilterte Inhalt der neuen Seiten-Version mit den gefilterten Inhalt der alten Seiten-Version verglichen wird.

 

Jede Zeile kann aus einem der folgenden Elemente bestehen:

 

1.Fixe Text-Phrase
Mit diesem Typ können fixe (statische) Phrasen einer Seite ignoriert werden.
 
2.Text mit einem Wildcard
Filter mit Wildcards bestehen typischerweise aus einem Start-Text, einem Ende-Text und einem beliebigen Text dazwischen. Das * Zeichen (Wildcard) steht für den Text zwischen den beiden Text-Grenzen.
 
3.Reguläre Ausdrücke (Regular Expressions)
Mit Regulären Ausdrücken können komplexe Such- und Filter-Ausdrücke definiert werden, die in speziellen Funktionen angegeben werden müssen. Zum Beispiel "regex(....)".

Wildcard-Filter

WebSite-Watcher unterstützt 3 Arten von Wildcard-Filter mit der Vorgabe, dass nur ein Wildcard pro Filter-Ausdruck möglich ist:

 

*EndText

Diese Form filtert alles vom Seitenbeginn bis zum ersten Vorkommen von "EndText".

Zum Beispiel: *Tägliche News

 

StartText*EndText

Diese Form filtert alle Text-Passagen, die mit "StartText" beginnen und mit "EndText" enden.

Zum Beispiel: Downloads:*Anbieter

 

StartText*

Diese Form filtert alles vom letzten Vorkommen von "StartText" bis zum Ende der Seite.

Zum Beispiel: Benutzer online*

Reguläre Ausdrücke (Regular Expressions)

WebSite-Watcher unterstützt PERL5-kompatible Reguläre Ausdrücke, mit denen komplexe Filter-Definitionen erstellt werden können. Reguläre Ausdrücke müssen in einer der folgenden Funktionen angegeben werden:

 

regex( ... )

Filtert den angegebenen regulären Ausdruck

Zum Beispiel: regex(\d+ downloads)

 

FirstRegex( ... )

Filtert nur das erste Vorkommen des angegebenen regulären Ausdrucks

Zum Beispiel: FirstRegex(\d+ downloads)

 

StartToRegex( ... )

Filtert alles vom Seitenbeginn bis zum ersten Vorkommen des angegebenen regulären Ausdrucks

Zum Beispiel: StartToRegex(\d+ Besucher)

 

RegexToRegex( ... , ... )

Filtert alles zwischen zwei regulären Ausdrücken

Zum Beispiel: RegexToRegex(Downloads\: \d+,Lizenz\:)

 

RegexToEnd( ... )

Filtert alles vom letzten Vorkommen des angegebenen regulären Ausdrucks bis zum Ende der Seite

Zum Beispiel: RegexToEnd(\d+ Benutzer online)

 

RegexCmp( ... )

Sucht den definierten regulären Ausdruck, extrahiert alle Ziffern aus dem gefundenen Ergebnis und vergleicht diese mit einer vordefinierten Zahl. Diese Funktion kann zum Beispiel zur Suchen mit Vergleich von Preisen verwendet werden. Zum Beispiel um nur Preise zu finden die höher als 1000 sind.

Zum Beispiel: RegexCmp(\d+([,\.]\d+)* Euro;,; > 1000)

CSS basierte Filter

Seiten-Inhalt kann auch über CSS-Klassennamen ignoriert bzw. überwacht werden.

 

css( CLASSNAME )

Ignoriert/Überwacht den Seiten-Inhalt, der mit dem angegebenen CSS-Klassennamen formatiert ist.

Die Reihenfolge der Filter ist wichtig!

Bitte beachten Sie, dass die definierten Filter immer von oben nach unten ausgeführt werden. Wenn der Filter der ersten Zeile einen Teil der Seite filtert, dann steht dieser Inhalt für die Filter der folgenden Zeilen nicht länger zur Verfügung.

 

Beispiel:

 

Sie haben folgende zwei Ignorieren-Filter:

 

   Watcher

   WebSite-Watcher

 

Die erste Zeile filtert (löscht) "Watcher". Die zweite Zeile wird nie ein Ergebnis finden, denn das Wort "Watcher" ist nach dem Ausführen des ersten Filters nicht länger verfügbar. Die richtige Reihenfolge wäre also:

 

   WebSite-Watcher

   Watcher

 

Hier filtert (löscht) die erste Zeile alle Wörter "WebSite-Watcher". Die zweite Zeile kann dann die noch verfügbaren Wörter "Watcher" filtern.

Veraltete Filter

Veraltete Ignorieren-Filter, die keinen Text mehr finden, werden automatisch erkannt und nach einiger Zeit gelöscht. Es besteht keine Notwendigkeit, Ignorieren-Filter manuell zu warten und zu löschen. Dieses automatische Löschen kann in der Tweaks Sektion deaktiviert werden (was wir allerdings nicht empfehlen).

 

Veraltete Überwachen-Filter werden nicht automatisch gelöscht, diese Filter müssen manuell gepflegt werden.

Vergessen Sie nicht, die erstellten Filter zu testen

Das Feature "Teste Filter..." bietet die Möglichkeit, die erstellten Filter zu testen, indem der gefilterte Inhalt der neuen Seiten-Version mit dem gefilterten Inhalt der alten Seiten-Version verglichen wird.

 

 

1.Öffnen Sie die Bookmark-Eigenschaften
2.Klicken Sie das Button "Filter-Assistent" (oder auf den Text "Manueller Text-Filter")
3.Geben Sie die Filter-Ausdrücke ein

 

Siehe auch:

Wildcards
Reguläre Ausdrücke