Dokumentation

TextParser

Der TextParser ist ein Modul welches Textabschnitte aus Webseiten oder Dateien zur Verfügung stellt.

Beschreibung

Der TextParser in IP-Symcon ermöglicht es bestimmte Teile aus z.B. einer Webseite oder eine Datei herauszuschneiden, indem mehrere Regeln hintereinander ausführt werden. Es stehen dabei folgende Regeln zur Verfügung:

Funktion Beschreibung
Text abscheiden vor Schneidet allen Text vor Tag1 ab
Text abschneiden hinter Schneidet allen Text hinter Tag1 ab
Hole Text Holt den Text bis zum Tag1 in die Variable
Text ausschneiden Schneidet den Text zwischen Tag1 und Tag2 aus und schreibt ihn in die Variable

Es können mehrere Regeln hintereinander angewendet und sogar mehrere “Hole Text”- und “Text ausschneiden”-Operationen verwendet werden.

Beispiel

Ein kleines Beispiel soll zeigen, wie man die erste Headline von heise.de auslesen kann, um diese z.B. im WebFront anzeigen zu können.

  1. Zuerst muss der Text Parser erstellt werden.
  2. Danach muss eine übergeordnete Instanz erstellt werden. In diesem Beispiel ist der WWW Reader erforderlich.
  3. Im WWW Reader muss die URL http:///www.heise.de angeben werden und ggf. der Timer aktiviert werden, der die Seite zyklisch abfragt.
  4. Zurück im Text Parser müssen folgende Regeln angegeben werden, um die Headline auslesen zu können.
    Der Weg diese Regeln herauszufinden ist, sich den HTML Code der Webseite anzusehen und nach markanten Stellen zu suchen, welche abgeschnitten werden können, bis am Ende nur noch der gewünschte Text übrig bleibt. Diese Regeln können dann in IP-Symcon eingetragen werden.

Regeln

Beschreibung Regel
Text abschneiden vor <div>
Text abschneiden vor “>
Hole Text </a>

Screenshot

Textparser