Minimales Beispiel - 2. Daten modellieren#

Im ersten Schritt wurden die Daten, ihre Felder und Struktur grundsätzlich Simplex4TwIS bekanntgemacht, durch Importieren in den Zustand „Datenblob“ und dem Anlegen der Importtabelle, in der die Felder aus dem CSV zu Spalten in der Importtabelle wurden.

Im zweiten Schritt müssen die Daten modelliert werden, das heißt in das Datenmodell von Simplex4TwIS eingefügt werden.

Im Beispiel erfolgt das Modellieren im freien Grafikprogramm yED (https://www.yworks.com/products/yed). Die Modellierung kann auch erstmal auf Papier oder an einem Whiteboard durchgeführt werden, um ein Gefühl dafür zu bekommen.

Einführung in die Datenmodellierung#

Das Datenmodell von Simplex4TwIS besteht aus Klassen, Objekten und Verbindungen.

Im Demo sind bereits zwei Klassen vorhanden:

  • Klasse A: Stadtteile

  • Klasse B: Adressen

Daten modellieren in yED
  • Objekte sind konkrete Dinge und Sachverhalte in der Realität. Diese können im Raum existieren wie Gebäude oder Adressen, oder es können nicht-räumliche Objekte wie Handlungen, Verträge oder Messgeräte sein. Hier im Beispiel ist jeder einzelne Stadtteil ein Objekt, und jede einzelne Sporthalle ist ein Objekt.

  • Um Objekte um gemeinsame Eigenschaften herum zu gruppieren, werden Klassen verwendet. So sind hier alle Stadtteile in einer Klasse, und alle Sporthallen sollen ebenfalls eine Klasse werden. Daher werden Klassen oft auch als Objektklassen bezeichnet, diese beiden Begriffe sind synonym.

  • In der Modellierung werden die Eigenschaften der Objekte betrachtet und geprüft, welche davon für die Definition der Klasse verwendet werden sollen.

Bemerkung

Bei größeren Datenmengen kann es sinnvoll sein, Klassen größer zu fassen. Falls es neben Sporthallen auch Schwimmbäder und Sportplätze gibt, macht es vielleicht Sinn, eine Klasse „Sportanlagen“ zu modellieren, in der sich alle diese Objekte befinden. Diese Überlegungen sind Teil der Modellierung und ergeben sich mit mehr Erfahrung aus dem konkreten Arbeiten mit den eigenen Daten(mengen) und Fragestellungen.

Spalten der Importtabelle analysieren#

Der Ausgangspunkt für das Modellieren ist ein Blick in die Importtabelle und die einzelnen Spalten, um die für eine mögliche Klasse „Sporthallen“ relevanten Objekteigenschaften zu finden.

Dazu die Importtabelle der Sporthallen wie auch schon im Kapitel „Minimales Beispiel - 1. Daten importieren“ beschrieben anzeigen.

  1. Auf „View“ klicken.

    View-Button

    Die Seite „Sporthallen.csv (kompletter Datensatz) - Import table“ öffnet sich. Diese Seite zeigt den kompletten Datensatz mit allen im Datenblob vorhandenen Feldern. Die Reihenfolge und Bezeichnungen der Feldnummern wurden vom CSV übernommen, z.B. „geom“, „sportstaette“, „betreiber“ usw.

    Import table Anzeige
  2. Die erste Spalte „proc_id“ enthält IDs. Eine genauere Prüfung zeigt, dass diese tatsächlich eindeutig sind. Dies ist eine wichtige Information für die weitere Modellierung, und wir merken uns diese Spalte vor. Daneben wollen wir die Positionsdaten aus der Spalte „geom“.

    Spalten "proc_id" und "geom"
  3. Die Spalte „themenstadtplan“ ist eine Informationen, die sich im „sportanlagentyp“ wiederholt (und „typ“ ist in Simplex4TwIS schon vorgesehen). Wir entscheiden uns daher, nur die Spalten „sportstaette“, „sportanlage“ und „sportanlagentyp“ für die Klassenmodellierung vorzumerken.

    Spalten "sportstaette", "sportanlage" und "sportanlagentyp"
  4. Die Adresse besteht aus den zwei Spalten „strasse“ und „plz_ort“. Wir erinnern uns, es gibt schon eine eigene Klasse „Adressen“. Diese werden also als eigene Objekte gehandhabt und werden damit kein Teil der Klasse „Sporthallen“. Stattdessen wird eine Verbindung zwischen diesen Klassen hergestellt.

    Adress-Informationen für Sporthallen
  5. Die nächsten Spalten enthalten sehr viele Betreiber-Informationen. Perspektivisch könnten diese in eine eigene Klasse „Betreiber“ modelliert werden.

    Spalten mit Betreiber-Informationen

    In der Zukunft könnte dann das Objekt „ESBZ Ballspielhalle“ der Klasse „Sporthallen“ mit dem Betreiber „EBS“ in der Klasse „Betreiber“ verbunden werden.

    Mögliche Zuordnung der Spalten zu unterschiedlichen Klassen

    Im aktuellen Beispiel wird entschieden, die Betreiber-Informationen erstmal zu ignorieren und nicht in die Klasse der „Sporthallen“ zu übernehmen.

Neue Klasse grafisch modellieren#

In einem Grafikprogramm (oder auf Papier, Whiteboard) die neue „Klasse C: Sporthallen“ hinzufügen und diese mit der „Klasse B: Adressen“ verbinden.

Neue Klasse "Sporthallen"

In der neuen Klasse werden hauptsächlich Felder verwendet, die im Simplex4TwIS als Standardattribute vorangelegt sind, da fast jedes Objekt diese benötigt (mehr dazu im nächsten Schritt Minimales Beispiel - 3. Strukturen anlegen: Klassen). Beispielsweise benötigt jedes Objekt eine eindeutige ID zur Identifikation; dies ist insbesondere wichtig, falls der Datensatz nochmals importiert wird.

Außerdem nehmen wir das Feld „Geometrie“ hinzu, um die Geodaten der Sporthallen nutzen zu können. Solche zusätzlichen, nur in einer bestimmten Klasse verfügbaren Attribute werden als Sachattribute bezeichnet.

Daraus ergeben sich folgende Felder für die neue Klasse:

  • ID (aus „proc_id“)

  • Name (aus „sportanlage“)

  • Beschreibung (aus „sportstaette“)

  • Typ (aus „sportanlagentyp“)

  • Geometrie (aus „geom“)

Damit ist das Modellieren beendet, und im nächsten Schritt wird diese modellierte Klasse in Simplex4TwIS angelegt.