Best Practice im Umgang mit Geodaten für Logo

Diese Seite enthält Tipps für den Umgang mit Geodaten, die in Logo importiert oder mit Daten in Logo synchronisiert werden sollen. Für den Import unterstützt Logo Shapefiles und File- Geodatabase-Dateien, deshalb werden nachfolgend diese Dateitypen behandelt.

 

Dateiformate von Geodaten

Für den Import von Geodaten unterstützt Logo grundsätzlich die beiden Dateiformate Shapefile und File-Geodatabase. Nachfolgend sind die Eigenschaften kurz beschrieben, gefolgt von einer Gegenüberstellung der beiden Formate.

Shapefile

Für ein Shapefile gilt folgendes:

  • Kann nur Vektorendaten, keine Rasterdaten enthalten

  • Kann immer nur einen Layer enthalten

  • Kann immer nur Objekte eines Geometrietyps enthalten, also entweder Punkte, Linien oder Flächen

  • Setzen sich aus mehreren Dateien zusammen, nicht alle sind allerdings zwingend:

    • *.shp – Enthält die Geometriedaten der geographischen Objekte (zwingend)

    • *.shx – Enthält den Index der geographischen Objekte (zwingend)

    • *.dbf – dBase-Tabelle mit den Attributen der geographischen Objekte (zwingend)

    • *.prj – Beinhaltet Angaben zum Koordinatensystem der geographischen Objekte (nicht zwingend, aber hilfreich)

    • *.xml – Beinhaltet Metadaten zum Shapefile (nicht zwingend)

    • *.cpg – Beinhaltet Angaben zum verwendeten Zeichensatz (nicht zwingend, hilfreich bei Umlauten)

  • Spaltenbezeichnungen sind auf 10 Zeichen begrenzt

File-Geodatabase

Für eine File-Geodatebase gilt folgendes:

  • Kann mehrere Layer mit unterschiedlichen Geometrietypen enthalten

  • Kann sowohl Vektordaten als auch Rasterdaten enthalten

  • Besteht aus einem einzigen Verzeichnis

  • Kann auch nicht-geographische Daten enthalten

  • Kann verknüpfte Tabellen enthalten

Gegenüberstellung

 

Shapefile

File Geodatabase

 

Shapefile

File Geodatabase

Dateien

mind. 3 Einzeldateien

1 Verzeichnis

Mehrere Layer

-

Ja

Verschiedene Geometrietypen

-

Ja

Vektordaten

Ja

Ja

Rasterdaten

-

Ja

Spaltenbeschriftung

10 Zeichen

64 Zeichen

Aus der Gegenüberstellung geht deutlich hervor, dass Shapefiles nicht viele Vorteile mit sich bringen, trotzdem sind sie das am häufigsten verwendete Dateiformat für Geodaten.

Beispiel Entwässerungsdaten

Das folgende Beispiel zeigt exportierte Entwässerungsdaten (Schächte und Haltungen) als Shapefiles oder als File-Geodatabase. Beide Datensätze enthalten genau die gleichen Objekte. Die Shapefiles bestehen aus 10 Dateien, die File-Geodatabase aus einem Verzeichnis (hier nur gezippt, weil keine Verzeichnisse hochgeladen werden können).

Shapefiles

File-Geodatabase

Geodaten für Logo

Damit der Import von Geodaten in Logo möglichst effizient und fehlerlos läuft, sollten folgende Punkte beim Erstellen beachtet werden, unabhängig davon, in welchem Dateiformat die Daten geliefert werden.

Die vier wichtigsten Fragen

  1. Welche Art von Geometrien sollen die Daten enthalten?

  2. In welchem Koordinatensystem sollen die Daten geliefert werden?

  3. Welche Attribute sollen die Daten enthalten?

  4. Welche Feldtypen und welche Wertebereiche werden vorausgesetzt?

Geometrien

In Logo ist für jeden Objekttypen definiert, welche Geometrietypen zulässig sind. Grünflächen und Bauwerke können als Punkte, Linien oder Flächen erfasst werden. Fahrzeugrückhaltesysteme müssen Linien sein und für Fussgängerstreifen sind nur Punkte zulässig. Gewisse Objekttypen können zudem Multi-Part-Geometrien haben, andere nicht.

Bezüglich Geometrien gilt:

  • Objekte sollen von Beginn weg im korrekten Geometrietyp erfasst werden.

  • Single-Part-Geometrien sind oft einfacher zu handhaben als Multi-Part-Geometrien.

  • Bei Shapefiles müssen unterschiedliche Geometrietypen in separaten Files gespeichert werden. Bei File-Geodatebase sind separate Layer erforderlich.

Single-Part vs Multi-Part

Wird ein einzelnes Objekt mit einer einfachen Geometrie erfasst, spricht man von Single-Part-Geometrien (Beispiel links).

Wird ein einzelnes Objekt mit mehreren einfachen Geometrien erfasst, spricht man von Multi-Part-Geometrien (Beispiel rechts).

Ist jeweils nur ein Geometrietyp enthalten, spricht man auch von Multi-Point-, Multi-Line- bzw. Multi-Polygon-Geometrien.

Single-Part-Geometrie
Multi-Part-Geometrie

Koordinatensystem

Damit Geodaten am richtigen Ort dargestellt werden können, muss ein System wissen, in welchem Koordinatensystem die Geodaten daherkommen. Die Koordinaten legen die Position eines Objektes innerhalb eines Koordinatensystems fest, man spricht deshalb auch von Bezugsrahmen. Koordinaten benötigen immer einen Bezugsrahmen, damit sie korrekt interpretiert werden können!

Genaueres zu Koordinatensystemen

Um eine Position auf der Erdkugel zu bestimmen, werden geographische Koordinatensysteme (GCS Geographical Coordinate System) zusammen mit Winkelangaben verwendet. Solche Angaben kennt man aus Navigationsgeräten oder Google Maps (46° 57' 04'' N / 7° 26' 20'' E).

Um diese geographischen Positionen in einer Karte darzustellen, müssen sie auf eine planare Ebene projiziert werden. Auf dieser Ebene gilt dann ein projiziertes Koordinatensystem (PCS Projected Coordinate System).

Das Schweizer Koordinatensystem ist ein projiziertes Koordinatensystem und hat seinen Nullpunkt bei der Universität Bern. Dieser wird aber nicht mit Null, sondern mit Meterwerten 2’600’000 / 1’200’000 beschrieben. Das Koordinatensystem beinhaltet zudem Angaben zur räumlichen Ausdehnung und Ausrichtung des Systems (Achsrichtungen Nord und Ost für die Schweiz und Liechtenstein) und zur Kartenprojektion. Die Kartenprojektion legt fest, mit welcher Methodik Punkte auf der Erdkugel auf eine flache Ebene projiziert werden.

Die Gesamtheit dieser Angaben definieren den Bezugsrahmen für Koordinaten im Schweizer Koordinatensystem, dieses wird deshalb auch als CRS (Coordinate Reference System) bezeichnet. Die Umwandlung von Koordinaten von einem CRS in ein anderes nennt sich Transformation.

Das Koordinatensystem wird in Logo für jeden Datenbank einzeln festgelegt. Für die Schweiz wird standardmässig CH1903+/LV95 verwendet. Folgende Koordinatensystem sind in der Praxis üblich.

Ausdehnung

Bezeichnung

EPSG-Code

Ausdehnung

Bezeichnung

EPSG-Code

Global

WGS84

4326

Schweiz

CH1903+ / LV95

2056

Schweiz (alt)

CH1903 / LV03

21781

Georeferenzierte CAD-Daten

Es ist auch möglich, Geodaten in CAD-Programmen zu erfassen, was wir aber grundsätzlich nicht empfehlen. Werden Daten trotzdem in einem CAD-Programm erfasst, ist es wichtig, dass sowohl Position als auch Skalierung korrekt gewählt werden. Fehler können hier beispielsweise entstehen, wenn die Einheiten der CAD-Software falsch eingestellt (z.B. Zoll anstatt Meter) sind.

Attribute

Auch die Attribute sind für alle Objekttypen in Logo vordefiniert. Das heisst es ist festgelegt, welche Attribute abgefüllt werden können und in welchem Feldtypen die Werte gespeichert werden. Logo setzt mit Ausnahme des Objekttyps keine zwingenden Attribute voraus, es können aber vom Datenherr notwendige Attribute festgelegt werden.

Bezüglich Attribute gilt:

  • Es soll von Beginn weg klar sein, welche Attribute geliefert werden müssen.

  • Die Attribute sollen eindeutige, wiedererkennbare Bezeichnungen haben.

Attributbezeichnungen

Attributbezeichnungen erhalten insbesondere in zwei Fällen besondere Bedeutung. Erstens bei einer grossen Anzahl von Attributen und zweitens, wenn Shapefiles verwendet werden. Die Herausforderung im ersten Fall besteht darin, die Übersicht zu bewahren und die Attribute unterscheiden zu können. Im zweiten Fall ist es die Beschränkung auf 10 Zeichen, die zu Problemen führen kann. Zu lange Beschriftungen werden beim Erstellen eines Shapefiles automatisch gekürzt. Dies kann dazu führen, dass die Unterscheidbarkeit wie im Beispiel unten verloren geht.

Ursprüngliche Bezeichnung

Bezeichnung im Shapefile

Besser

Ursprüngliche Bezeichnung

Bezeichnung im Shapefile

Besser

Bauwerksbezeichnung

BAUWERKSBE

BAUWERKBEZ

Bauwerksbeschaffenheit

BAUWERKS02

BAUWERKBES

Bauwerkstyp

BAUWERKS03

BAUWERKTYP

Es ist oft sehr aufwändig oder unmöglich, nachträglich Attribute nachzuerfassen, deshalb lohnt es sich, vor der Datenerhebung genau zu überlegen, welche Informationen erforderlich sind. Als Gedankenstütze sollten folgende Informationsbereiche in Betracht gezogen werden:

  • Objektbeschreibung – Welche Attribute sind notwendig, um ein Objekt ausreichend zu beschreiben? Wie lässt sich ein Objekt eindeutig benennen?

  • Achsreferenz – Hat ein Objekt einen Bezug zu einer Achse (Strassen in Logo)? Falls ja, wie wird diese Achse identifiziert?

  • Zeitpunkte und Zeiträume – Wann wurde ein Objekt in der Realität gebaut? Wann instandgestellt? Gibt es Garantiefristen?

  • Besitzverhältnisse und Zuständigkeiten – Wer ist Eigentümer des Objektes? Wer ist zuständig für den Unterhalt?

  • Metadaten – Auf welcher Datengrundlage wurden die Objekte erfasst? Mit welcher Genauigkeit? Wie aktuell sind die Daten und wann sollten sie aktualisiert werden?

  • Identifikation über Systemgrenzen hinweg – Soll das digitale Abbild des Objektes (z.B. Objekt in Logo) eindeutig identifizierbar sein? Müssen Informationen synchronisierbar sein? Was wird für Schnittstellen zwischen verschiedenen Systemen benötigt?

Feldtypen und Wertebereich

In Bezug auf ein einzelnes Attribut stellt sich die Frage, welche Werte zulässig sind und in welcher Form sie daherkommen. Wie oben bereits erwähnt, werden alle Attribute in Logo in einem bestimmten Feldtyp gespeichert. Beim Import besteht zwar ein gewisser Spielraum (automatische Umwandlung von Feldtypen), aber dieser ist begrenzt, deshalb ist es besser, wenn die Feldtypen von Anfang an übereinstimmen.

Bezüglich Feldtypen und Wertebereiche gilt:

Die Antworten auf folgende Fragen sollen von Beginn weg klar sein.

  • Ist ein Attribut zwingend?

  • In welchem Feldtyp müssen Werte geliefert werden? (Format)

  • Welche Werte sind zulässig? (Wertebereich)

  • Null und leer?

Feldtypen

In Logo kommen die folgenden Feldtypen vor:

  • Zeichenkette (string) – Freier Text, der auch Zahlen und Sonderzeichen enthalten darf. Nur eingeschränkt in der Anzahl Zeichen.

  • Ganzzahl (integer) – Ganzzahl, auf eine bestimmte Anzahl Ziffern beschränkt.

  • Fliesskommazahl (float) – Kommazahl, auf eine bestimmte Anzahl Ziffern und Stellen nach dem Komma beschränkt.

  • Katalog – Der Werteumfang wird entweder im zugehörigen Textkatalog festgelegt oder ist fix definiert (z.B. Ja/Nein).

  • Datum – Datum im Datumsformat (DD.MM.JJJJ)

  • Zeit – Zeitstempel im Zeitformat (HH:MM)

  • Jahr – Muss eine Jahreszahl enthalten (Spezialfall von Ganzzahl)

Die Umwandlung zwischen verschiedenen Feldtypen ist nicht immer trivial, deshalb sollten die Feldtypen von Anfang an sinnvoll gewählt werden.

Beispiel Datum

Ein Datum kann als Zeichenkette, als Ganzzahl oder aber im Datumsformat gespeichert werden. Für einen Menschen mag dies keine grosse Rolle spielen, für einen Computer ist der Unterschied allerdings wesentlich:

  • 1. Januar 2023 → Zeichenketten lassen sich nicht nach Datum sortieren und können nicht für Rechenoperationen verwendet werden.

  • 01012023 → Rechenoperationen mit Datumszahlen sind ebenfalls meist nicht sinnvoll.

  • 01.01.2023 → Mit Werten im Datumsformat können Rechenoperationen (z.B. eine Woche hinzuzählen) durchgeführt werden und Falschinterpretationen sind ausgeschlossen.

Wie ein Datum für eine Anwender:in dargestellt wird, lässt sich oft einstellen und hängt nicht direkt mit dem gespeicherten Format zusammen.

Wertebereiche

Neben dem Feldtyp spielt auch der Wertebereich eine Rolle. Je eingeschränkter der Wertebereich ist, desto einfacher ist die Plausibilitätskontrolle. Die Erfahrung hat gezeigt, dass die Genauigkeit der Daten mit zunehmender Einschränkung des Wertebereiches zunimmt. Der Interpretationsspielraum nimmt durch Einschränkung ab und Fehler fallen schneller auf.

Grundsätzlich gilt…

So eingeschränkt wie möglich, so frei wie nötig!

Bauwerke können auf unterschiedliche Arten typisiert werden:

  • Freie Zeichenkette → Sehr flexibel, aber fehleranfällig und uneinheitlich

  • Katalog mit vorgegeben Werten → Eindeutig, aber unflexibel

  • Katalog mit freien Werten → nicht ganz eindeutig, aber flexibel und wahrscheinlich am besten geeignet

Null und leer

In Bezug auf Attribute stellt sich zuletzt noch die Frage nach den leeren Werten. Bei leeren Werten ist oft nicht klar, ob die Angaben fehlen oder explizit leer sind. Eindeutige Angaben sind in diesem Fall immer zu bevorzugen:

  • Zahlen – “0” bedeutet explizit 0, ”leer” bedeutet “keinen Wert”

  • Text – Es ist in jedem Fall besser, “keine Angaben“, “Grundlagen fehlen“ oder “unbekannt“ einzugeben, als ein Feld einfach leer zu lassen.

Grundsätzlich gilt…

Auch “keine Angaben“ ist eine Angabe!

 


Vorlagen geben Struktur

Damit Geodaten möglichst im gewünschten Format daherkommen, bietet es sich an, eine entsprechende Vorlage aus Logo zu exportieren und mitzuliefern.

Vorgehen:

  1. In eine Ansicht wechseln, in der der gewünschte Objekttyp vorkommt.

  2. Eines oder mehrere Objekte mit der gewünschten Geometrie/den gewünschten Geometrien auswählen.

  3. Über Aufgaben > Geodaten exportieren den Export-Dialog aufrufen.

  4. Im Export-Dialog das gewünschte Geodatenformat, den gewünschten Objekttypen und die benötigten Attribute wählen.

  5. Die ausgewählten Objekte als FDGB oder Shapefile exportieren
    - Bei Shapefiles wird für jeden Geometrietypen ein einzelnes Shapefile erstellt.
    - Zu jedem Shapefile wird eine Excel-Tabelle mitexportiert, welche die genauen Attributbezeichnungen enthält. So lassen sich nicht sprechende Spaltenübschriften im Shapefile eindeutig zuweisen.

  6. (optional) Diese Excel-Tabelle mit den gewünschten Wertebereichen ergänzen.

  7. (optional) Die exportierte Datei in einem GIS-Programm öffnen und die Objekte löschen, damit später nur neu erfasste Objekte enthalten sind.

  8. Die erstellten Vorlagen dokumentieren und zustellen.