Diese Seite enthält Tipps für den Umgang mit Shapefiles, die in Logo importiert oder synchronisiert werden sollen.
Grundsätzliches zu Shapefiles
Shapefiles …
Enthalten immer Vektorendaten, keine Rasterdaten
Können immer nur Objekte eines Geomtrietyps enthalten, also entweder Punkte, Linien oder Flächen
Setzen sich aus mehreren Dateien zusammen, nicht alle sind allerdings zwingend:
*.shp – Enthält die Geometriedaten der geographischen Objekte (zwingend)
*.shx – Enthält den Index der geographischen Objekte (zwingend)
*.dbf – dBase-Tabelle mit den Attributen der geographischen Objekte (zwingend)
*.prj – Beinhaltet Angaben zum Koordinatensystem der geographischen Objekte (nicht zwingend, aber hilfreich)
*.xml – Beinhaltet Metadaten zum Shapefile (nicht zwingend)
*.cpg – Beinhaltet Angaben zum verwendeten Zeichensatz (nicht zwingend, hilfreich bei Umlauten)
Spaltenbezeichnungen sind auf 10 Zeichen begrenzt
Shapefiles für Logo
Damit der Import von Shapefiles in Logo möglichst effizient und fehlerlos läuft, sollten folgende Punkte beim Erstellen von Shapefiles beachtet werden.
Die drei wichtigsten Fragen
Welche Art von Geometrien soll das Shapefile enthalten?
Welche Attribute soll das Shapefile enthalten?
Welche Art von Werten (field type) und welcher Werteumfang werden vorausgesetzt?
Geometrien
In Logo ist für jeden Objekttyp definiert, welche Geometrietypen zulässig sind. Grünflächen und Bauwerke können als Punkte, Linien oder Flächen erfasst werden. Fahrzeugrückhaltesysteme müssen Linien sein und für Fussgängerstreifen sind nur Punkte zulässig. Gewisse Objekttypen können zudem Multi-Part-Geometrien haben, andere nicht.
Bezüglich Geometrien gilt:
Objekte sollen von Beginn weg im korrekten Geometrietyp erfasst werden.
Kommen Objekte in unterschiedlichen Geometrietypen vor, müssen diese in separaten Shapefiles gespeichert werden.
Attribute
Auch die Attribute sind für alle Objekttypen in Logo vordefiniert. Das heisst es ist festgelegt, welche Attribute abgefüllt werden können und in welchem Feldtyp die Werte gespeichert werden. Logo setzt mit Ausnahme des Objekttyps keine zwingenden Attribute voraus, es können aber vom Datenherr notwendige Attribute definiert werden.
Da Spaltenüberschriften in Shapefiles auf 10 Zeichen beschränkt sind, werden zu lange Beschriftungen automatisch gekürzt. Dies kann dazu führen, dass die Unterscheidbarkeit wie im folgenden Beispiel verloren geht:
Bauwerksbezeichnung → BAUWERKSBE
Bauwerksbeschaffenheit → BAUWERKS02
Bauwerkstyp → BAUWERKS03
Bezüglich Attribute gilt:
Es soll von Beginn weg klar sein, welche Attribute geliefert werden müssen.
Die Attribute sollen im Shapefile eindeutige Spaltenüberschriften haben.
Es ist oft sehr aufwändig oder unmöglich, nachträglich Attribute nachzuerfassen, deshalb lohnt es sich, vor der Datenerhebung genau zu überlegen, welche Informationen erforderlich sind. Als Gedankenstütze sollten folgende Informationsbereiche in Betracht gezogen werden:
Objektbeschreibung – Welche Attribute sind notwendig, um ein Objekt ausreichend zu beschreiben? Wie lässt sich ein Objekt eindeutig benennen?
Achsreferenz – Hat ein Objekt einen Bezug zu einer Achse (Strassen in Logo)? Falls ja, wie wird diese Achse identifiziert?
Zeitpunkte und Zeiträume – Wann wurde ein Objekt in der Realität gebaut? Wann instandgestellt? Gibt es Garantiefristen?
Besitzverhältnisse und Zuständigkeiten – Wer ist Eigentümer des Objektes? Wer ist zuständig für den Unterhalt?
Metadaten – Auf welcher Datengrundlage wurden die Objekte erfasst? Mit welcher Genauigkeit? Wie aktuell sind die Daten und wann sollten sie aktualisiert werden?
Identifikation über Systemgrenzen hinweg – Soll das digitale Abbild des Objektes (z.B. Objekt in Logo) eindeutig identifizierbar sein? Müssen Informationen synchronisierbar sein? Was wird für Schnittstellen zwischen verschiedenen Systemen benötigt?
Feldtypen und Wertebereich
In Bezug auf ein einzelnes Attribut stellt sich noch die Frage, welche Werte zulässig sind und in welcher Form sie daherkommen.
Bezüglich Feldtypen und Wertebereiche gilt:
Die Antworten auf folgende Fragen sollen von Beginn weg klar sein.
Ist ein Attribut zwingend?
In welchem Feldtyp müssen Werte geliefert werden? (Format)
Welche Werte sind zulässig? (Wertebereich)
Null und leer?
Feldtypen
In Logo kommen die folgenden Feldtypen vor:
Zeichenkette (string) – Freier Text, der auch Zahlen und Sonderzeichen enthalten darf. Nur eingeschränkt in der Anzahl Zeichen.
Ganzzahl (integer) – Ganzzahl, auf eine bestimmte Anzahl Ziffern beschränkt.
Fliesskommazahl (float) – Kommazahl, auf eine bestimmte Anzahl Ziffern und Stellen nach dem Komma beschränkt.
Katalog – Der Werteumfang wird entweder im zugehörigen Textkatalog festgelegt oder ist fix definiert (z.B. Ja/Nein).
Datum – Datum im Datumsformat
Zeit – Zeitstempel im Zeitformat
Jahr – Muss eine Jahreszahl enthalten (Spezialfall von Ganzzahl)
Die Umwandlung zwischen verschiedenen Feldtypen ist nicht immer trivial, deshalb sollten die Feldtypen von Anfang an sinnvoll gewählt werden.
Ein Datum kann beispielsweise als Zeichenkette, als Ganzzahl oder aber im Datumsformat gespeichert werden. Für einen Menschen mag dies keine grosse Rolle spielen, für einen Computer ist der Unterschied allerdings wesentlich:
1. Januar 2023 → Zeichenketten lassen sich nicht nach Datum sortieren und können nicht für Rechenoperationen verwendet werden.
01012023 → Rechenoperationen mit Datumszahlen sind ebenfalls meist nicht sinnvoll
01.01.2023 → Mit Werten im Datumsformat können Rechenoperationen durchgeführt werden und Falschinterpretationen sind ausgeschlossen.
(wie das Datumsformat dargestellt wird, lässt sich oft einstellen)
Wertebereiche
Neben dem Feldtyp spielt auch der Wertebereich eine Rolle. Je eingeschränkter der Wertebereich ist, desto einfacher ist die Plausibilitätskontrolle. Die Erfahrung hat gezeigt, dass die Genauigkeit der Daten mit zunehmender Einschränkung des Wertebereiches zunimmt. Der Interpretationsspielraum nimmt durch Einschränkung ab und Fehler fallen schneller auf.
Grundsätzlich gilt…
So eingeschränkt wie möglich, so frei wie nötig!
Bauwerke können auf unterschiedliche Arten typisiert werden:
Freie Zeichenkette → Sehr flexibel, aber fehleranfällig und uneinheitlich
Katalog mit vorgegeben Werten → Eindeutig, aber unflexibel
Katalog mit freien Werten → nicht ganz eindeutig, aber flexibel und wahrscheinlich am besten geeignet
Null und leer
Zu guter letzt stellt sich noch die Frage nach den leeren Werten. Bei leeren Werten stellt sich oft die Frage, ob die Angaben fehlen oder explizit leer sind. Eindeutige Angaben sind in diesem Fall immer zu bevorzugen:
Zahlen – “0” bedeutet explizit 0, ”leer” bedeutet “keinen Wert” (in Shapefiles steht in leeren Zellen immer Null).
Text – Es ist in jedem Fall besser, “keine Angaben“, “Grundlagen fehlen“ oder “unbekannt“ einzugeben, als ein Feld einfach leer zu lassen.
Grundsätzlich gilt…
Auch “keine Angaben“ ist eine Angabe!
Vorlagen geben Struktur
Damit Shapefiles möglichst im gewünschten Format daherkommen, bietet es sich an, ein entsprechendes Shapefile aus Logo zu exportieren und als Vorlage mitzuliefern.
Vorgehen:
In eine Ansicht wechseln, in der der gewünschte Objekttyp vorkommt.
Eines oder mehrere Objekte mit der gewünschten Geometrie/den gewünschten Geometrien auswählen.
Über Aufgaben > Geodaten exportieren den Export-Dialog aufrufen.
Im Export-Dialog den gewünschten Objekttypen und die benötigten Attribute wählen.
Die ausgewählten Objekte als Shapefile exportieren (es wird ein Shapefile pro Geometrietyp exportiert).
Zu jedem Shapefile wird eine Excel-Tabelle mitexportiert, welche die genauen Attributbezeichnungen enthält. So lassen sich nicht sprechende Spaltenübschriften im Shapefile eindeutig zuweisen.
(optional) Diese Excel-Tabelle mit den gewünschten Wertebereichen ergänzen.
(optional) Die Shapefiles in einem GIS-Programm öffnen und die Objekte löschen, damit später nur neu erfasste Objekte enthalten sind.
Die erstellten Vorlagen dokumentieren und zustellen.
Add Comment