Importe verwalten
Überblick
Hier werden zunächst kurz die drei wichtigsten Begriffe für Dinge im Importer erläutert: Ordner, Datenblobs und Quelltabellen.
Ordner: Schubladen für Daten
Ordner sind rein optional und funktionieren wie Ordner in einer Dateiablage:
- Man kann sie benennen, um eine Ordnung herzustellen,
- Man kann Dokumente (hier Datenblobs) in ihnen sammeln,
- Man kann Ordner in Ordner verschieben und eine beliebig tiefe Ordnersystematik aufbauen.
- Löscht man den Ordner, ist sein ganzer Inhalt gelöscht.
Ordner kommen auf zweierlei Art und Weise zustande
- Durch manuelles Anlegen: siehe Anleitung unten.
- Durch den Rohdatenimport: werden anstatt einzelner Dokumente ganze Sammlungen von Dokumenten auf einmal importiert (z.B. ein zip-komprimierter Ordner wird hochgeladen), dann versucht der Importer, die ursprüngliche Struktur der Dokumente nachzubilden, indem er nicht nur für jedes Dokument einen Datenblob erzeugt, sondern zusätzlich auch Ordner anlegt und diese ineinander verschachtelt.
Ordner lassen sich jederzeit manuell definieren:
Quelle mit dem neuen Datensatz:
Über den Knopf "Verschieben" können Datenblobs und zugehörige Quelltabellen in einen Datensatz verschoben, oder aus diesem gelöst werden:
Die Orientierung ist über ein Breadcrumb-Menü gegeben:
Datenblobs: Repräsentanter einzelner Datensätze
Datenblobs stellen eine nicht weiter auftrennbare Sammlung von Daten dar, z.B. ein Shapefile, ein CSV-Dokument, ein Layer in einem GIS. Jeder Datenblob steht für sich, kann einzeln weiter bearbeitet werden.
Wie sie entstehen: Bei jedem Import analysiert Simplex4Data die Rohdaten und identifiziert Datenblobs in ihnen. Je nach Beschaffenheit der Rohdaten können dabei eine ganze Menge an Datenblobs entstehen. Der Import eines OGC API Features-Dienstes mittels einer einzigen URL kann dutzende Datenblobs (die einzelnen Collections) erzeugen, ebenso das Hochladen eines gezippten Ordners voller Shapefiles.
Quelltabellen: Interpretationen eines Datenblobs
Während Datenblobs die Rohdaten, wie sie Simplex4Data übergeben werden, repräsentieren, sind Quelltabellen das abschließende Ergebnis eines Imports: Aus dem Datenblob ist eine flache Tabelle in der Datenbank geworden, die nun für Konvertierungen zur Verfügung steht. Während Datenblobs sehr unterschiedliche Formate und Modalitäten (Dienst, statisches Dokument usw.) haben können, sind alle Quelltabellen Tabellen in der Datenbank. Auf diese Weise ist die Vielfalt und Komplexität der Rohdaten vereinheitlicht, die Konvertierung kann sich ganz auf die Dateninhalte konzentrieren.
Eine Quelltabelle ist selten "exakt" der Inhalt eines Datenblobs. Es gibt eine Reihe von Konfigurationsoptionen, die händisch oder automatisiert eingetragen werden, z.B.:
- Wie sollen die Spalten der Quelltabelle heißen?
- Welche Spalten soll die Quelltabelle haben und aus welchen Informationsbestandteilen des Datenblobs ergeben sie sich?
Demenstprechend können aus einem einzigen Datenblob auch mehre Quelltabellen generiert werden.
Wie sie entstehen: wird ein Datenblob händisch oder automatisiert importiert, entsteht eine Quelltabelle. Details zu ihrer Generierung sind auf der Seite zum Laden der Daten in Quelltabellen zu finden.
Elemente beschreiben
Über den Knopf "bearbeiten" können Objekte beschrieben werden bzw, vorhandene Beschreibungen geändert werden. Besonders wichtig sind die Felder
- Name
- Beschreibung (eher kurze Erläuterung)
- Kommentar (beliebig lange Erläuterung, Links, ... )
Elemente organisieren
Wie beschrieben, sind Ordner das Hauptelement der Organisation: Sie können beliebig angelegt, gelöscht (s.u.) und verschachtelt werden.
Noch über den Ordnern sind die Quellen als Organisationseinheiten angelegt. Es können jederzeit weitere Quellen definiert werden, wenn es sinnvoll erscheint.
Elemente Löschen
Alle drei Elemente (Quelltabellen, Datenblobs und Ordner) können gelöscht werden und sind dann unwiederbringlich entfernt.
Dabei ist zu beachten, dass jeweils alle untergeordneten Elemente mitgelöscht werden.
Das hat für die unterschiedlichen Elemente folgende Konsequenzen:
- Quelltabellen: keine weiteren Elemente werden mitgelöscht.
- Datenblobs: alle daraus abgeleiteten Quelltabellen werden mitgelöscht.
- Ordner: alle darin befindlichen Datenblobs sowie alle daraus abgeleiteten Quelltabellen werden mitgelöscht.