Um bei großen Datenmengen nicht den Überblick zu verlieren, sind explorative räumliche Datenanalysen ein wertvolles Mittel. Stefan Vienken verrät uns im Interview, was sie so spannend macht.
Kennen Sie das? Manchmal sieht man den Wald vor lauter Bäumen nicht. Wer viel mit großen Datenmengen zu tun hat, dem kommt das Sprichwort vielleicht öfter in den Sinn, als es ihm oder ihr lieb ist. Um den Überblick nicht zu verlieren, sind explorative räumliche Datenanalysen ein gutes Mittel. Mit Apps wie ArcGIS Insights ist es möglich, schnell und genau diesen Überblick zu gewinnen, um die richtigen Fragen stellen zu können. Nur so lässt sich das volle Potential der Daten effektiv nutzen.
Stefan Vienken, Head of Sales Engineering, beschäftigt sich schon lange mit dem Thema der explorativen räumlichen Datenanalyse (ESDA ‚Exploratory Spatial Data Analysis). Im Interview erklärt er, was es genau damit auf sich hat.
Stefan, was macht für dich das Thema explorative räumliche Datenanalyse so spannend?
Der Mensch ist visuell und räumlich orientiert, so denken und sehen wir seit jeher. Aus Daten und Tabellen die Essenz zu ziehen, ist das eine; besonders spannend finde ich aber, neue Erkenntnisse und Zusammenhänge unter Berücksichtigung des Raumbezugs zu erkennen. Die Hypothesen aufgrund der räumlichen Verteilung zu finden und typische und atypische räumliche Muster zu entdecken – das ist das Salz in der (Datenanalyse-) Suppe!
Um die zwei Grundbegriffe zu klären: was macht die explorative Datenanalyse im Gegensatz zur rein deskriptiven Analyse?
Die deskriptive Datenanalyse betrachtet zumeist die gesamte Datenmenge und beschreibt deren Merkmalsausprägungen. Das Ziel ist hier, sich einen Überblick über umfangreiche Datenbestände zu verschaffen, und die Ergebnisse grafisch oder tabellarisch darzustellen.
Dem gegenüber verfolgt die explorative Datenanalyse einen anderen methodischen Ansatz: Hier möchte man in den Daten verborgene Muster, Auffälligkeiten oder Strukturen erkennen. Wir explorieren – also erkunden – die Daten und gewinnen Informationen, die Sie bei der einfachen Betrachtung der deskriptiven Analyse nicht gesehen hätten. Hierzu verwenden wir geeignete grafische Darstellungen: zum Beispiel Balkendiagramme, Boxplots, Streudiagramme oder raum-zeitliche Darstellungen wie Data Clocks. Es sind aber auch Berechnungen wie Korrelation und Regression möglich.
Das Defizit bei beiden Ansätzen liegt häufig in der Vernachlässigung des räumlichen Bezugs. Daher bevorzuge ich eindeutig die explorative räumliche (!) Datenanalyse.
Welchen Stellenwert hat die explorative räumliche Datenanalyse in der heutigen Zeit?
Neulich erinnerte ich mich an eine Diplomarbeit vom Juli 2002 am Institut für Geoinformatik (IfGI) Münster „Konzeption und prototypische Entwicklung von ArcGIS-Werkzeugen zur explorativen Analyse raumbezogener Daten“. Das war zufälligerweise meine Diplomarbeit (lacht).
Auch damals war schon die große Bedeutung der ESDA offensichtlich, wo noch niemand erahnen konnte, mit welchen Datenmengen wir es nun im Big Data-Zeitalter zu tun haben. Es wird also immer wichtiger und tatsächlich notwendiger, sich der Methoden der ESDA zu bedienen. Wie sonst sollte man den Überblick über die großen Datenmengen bekommen, und verborgene räumliche Zusammenhänge erkennen können?
Mein Lieblingszitat, das ich im Zuge meiner Diplomarbeit gelesen habe, hat immer noch Relevanz:
“You are the owner of some numerical data which, you feel, is hiding some fundamental relation which could be exploited to your advantage, perhaps for business or merely for pleasure. You then glance at some visual presentation of that data and exclaim ‘Ah ha’! -now I understand!”
Robert Spence (Information Visualization, 2001)
Was bietet Esri zur explorativen räumlichen Datenanalyse?
In ArcGIS Pro gibt es neben zahlreichen Tools zur Analyse der räumlichen Verteilung eine spezielle Toolbar „Explore Data“, die mit dem Geostatistical Analyst verfügbar ist.
Für weitere flexible Analysen und auch zur Sicherstellung der Datenqualität (Data Cleansing) haben wir auch im Desktop-Bereich eine Extension für ArcGIS Pro, den Smart Data Analyser.
Eine sehr flexibel einsetzbare Web-App zur ESDA ist ArcGIS Insights. Hier können unterschiedliche Datenquellen eingebunden, analysiert und die Ergebnisse direkt geteilt werden. Und das Ganze funktioniert ohne nennenswerten Einarbeitungsaufwand, einfach per Drag & Drop.
Für wen ist ArcGIS Insights?
Eigentlich für jede Person, die mit Datensätzen arbeitet, die mehr als einhundert Features und einige zu analysierende Kennzahlen beinhalten. Sie können mit ArcGIS Insights so unglaublich einfach Daten analysieren – ob Sie sich die Verteilung einer Kennzahl als Balkendiagramm anzeigen lassen, oder räumliche Analysen wie Punkt-in-Polygon durchführen möchten – alles geht mit wenigen Mausklicks und Drag & Drop. Natürlich sind auch viele andere Filteroperationen möglich. Wer tief einsteigen möchte, kann auch die R- oder Python-Integration nutzen.
Welche Bereitstellungsoptionen von ArcGIS Insights gibt es?
Hier ist quasi für jede und jeden etwas dabei. Haben Sie Ihre Daten bereits in ArcGIS Online gespeichert oder sind Sie SaaS-affin? Dann starten Sie direkt mit ArcGIS Insights auf ArcGIS Online. Haben Sie das ArcGIS-System On-Premises laufen, also ArcGIS Enterprise? Auch hier gibt es eine direkte Integration ins Portal. Mit ArcGIS Insights Desktop ist eine weitere Variante verfügbar, die Sie auf Ihrem lokalen Rechner und offline nutzen können. Natürlich verschmelzen auch hier die Grenzen in der Anwendung. So kann man beispielsweise in ArcGIS Insights als Online-App lokale Daten vom eigenen Rechner nutzen. Das ideale Anwendungsszenario ist immer abhängig von der individuellen Situation, aber- ich wiederhole mich da gern – für jeden ist etwas dabei!
Wie erfahre ich mehr über ArcGIS Insights und kann ich das auch selbst ausprobieren?
Wir werden in den kommenden Tagen einiges an Material bereitstellen: Kurzvideos, Use Cases, Blogartikel. Ein guter Startpunkt ist dieses E-Book, das einen ersten Einblick in die Materie der explorativen räumlichen Datenanalyse und das Thema Location Analytics im Allgemeinen gibt. Ich kann die Leser*innen nur einladen, sich hier jeweils kurz Zeit zu nehmen und uns auf dem Weg durch die Materialien zu begleiten. Aus meiner Sicht werden die Möglichkeiten der explorativen visuellen räumlichen Datenanalyse nach wie vor erheblich unterschätzt. Was sie mit ArcGIS Insights in wenigen Klicks herausfinden können, und welche Möglichkeiten der Datenpräsentation es gibt, ist vielen gar nicht bekannt.