Die Machine Learning Algorithmen in ArcGIS Pro gruppieren wir grob in die drei Kategorien: Regression, Klassifizierung und Cluster-Bildung. In diesem Beitrag stellen wir Ihnen verschiedene Clusteranalysen von Objekten vor.
Bei der Cluster-Bildung geht es um das Gruppieren von Objekten. ArcGIS Pro stellt Werkzeuge für die räumliche Cluster-Bildung, für die attribut-basierte Cluster-Bildung und für eine Kombination dieser beiden Anforderungen, die räumlich eingeschränkte Cluster-Bildung, zur Verfügung. Wir schauen uns nun je ein Beispiel an.
Räumliche Cluster-Bildung
Mit der räumlichen Cluster-Bildung kann beispielsweise die Frage beantwortet werden: Wo häufen sich bestimmte Ereignisse beispielsweise Unfälle oder Einbrüche? In der Abbildung 1 sind die Straßenverkehrsunfälle in der Schweiz der Jahre 2011 bis 2021 visualisiert. Wir möchten herausfinden, an welchen Kreuzungen sich diese häufen, um dort Maßnahmen zur Prävention umsetzen zu können. Eine visuelle Analyse ist bei dieser Menge an Informationen nicht zielführend, deshalb verwenden wir das Werkzeug Density-based Clustering mit dem dbscan-Algorithmus. Dieser Algorithmus ist besonders dafür geeignet, kleinräumige Phänomene zu identifizieren, die immer dieselbe Dichte haben.




Im Werkzeug Density-based Clustering sind des Weiteren die Algorithmen hdbscan und optics verfügbar, die bei einem Phänomen mit variierender Dichte Vorteile bieten.
Attribut-basierte Cluster-Bildung
In einem anderen Anwendungsfall beschäftigen wir uns mit den Resultaten der letzten Nationalratswahlen der Schweiz, denn sie sind ein guter Proxy für eine Marktanalyse. Wir wollen herausfinden, welche Gemeinden sich bezüglich ihrer politischen Ausrichtung, bezogen auf die Parteistärken, ähnlich sind.

Auch hier ist eine visuelle Interpretation schwierig, weshalb wir das Werkzeug Multivariate Clustering für die Analyse verwenden. Dieses Werkzeug gruppiert Objekte basierend auf ihren Attributwerten. Die Position der Objekte wird nicht berücksichtigt. Wir verwenden den kmeans-Algorithmus, welcher eine Lösung sucht, bei der die Objekte in einem Cluster sich möglichst ähnlich sind und die Cluster untereinander möglichst unterschiedlich.
Als Resultat wird eine Karte erstellt, in der jede Gemeinde einem Cluster zugeordnet wird. In einem ersten Schritt können so räumliche Muster erkannt werden. Da die Zuordnung zu einem Cluster an sich noch nicht sehr aussagekräftig ist, wird im Analyseprozess zusätzlich ein Box-Plot erstellt. So können die Charakteristiken der einzelnen Cluster untersucht werden.

Daraus ist zum Beispiel ersichtlich, dass die Parteistärke der CVP im orangen Cluster überdurchschnittlich hoch ist, die Parteistärke der SVP im Durchschnitt liegt und alle weiteren Parteien unterdurchschnittlich vertreten sind.
Räumlich eingeschränkte multivariate Cluster-Bildung
Die letzten beiden Beispiele haben gezeigt, wie wir Objekte räumlich oder attribut-basiert gruppieren können. Nun kann man diese beiden Ansätze auch kombinieren, das heißt die Objekte attribut-basiert gruppieren mit der Einschränkung, dass sie räumlich zusammenhängend sind. Dies führt uns zu der nicht ganz ernst gemeinten Frage, wie die Kantonsgrenzen denn verlaufen würden, wenn die politische Gesinnung ausschlaggebend wäre.
Um diese letzte Frage zu beantworten, verwenden wir das Werkzeug Spatially Constrained Multivariate Clustering. Wie es also aussieht, wenn ein Algorithmus die Kantonsgrenzen zieht, sehen wir in dieser Abbildung:

Bei der Interpretation der Resultate ist zu berücksichtigen, dass das Ergebnis einer attribut-basierten Clusteranalyse natürlich nicht gleich gut ist, wenn eine räumliche Einschränkung besteht. Die räumliche Einschränkung, dass Objekte zusammenhängend sein müssen, verunschärft in den meisten Fällen das Resultat einer attribut-basierten Cluster-Bildung.
Lizenzierung
Die hier vorgestellten Werkzeuge sind in der Spatial Statistics Toolbox integriert und mit einer ArcGIS Pro Basic Lizenz verfügbar.
