Durch Zeitserienanalysen und -vorhersagen werden Beobachtungen aus der Vergangenheit erklärt und in die Zukunft fortgeschrieben. Es gibt verschiedene Möglichkeiten in ArcGIS Pro, Zeitreihen zu analysieren und mit ihrer Hilfe in die Zukunft zu blicken. Wir stellen sie Ihnen anhand von Nationalratswahlresultaten der Schweiz vor.
ArcGIS Pro 2.6 beinhaltet vier neue Werkzeuge im Bereich Zeitserienvorhersage. Anhand bestehender Zeitserien können damit Zeitreihen vorhergesagt werden, in unserem Falle zukünftige Nationalratswahlresultate. Bevor wir aber in die Zukunft schauen, werfen wir einen Blick zurück in die vergangenen Wahlresultate.
Datengrundlage und explorative Analyse
Die folgenden Auswertungen basieren auf einem Datensatz, welcher die Resultate der Nationalratswahlen seit 1975, also 12 Urnengänge, beinhaltet. Wir fokussieren uns bei der Analyse auf die Wahlanteile der größten Schweizer Parteien: SP, SVP, FDP, CVP, GPS, GLP, EVP und BDP.
Um die Frage zu beantworten, wie sich die Wahlresultate über die Zeit verändert haben, eignen sich Raum-Zeit-Analysen. Dabei werden die Ereignisse nicht nur im Raum sondern auch in der zeitlichen Dimension analysiert, woraus sogenannte Space Time Cubes resultieren (Werkzeug „Create Space Time Cubes“). In der folgenden Abbildung werden die Resultate der Nationalratswahlen pro Gemeinde und Jahr in je einem Bin in 3D visualisiert. Anhand der Werkzeuge „Emerging Hot Spot Analysis“ und „Local Outlier Analysis“ können auch Resultate einer HotSpot-Analyse oder einer Outlier-Analyse in 3D dargestellt werden.

Möchte man auf einen Blick sehen, wie sich die Wahlresultate in einer Gemeinde über die Jahre verändert haben, kann man die vorher ausgeführten statistischen Analysen (HotSpot- und Outlier-Analysen) anhand des Werkzeugs „Visualize Space Time Cube 2D“ unter Angabe der entsprechenden Analyse in 2D visualisieren. Die Abbildung 2 zeigt zum Beispiel, in welchen Gemeinden die Grüne Partei Schweiz (GPS) neu erstarkt ist (New Hot Spot), wo sie Stimmen verloren hat oder in welchen Gemeinden sich Hot- und Cold Spots über die Jahre abwechseln (Oscillating Hot Spot).

Nun wollen wir herausfinden, welche Gemeinden einen ähnlichen Verlauf in der Entwicklung der Parteistärke haben. Dafür verwenden wir das Werkzeug „Time Series Clustering“. Unter anderem können wir angeben, wie viele Cluster gebildet werden sollen. Lassen wir diesen Parameter leer, wird die optimale Anzahl Cluster im Prozess evaluiert.

Als Resultat erhalten wir eine Karte aller Gemeinden, welche die Cluster mit ähnlichen Werteverläufen symbolisiert sowie zwei Diagramme. Das eine zeigt die durchschnittliche Parteistärke der einzelnen Cluster, das andere den jeweiligen Medoiden, d.h. die repräsentativste Gemeinde pro Cluster.

Wahlresultate vorhersagen
Jetzt ist es an der Zeit, in die Zukunft zu schauen. Wir wollen herausfinden, wie sich die Parteistärke bei den nächsten Nationalratswahlen pro Gemeinde und Partei ändert. In ArcGIS Pro stehen für die Zeitserien-Vorhersage seit der Version 2.6 vier neue Werkzeuge zur Verfügung:
- Vorhersage mit exponentiellem Glätten (Exponential Smoothing Forecast): verwendet die exponentielle Glättungsmethode nach Holt-Winters, bei welcher Trends und Saisonalität berücksichtigt werden
- Kurvenanpassungsvorhersage (Curve Fit Forecast): verwendet eine vordefinierte oder die optimale Kurvenanpassung (lineare Kurve, exponentielle Kurve, eine Parabel oder eine S-Kurve) und extrapoliert anhand der jeweiligen Gleichung
- Forest-basierte Vorhersage (Forest-based Forecast): verwendet den Random-Forest-Algorithmus, wobei die Zeitserie als erklärende Variable verwendet wird
- Vorhersagen nach Position auswerten (Evaluate Forecasts by Location): wertet die Resultate der verschiedenen Vorhersagen aus und erstellt einen neuen Layer mit der jeweils besten Vorhersage pro Position
In diesem Beispiel verwenden wir als erstes das Werkzeug „Curve Fit Forecast“ und wählen als Input-Datensatz den vorgängig erstellten Space Time Cube der Partei FDP aus. Wir wählen die Parteistärke als zu analysierende Variable und geben vor, dass ein Zeitschritt in die Zukunft prognostiziert werden soll. Als Kurventyp geben wir „Auto-detect“ an, damit die optimale Kurvengleichung im Analyseprozess evaluiert und für die Prognose verwendet wird. Drei Zeitschritte reservieren wir für die Modellvalidierung.

Als Resultat erhalten wir neben einer Karte mit der prognostizierten Parteistärke pro Gemeinde auch ein sehr aussagekräftiges PopUp unter anderem mit den Resultaten zur angewandten Gleichung und dem RMSE (Wurzel der durchschnittlichen quadrierten Differenzen) des Vorhersage- und des Validierungsmodells. In einem Diagramm sind die originalen und die prognostizierten Werte visualisiert.


Auch mit den anderen beiden Werkzeugen und unter Verwendung unterschiedlicher Parameter erstellen wir weitere Prognosen zur Parteistärke.
Dem Werkzeug „Evaluate Forecasts by Location“ übergeben wir nun alle erstellten Vorhersage-Layer, welches dann anhand der Auswertung der Validierungs-RMSE die beste Vorhersage in eine neue Feature Class schreibt. Diese enthält neben der zukünftigen Parteistärke auch die Information zum verwendeten Algorithmus und kann entsprechend symbolisiert werden.



Im PopUp wird das Ergebnis der besten Methode visualisiert. Zusätzlich können die Resultate der anderen Methoden eingeblendet und so miteinander verglichen werden. In der folgenden Abbildung hat die Kurvenanpassungsvorhersage die besten Resultate geliefert. Die Prognosen der beiden Forest-based-Durchläufe und dem exponentiellen Glätten können durch Anwählen ebenfalls visualisiert werden.

Fazit
Die drei Werkzeuge zur Prognose von Zeitserien verwenden unterschiedliche Algorithmen. Bei der Kurvenanpassungsvorhersage handelt es sich um die einfachste der drei Methoden. Sie ist besonders effektiv, wenn die Zeitserie einen Trend, aber keine Saisonalität aufweist. Die Methode des exponentiellen Glättens ist eine etablierte und gut untersuchte Methode für die Vorhersage von Zeitserien. Sie eignet sich am besten, wenn die Zeitserie einem Trend folgt und saisonalen Schwankungen unterliegt. Beim Random-Forest-Algorithmus, welcher in der Forest-basierten Vorhersage integriert ist, handelt es sich -verglichen mit den anderen beiden- um den komplexesten Algorithmus. Er wird besonders empfohlen, wenn es sich um schwer vorhersehbare Zeitserien handelt, welche mit mathematischen Funktionen schwierig zu modellieren sind.
Besonders praktisch ist, dass Sie anhand der unterschiedlichen Methoden -unter Auswahl von verschiedenen Parametern- mehrere Prognosen erstellen und das beste Resultat evaluieren können.
Bei der Interpretation der Resultate ist aber immer im Hinterkopf zu behalten, dass Wahlresultate von vielen soziodemographischen und ökonomischen Faktoren abhängig sind. Mit den hier vorgestellten Werkzeugen haben wir eine Prognose rein anhand bestehender Wahlresultate gewagt, unabhängig von weiteren beeinflussenden Faktoren. Diese Prämisse gilt auch für die Zeitserienvorhersage in anderen Bereichen und muss immer mitberücksichtigt werden.
Lizenzierung
Die Werkzeuge sind in der Toolbox „Space Time Pattern Mining“ zu finden und mit einer ArcGIS Pro Basic Lizenz verfügbar.
Weitere Informationen zum Thema
Predictive Analysis: Mietpreise vorhersagen mit ArcGIS
Funktionsweise der Forest-basierten Vorhersage
Funktionsweise der Kurvenanpassungsvorhersage