Aurora: AI-Modell soll Wetter, Wirbelstürme und Luftqualität besser vorhersagen

Forscher von Microsoft Research, der University of Cambridge und anderen renommierten Institutionen haben heute ein bahnbrechendes KI-Modell namens Aurora vorgestellt. Dieses Modell stellt einen bedeutenden Fortschritt in der Erdbeobachtung und Vorhersage von Umweltphänomenen dar und könnte die Art und Weise, wie wir Wetter, Luftqualität und Meeresströmungen vorhersagen, grundlegend verändern.
Das Besondere aus österreichischer Sicht: An dem AI-Modell hat KI-Wissenschaftler und Startup-Gründer Johannes Brandstetter von der Linzer Johannes Kepler Universität mitgearbeitet. Er war früher bei Microsoft tätig, bevor er nach Österreich zurückkam, um hier Emmi AI zu gründen. Emmi AI ist wie berichtet im Bereich von KI-Simulationen tätig und hat dieses Jahr 15 Millionen Euro Investment erhalten.
Aurora geht in dem Fall aber nicht auf das Konto von Emmi AI, sondern von Microsoft Research und Partnerunversitäten wie der JKU, Alan Turing Institute, Cambridge, der University of Amsterdam und einigen weiteren Forschungspartnern.
“Foundation Model” für das Erdsystem
Aurora ist ein sogenanntes “Foundation Model” für das Erdsystem – ein KI-Modell mit 1,3 Milliarden Parametern, das auf mehr als einer Million Stunden diverser geophysikalischer Daten trainiert wurde. Das Modell besteht aus drei Hauptkomponenten: einem Encoder, der heterogene Eingaben in eine universelle dreidimensionale Darstellung umwandelt, einem Prozessor, der diese Darstellung zeitlich weiterentwickelt, und einem Decoder, der die Ergebnisse wieder in physikalische Vorhersagen übersetzt.
Die Architektur basiert auf einem 3D Swin Transformer mit Perceiver-basierten Modulen für Encoder und Decoder. Diese Struktur ermöglicht es Aurora, mit unterschiedlichen räumlichen Auflösungen, Druckniveaus und Variablen zu arbeiten.
Die Fähigkeiten von Aurora
Aurora übertrifft bestehende operative Vorhersagesysteme in mehreren kritischen Bereichen:
- Luftqualität und atmosphärische Chemie: Aurora kann 5-Tage-Vorhersagen für globale Luftverschmutzung mit einer Auflösung von 0,4° erstellen und übertrifft dabei rechenintensive numerische atmosphärische Chemiesimulationen bei 74% der Zielwerte. Das Modell kann wichtige Luftschadstoffe wie Kohlenmonoxid (CO), Stickoxide (NO, NO₂), Schwefeldioxid (SO₂), Ozon (O₃) und Feinstaub (PM₁, PM₂,₅, PM₁₀) präzise vorhersagen.
- Ozeanwellen: Aurora liefert 10-Tage-Vorhersagen für globale Ozeanwellen mit einer Auflösung von 0,25° und übertrifft dabei kostspielige numerische Modelle bei 86% der Zielwerte. Es kann wichtige Variablen wie signifikante Wellenhöhe, mittlere Wellenperiode und mittlere Wellenrichtung präzise vorhersagen.
- Tropische Wirbelstürme: Bei der Vorhersage von Zugbahnen tropischer Wirbelstürme über 5 Tage übertrifft Aurora sieben operative Vorhersagezentren bei 100% der Zielwerte. Dies ist besonders bemerkenswert, da es das erste Mal ist, dass ein maschinelles Lernmodell vollständige operative Vorhersagen für tropische Wirbelstürme über einen Zeitraum von bis zu 5 Tagen übertrifft.
- Hochauflösende Wettervorhersagen: Aurora erstellt 10-Tage-Vorhersagen für globales Wetter mit einer Auflösung von 0,1° und übertrifft dabei modernste numerische Modelle bei 92% der Zielwerte, während es gleichzeitig die Vorhersage extremer Ereignisse verbessert.
Vorteile gegenüber herkömmlichen Modellen
Der größte Vorteil von Aurora liegt in seiner Recheneffizienz. Während herkömmliche Erdbeobachtungsmodelle spezielle Supercomputer und dedizierte Ingenieurteams für die Wartung benötigen, kann Aurora seine Vorhersagen mit einem Bruchteil der Rechenleistung erstellen. Beispielsweise generiert Aurora Luftqualitätsvorhersagen in etwa 0,6 Sekunden pro Stunde Vorhersagezeit auf einer einzelnen A100 GPU – eine etwa 100.000-fache Beschleunigung gegenüber dem CAMS-System.
Diese Effizienz könnte den Zugang zu hochwertigen Klima- und Wetterinformationen demokratisieren, insbesondere für Regionen und Organisationen mit begrenzten Ressourcen.
Grenzen und Herausforderungen
Trotz seiner beeindruckenden Leistungen hat Aurora auch Grenzen:
- Datenabhängigkeit: Die Qualität der Vorhersagen hängt stark von der Qualität und Menge der Trainingsdaten ab. Bei der Vorhersage der atmosphärischen Zusammensetzung war die Leistung durch die begrenzte zeitliche Ausdehnung des CAMS-Analysedatensatzes eingeschränkt.
- Komplexe Phänomene: Bei bestimmten Variablen, wie Ozon in der oberen Atmosphäre, übertrifft das herkömmliche CAMS-System Aurora noch. Auch bei der 12-Stunden-Vorhersage aller Spezies im unteren Teil der Atmosphäre ist CAMS noch überlegen.
- Fehlende Daten: Bei der Ozeanwellenmodellierung musste Aurora erweitert werden, um fehlende Daten zu unterstützen, da HRES-WAM-Variablen über Land und über Ozeanen, wenn Meereis vorhanden ist, undefiniert sind.
- Extreme Ereignisse: Obwohl Aurora bei der Vorhersage extremer Ereignisse wie Sandstürmen und Taifunen gute Ergebnisse erzielt, bleibt die zuverlässige Vorhersage solcher Ereignisse eine Herausforderung aufgrund ihrer Seltenheit und Komplexität.
Zukunftsperspektiven
Aurora repräsentiert einen bedeutenden Schritt in Richtung effizienterer und genauerer Erdbeobachtung und -vorhersage. Das Modell zeigt, dass KI-basierte Ansätze nicht nur mit traditionellen numerischen Modellen konkurrieren können, sondern diese in vielen Fällen sogar übertreffen können – bei gleichzeitig drastisch reduziertem Rechenaufwand.
Die Fähigkeit, auf neue Aufgaben mit begrenzten Daten feinabgestimmt zu werden, macht Aurora besonders vielversprechend für eine breite Palette von Anwendungen, von der Katastrophenvorsorge bis hin zur Unterstützung von Entscheidungen in Landwirtschaft, Gesundheitswesen und globalem Handel.