
Ultimi sviluppi su previsioni meteo e machine learning
Il cambiamento climatico ha reso le previsioni meteorologiche più cruciali che mai per prendere decisioni rapide e mirate. Durante l’estate 2023 ho analizzato come l’Intelligenza Artificiale voglia rivoluzionare questo campo e settimana scorsa, un paper pubblicato su Nature che ha presentato GenCast, mi da l’occasione per tornare sull’argomento.
Tradizionalmente, le previsioni meteo si basano su modelli di previsione di tipo Numerical Weather Prediction (NWP), che simulano l’atmosfera attraverso equazioni fisiche. Negli ultimi anni, i modelli di tipo Machine Learning-based Weather Prediction (MLWP) hanno dimostrato di poter ridurre l’errore rispetto a singole simulazioni NWP, ma si sono concentrati soprattutto su previsioni deterministiche, cioè singoli scenari, senza rappresentare adeguatamente l’incertezza o il rischio.
GenCast rappresenta un’evoluzione significativa rispetto a GraphCast, un modello sviluppato da Google solo lo scorso anno e che ha dimostrato l’efficacia del machine learning nelle previsioni meteorologiche deterministiche, essendo in grado di generare previsioni con un orizzonte di 10 giorni. Tuttavia, GraphCast si concentrava su previsioni singole e non affrontava il problema della modellazione probabilistica, ossia la capacità di rappresentare l’incertezza attraverso un insieme di scenari plausibili. GenCast compie questo passo integrando diffusion model per generare previsioni probabilistiche realistiche e dettagliate, rendendolo uno strumento più avanzato per la gestione dei rischi e delle incertezze meteorologiche.
GenCast si basa su avanzate tecniche di apprendimento automatico e sull’utilizzo di modelli probabilistici autoregressivi. A differenza dei metodi tradizionali, GenCast non produce un’unica previsione, ma un insieme di scenari realistici che rappresentano diverse possibilità per l’evoluzione delle condizioni atmosferiche. Questo è reso possibile grazie a modelli generativi di tipo diffusion model, che simulano il processo con cui le incertezze nelle condizioni iniziali si propagano nel tempo.
GenCast è stato addestrato su decenni di dati storici meteorologici, a partire dal 1979, e utilizza queste serie storiche per imparare le dinamiche atmosferiche sia su scala globale che locale. Con una risoluzione spaziale di 0,25° (equivalente a circa 25 chilometri quadrati), offre una rappresentazione precisa dei fenomeni meteorologici mantenendo alti livelli di dettaglio.
I diffusion model sono particolarmente adatti a catturare la complessità e la variabilità dei fenomeni atmosferici, generando previsioni dettagliate e realistiche passo dopo passo. Questo approccio consente di affrontare il problema del blurring delle previsioni, comune nei modelli tradizionali di machine learning, restituendo traiettorie meteorologiche più affidabili.
Confrontato con il modello operativo più avanzato al mondo, ENS (dell’ECMWF, Centro Europeo per le Previsioni a Medio Termine), GenCast, secondo l’articolo di Nature, ha dimostrato di essere più accurato nel 97,2% dei casi valutati, eccellendo anche nella previsione di eventi estremi, percorsi di cicloni tropicali e nella stima della produzione di energia eolica.
GenCast soddisfa tre requisiti fondamentali per un modello di previsioni probabilistiche:
- Realismo delle traiettorie meteorologiche individuali: Ogni scenario generato rappresenta un possibile sviluppo del tempo, con una qualità paragonabile o superiore a quella dei modelli basati su NWP.
- Distribuzioni calibrate e precise: GenCast fornisce previsioni affidabili per luoghi e tempi specifici, con maggiore abilità nel catturare eventi estremi rispetto ai modelli tradizionali.
- Struttura spazio-temporale: Il modello riesce a catturare in modo efficace le connessioni spazio-temporali fondamentali per prevedere fenomeni su larga scala, come cicloni o variazioni nella generazione di energia distribuita.
GenCast rappresenta un passo avanti non solo in termini di accuratezza, ma anche di efficienza operativa. Riesce a generare previsioni probabilistiche globali in appena 8 minuti, un risultato straordinario se confrontato con i tempi richiesti dai modelli tradizionali di previsione numerica, che possono impiegare diverse ore su sistemi di supercalcolo complessi. Tuttavia, come ogni tecnologia innovativa, ci sono margini di miglioramento.
Uno dei principali aspetti da affrontare riguarda la risoluzione spaziale. Attualmente, GenCast opera a una risoluzione di 0,25° , sufficiente per molte applicazioni, ma inferiore rispetto ai nuovi standard introdotti dai modelli NWP avanzati, che possono raggiungere una risoluzione di 0,1° (circa 10 km quadrati). Una risoluzione più elevata consentirebbe previsioni ancora più dettagliate, migliorando la capacità di catturare fenomeni meteorologici locali come temporali o vortici ciclonici più piccoli. Tuttavia, aumentare la risoluzione richiede un incremento significativo dei requisiti computazionali.
Ed è qui ritorna il solito elefante nella stanza quando si parla di Intelligenza Artificiale, il costo energetico. I modelli come GenCast, basati su tecniche di apprendimento automatico avanzato e diffusion model, sono estremamente esosi computazionalmente. Ogni previsione richiede molteplici calcoli iterativi per ogni singolo passo temporale, il che implica un maggiore consumo di risorse rispetto ai modelli deterministici più semplici. Questo aspetto diventa particolarmente rilevante quando si considera l’impatto ambientale e i costi operativi dei data center che supportano tali tecnologie.
L’adozione su larga scala di modelli come GenCast deve tenere conto della necessità di bilanciare i benefici in termini di accuratezza con i requisiti di efficienza energetica. Per esempio, tecniche di model distillation – che consentono di ridurre il numero di calcoli necessari senza compromettere troppo le prestazioni – potrebbero essere provate per rendere GenCast più sostenibile. Inoltre, si potrebbero integrare strategie di ottimizzazione hardware e software, come l’uso di acceleratori AI più efficienti, per ridurre il consumo energetico.
Un altro aspetto che potrebbe migliorare ulteriormente GenCast è il perfezionamento del modello con dati operativi in tempo reale, come quelli derivati dalle analisi ad alta risoluzione di sistemi NWP avanzati (ad esempio, il sistema HRES di ECMWF). Questo processo potrebbe migliorare sia la precisione delle previsioni che la capacità di adattarsi a condizioni atmosferiche in evoluzione.
In sintesi, GenCast apre nuove possibilità per le previsioni meteorologiche probabilistiche, ma il suo utilizzo su larga scala richiede attenzione all’ottimizzazione dei costi computazionali e del consumo energetico, due fattori sempre più importanti in un mondo che punta a un futuro tecnologico ma sostenibile.