Le alluvioni costituiscono una delle principali minacce naturali per il territorio italiano, con impatti rilevanti su insediamenti urbani, infrastrutture e ambiente. Per affrontare la crescente complessità dell'analisi del rischio idraulico, questo studio propone una metodologia basata sull'algoritmo di apprendimento automatico XGBoost per la valutazione della suscettibilità alle alluvioni. L’approccio integra dati geospaziali ad alta risoluzione e tecniche di interpretazione dei modelli (eXplainable AI - XAI) per produrre mappe predittive a supporto della pianificazione e mitigazione del rischio (Rondinone et al., 2025). Il bacino del fiume Basento, in Basilicata, è storicamente soggetto a eventi alluvionali ricorrenti e impattanti (Albano et al., 2024; Dal Sasso et al., 2017). Eventi di piena significativi si sono verificati nel marzo 2011, ottobre e dicembre 2013, causando danni estesi. L'inventario delle aree alluvionate è stato costruito utilizzando dati da Copernicus EMS, immagini radar COSMO-SkyMed e archivi regionali. I dati satellitari ad alta risoluzione (2.5 m) hanno consentito una mappatura dettagliata dell'estensione degli eventi. Sono stati selezionati otto fattori condizionanti di natura spaziale: elevazione, elevazione relativa, pendenza, esposizione, distanza dal reticolo idrografico, densità di drenaggio, uso del suolo e litologia. I dati raster sono stati elaborati in ambiente GIS con risoluzione 20 m x 20 m. Il modello XGBoost è stato addestrato su una base dati suddivisa in training set (70%) e test set (30%). Per evitare fenomeni di overfitting legati alla complessità geomorfologica e all’eterogeneità del territorio, l’analisi è stata applicata a una porzione del bacino con altitudine inferiore ai 350 m s.l.m., maggiormente soggetta a eventi alluvionali e caratterizzata da maggiore omogeneità geomorfologica. Per compensare lo sbilanciamento delle classi (aree inondate vs. non inondate), si è applicato il metodo SMOTE (Pradipta et al., 2021). La valutazione del modello è stata condotta mediante cross-validation a 10 fold e test su set indipendenti, confermandone la robustezza e l'affidabilità. L’interpretazione dei risultati è stata supportata dall’uso della tecnica SHAP (SHapley Additive exPlanations), in linea con quanto mostrato da Cappelli et al. (2024). Il modello ha raggiunto un'accuratezza pari a 0.983. La classe "inondata" ha ottenuto una precisione del 68.7% e un recall del 97.5%. La Figura 1 mostra i risultati della classificazione ottenuta dal modello XGBoost nella zona costiera del fiume Basento. Le aree in ciano indicano le zone correttamente identificate come soggette a inondazione, mentre le aree in blu e rosso rappresentano, rispettivamente, i falsi positivi (FP) e i falsi negativi (FN). Il 62% delle aree classificate come alluvionate ricade in corrispondenza del reticolo idrografico ufficiale (CTR), a conferma dell'affidabilità spaziale del modello. Le analisi di errore mostrano una bassa percentuale di falsi positivi (10.55%) e falsi negativi (1.69%). I tre fattori più influenti nella classificazione, secondo l'analisi SHAP, sono: l’elevazione (53%), l’elevazione relativa (14%) e la densità di drenaggio (13%). Le aree con bassa altitudine e alta densità di drenaggio sono risultate le più esposte al rischio. L’approccio si è dimostrato efficace per la mappatura della suscettibilità alle alluvioni nel bacino del Basento. L’integrazione con tecniche di interpretazione del modello ha consentito inoltre di individuare le principali variabili geospaziali che influenzano maggiormente il fenomeno alluvionale, supportando decisioni più consapevoli nell’ambito della pianificazione e mitigazione. La metodologia si conferma scalabile e adattabile ad altri contesti esposti a pericolosità idraulica. Sviluppi futuri potrebbero includere l’applicazione di tecniche di interpretabilità globale e locale, per comprendere non solo quali fattori influenzano maggiormente il comportamento complessivo del modello, ma anche per analizzare come e per quali valori specifici le singole variabili incidano sui risultati del modello.

Giornate dell'Idrologia 2025 - Book of Abstract

Marica Rondinone;Silvano Fortunato Dal Sasso;Htay Htay Aung;Mauro Fiorentino;Vito Telesca
2025-01-01

Abstract

Le alluvioni costituiscono una delle principali minacce naturali per il territorio italiano, con impatti rilevanti su insediamenti urbani, infrastrutture e ambiente. Per affrontare la crescente complessità dell'analisi del rischio idraulico, questo studio propone una metodologia basata sull'algoritmo di apprendimento automatico XGBoost per la valutazione della suscettibilità alle alluvioni. L’approccio integra dati geospaziali ad alta risoluzione e tecniche di interpretazione dei modelli (eXplainable AI - XAI) per produrre mappe predittive a supporto della pianificazione e mitigazione del rischio (Rondinone et al., 2025). Il bacino del fiume Basento, in Basilicata, è storicamente soggetto a eventi alluvionali ricorrenti e impattanti (Albano et al., 2024; Dal Sasso et al., 2017). Eventi di piena significativi si sono verificati nel marzo 2011, ottobre e dicembre 2013, causando danni estesi. L'inventario delle aree alluvionate è stato costruito utilizzando dati da Copernicus EMS, immagini radar COSMO-SkyMed e archivi regionali. I dati satellitari ad alta risoluzione (2.5 m) hanno consentito una mappatura dettagliata dell'estensione degli eventi. Sono stati selezionati otto fattori condizionanti di natura spaziale: elevazione, elevazione relativa, pendenza, esposizione, distanza dal reticolo idrografico, densità di drenaggio, uso del suolo e litologia. I dati raster sono stati elaborati in ambiente GIS con risoluzione 20 m x 20 m. Il modello XGBoost è stato addestrato su una base dati suddivisa in training set (70%) e test set (30%). Per evitare fenomeni di overfitting legati alla complessità geomorfologica e all’eterogeneità del territorio, l’analisi è stata applicata a una porzione del bacino con altitudine inferiore ai 350 m s.l.m., maggiormente soggetta a eventi alluvionali e caratterizzata da maggiore omogeneità geomorfologica. Per compensare lo sbilanciamento delle classi (aree inondate vs. non inondate), si è applicato il metodo SMOTE (Pradipta et al., 2021). La valutazione del modello è stata condotta mediante cross-validation a 10 fold e test su set indipendenti, confermandone la robustezza e l'affidabilità. L’interpretazione dei risultati è stata supportata dall’uso della tecnica SHAP (SHapley Additive exPlanations), in linea con quanto mostrato da Cappelli et al. (2024). Il modello ha raggiunto un'accuratezza pari a 0.983. La classe "inondata" ha ottenuto una precisione del 68.7% e un recall del 97.5%. La Figura 1 mostra i risultati della classificazione ottenuta dal modello XGBoost nella zona costiera del fiume Basento. Le aree in ciano indicano le zone correttamente identificate come soggette a inondazione, mentre le aree in blu e rosso rappresentano, rispettivamente, i falsi positivi (FP) e i falsi negativi (FN). Il 62% delle aree classificate come alluvionate ricade in corrispondenza del reticolo idrografico ufficiale (CTR), a conferma dell'affidabilità spaziale del modello. Le analisi di errore mostrano una bassa percentuale di falsi positivi (10.55%) e falsi negativi (1.69%). I tre fattori più influenti nella classificazione, secondo l'analisi SHAP, sono: l’elevazione (53%), l’elevazione relativa (14%) e la densità di drenaggio (13%). Le aree con bassa altitudine e alta densità di drenaggio sono risultate le più esposte al rischio. L’approccio si è dimostrato efficace per la mappatura della suscettibilità alle alluvioni nel bacino del Basento. L’integrazione con tecniche di interpretazione del modello ha consentito inoltre di individuare le principali variabili geospaziali che influenzano maggiormente il fenomeno alluvionale, supportando decisioni più consapevoli nell’ambito della pianificazione e mitigazione. La metodologia si conferma scalabile e adattabile ad altri contesti esposti a pericolosità idraulica. Sviluppi futuri potrebbero includere l’applicazione di tecniche di interpretabilità globale e locale, per comprendere non solo quali fattori influenzano maggiormente il comportamento complessivo del modello, ma anche per analizzare come e per quali valori specifici le singole variabili incidano sui risultati del modello.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11563/204157
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact