Regione Toscana - Mappa di classificazione naturale/artificiale
Mappa di classificazione binaria con distinzione tra superfici artificiali e naturali, realizzata per alcune aree significative della Regione Toscana a partire dall'elaborazione semi-automatica di dati satellitari multispettrali (immagini Sentinel-2) e iperspettrali (immagini PRISMA). Valore 1 = Superficie Naturale - Valore 0 = Superficie Naturale.
Risoluzione spaziale 5 m, accuratezza geometrica 20 m, accuratezza tematica > 90%.
default
metadataInfo
- gmd:characterSet
- UTF8
- organisationName
-
Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio
- electronicMailAddress
- gmd:dateStamp
- 2025-09-18
- gmd:metadataStandardName
-
Linee Guida RNDT
- gmd:metadataStandardVersion
-
2.0
identificationInfo
- gmd:date (Creation)
- 2025-06-20
- organisationName
-
Regione Toscana
- electronicMailAddress
- datasetcode
-
r_toscan:13838188-0228-496a-85fa-26e85bccd5a0
descriptiveKeywords
-
GEMET
-
-
ambiente urbano, stress urbano
-
superficie artificiale
-
classificazione delle immagini
-
freeTextKeywords
- keyword_libera
-
EU
- keyword_libera
-
RNDT
- organisationName
-
Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio
- electronicMailAddress
rndtDataConstraints
- gmd:useLimitation
-
Nessuna condizione applicabile
accessConstraints
- gmd:accessConstraints
- Other restrictions
- gmd:otherConstraints
- no limitations to public access
useConstraints
- gmd:otherConstraints
-
La risorsa è liberamente accessibile e usabile con licenza CC BY
extent
spatialSection
temporalSection
- gml:beginPosition
- After 2023-06-20
- gml:beginPosition
- After 2023-06-20
Dataset e serie
metadataInfo
hierarchyLevel
identificationInfo
- gmd:presentationForm
- imageDigital
- gmd:issueIdentification
-
r_toscan:13838188-0228-496a-85fa-26e85bccd5a0
descriptiveKeywords
keyword_inspire_theme
-
GEMET - INSPIRE themes, version 1.0
-
-
Copertura del suolo
-
Utilizzo del territorio
-
keyword_ambito_territoriale
keyword_interesse_generale
keyword_opendata
- keyword_opendata_label
-
opendata
- gmd:characterSet
- UTF8
- gmd:spatialRepresentationType
- Grid
- spatialResolution
- 5 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m
topicCategory
- gmd:topicCategory
-
- imageryBaseMapsEarthCover
- planningCadastre
- geoscientificInformation
- gmd:supplementalInformation
-
Cod.RT: 189 ClassNatArt 138
extent
verticalSection
dataQualityInfo
- gmd:level
- Dataset
positionalAccuracy
- gco:Record
- 20
topologicalConsistency
topologicalConsistency
lineage
- gmd:statement
-
La mappa utilizza come dati di input due immagini satellitari, multispettrali Sentinel-2 della missione Copernicus di ESA e iperspettrali della missione PRISMA di ASI.
La metodologia di classificazione binaria naturale/artificiale è stata sviluppata principalmente all’interno della piattaforma di cloud computing Google Earth Engine (GEE). Nell’approccio di classificazione proposto si utilizza come dato di input un dataset di immagini Sentinel-2, di livello 2A, selezionate in un intervallo temporale adeguato per garantire a terra un’informazione spettrale significativa, depurata da condizioni meteorologiche variabili (es. copertura nuvolosa, ombre relative, anomala umidità al suolo). Vengono applicate operazioni di Filtering e Reducing che forniscono come output un image composite di Sentinel-2: da una collezione di immagini si è ottenuta una singola immagine, i cui valori di pixel, in ogni banda, sono il risultato della stima della mediana a partire dai valori dei pixel di tutte le immagini selezionate sulla base dei seguenti criteri: copertura nuvolosa minore del 5%, periodo temporale prossimo alla data di acquisizione del dato PRISMA e bande ritenute spettralmente significative per la classificazione (B2, B3, B4, B8 con risoluzione spaziale pari a 10 m, B5, B6, B7, B8A, B11 e B12 con risoluzione spaziale pari a 20 m).
Successivamente viene applicata una procedura di hyper-sharpening per produrre un’image composite di Sentinel-2 con risoluzione spaziale a 10 m per tutte le bande allo scopo di migliorare la capacità di identificazione della complessità geometrica e spettrale dell’ambiente urbano, caratterizzato da una grande varietà di superfici artificiali di dimensioni relativamente modeste alternate a spazi verdi e giardini. La metodologia di hyper-sharpening è basata sulla decomposizione multiscala (multirisoluzione) delle bande di Sentinel-2 a diversa risoluzione spaziale, in modo da realizzare delle bande “sintetiche”a 10 m. La Modulation Transfer Function (MTF) è il modulo della trasformata di Fourier della Point Spread Function (PSF), ovvero della risposta del sistema ottico di acquisizione (per ogni banda) a un ingresso puntiforme. La MTF, dunque, è una caratteristica specifica del sistema di acquisizione e può essere usata per guidare il processo di arricchimento spaziale del dato multispettrale. Per ulteriori dettagli si può fare riferimento al metodo descritto in [Aiazzi et al., 2006]. La procedura esegue una trasformazione delle informazione spaziali delle bande dell’immagine mediante la stima di coefficienti di regressione lineare per la sintesi di una componente di intensità tramite pesi stimati alla risoluzione di 20 m e applicati alla risoluzione finale di 10 m ([Garzelli et al., 2023]).
Il prodotto della tecnica di image fusion descritta è stato utilizzato come dato di input nella classificazione supervisionata basata su algoritmi Machine Learning (ML).
La classificazione supervisionata è stata strutturata nelle seguenti fasi principali:
• Raccolta di un set di addestramento (training set) per riconoscere le categorie di copertura del suolo desiderate tramite dei campioni spettrali selezionati dall’utente;
• Definizione dei parametri di classificazione dell’algoritmo ML Random Forest (RF) [Breiman, 2001] (denominato “Classificatore”);
• Addestramento del classificatore mediante training set;
• Classificazione dell’immagine;
Operazioni di miglioramento della classificazione automatica:
1) La risoluzione spaziale (10 m) del hyper-sharpened image composite non garantisce l’identificazione delle coperture artificiali lungo infrastrutture a sviluppo longitudinale con spessore trasversale prossimo o minore ai 10 m (es., strade, ferrovie). Inoltre, in alcuni casi la presenza di vegetazione arborea ai bordi delle strade può determinare la prevalenza della componente spettrale dell’infrarosso vicino, legata alla chioma degli alberi, rispetto al sottostante fondo stradale. Queste infrastrutture viarie sono rappresentate come strati tematici vettoriali all’interno del Data Base Topografico in scala 1:2.000 della Regione Toscana (DBT2K). La classificazione binaria artificiale/naturale viene quindi migliorata imponendo la classe Artificiale ai pixel identificati dal classificatore RF come di area Naturale ma ricadenti all’interno dei poligoni del DBT2K relativi a strade e ferrovie.
2) Un aspetto critico nella classificazione binaria per la categoria “naturale” risiede nella similarità spettrale tra alcune tipologie di coperture artificiali e il suolo nudo e/o roccia, presenti in aree agricole e incolte, zone di transizione arbustive ed affioramenti rocciosi. Per migliorare la classificazione binaria si interviene localmente con gli strumenti di gestione dei dati vettoriali disponibili in GEE, delimitando le aree erroneamente identificate come “Artificiale”. Sulla base di queste features poligonali i pixel ricadenti al loro interno sono stati correttamente assegnati alla classe “Naturale”.
3) La mappa di classificazione binaria naturale/artificiale realizzata a partire da immagini Sentinel-2 ha restituito ottimi risultati, con accuratezze pari o superiori al 90%. Nonostante ciò sono presenti alcune problematiche residue, legate in particolar modo alla distinzione tra suolo nudo e superfici in laterizio, superabili almeno in parte tramite l'utilizzo di immagini a maggior risoluzione spettrali come le immagini PRISMA. Il sensore HYC è uno spettrometro in grado di acquisire prodotti VNIR (Visible and Near-InfraRed) e SWIR (Short-Wave InfraRed) con una risoluzione spaziale di 30 metri per un totale di 237 bande (66 bande del VNIR, con un intervallo spettrale 400-1010 nm, e 171 bande nel NIR/SWIR con un intervallo spettrale 920-2505 nm). La camera pancromatica fornisce immagini ad una risoluzione spaziale di 5 metri. La pre-elaborazione del dato iperspettrale PRISMA è consistita in una selezione delle bande ad esclusione di quelle a basso rapporto segnale-rumore ed eventuali bande affette da fenomeni di striping (tramite procedura basata sulla Trasformata di Fourier), seguita da una correzione geometrica per l’allineamento (tra le bande HYC e la banda pancromatica) e la georeferenziazione sfruttando il dato Sentine-2 come riferimento. Anche in questo casi viene adottata una metodologia simile a quella di hypersharpening adotattata per Sentinel-2 in modo da raggiungere una risoluzione finale di 5 m. Analogamente alla classificazione del dato Sentinel-2, anche l’immagine PRISMA è stata quindi classificata in due classi, “Copertura Artificiale” e “Copertura Naturale”, tramite metodologia Random Forest (RF). Infine, le due mappe vengono integrate osservando che: La mappa finale M delle classi Artificiale/Naturale dovrà ereditare la qualità geometrica della mappa creata a partire dal dato Sentinel-2 (Ms); La mappa finale M conserverà le regioni della classe di copertura naturale di Ms; Ogni regione della classe artificiale di Ms dovrà essere confermata nella mappa finale M dalla presenza della regione artificiale corrispondente rivelata anche nella mappa creata a partire dal dato PRISMA (Mp); Il criterio guida per il meccanismo di controllo e conferma espresso nel punto precedente è di tipo morfologico. Sarà infatti applicato solo alle regioni:
◦ di forma compatta (rapporto tra l’area della regione e l’area del minimo poligono convesso contenente la regione > 0.7);
◦ di forma non puramente lineare (eccentricità < 0.95);
◦ di estensione sufficiente (ad esempio, maggiore di 50x50 m2).
Valutazione accuratezza:
La stima dell’accuratezza di classificazione (accuracy assessment) è effettuata mediante validazione con un set di dati indipendenti (validation set) sull'area test utilizzata durante lo sviluppo del progetto TUS:CAN ha fornito i seguenti risultati:
- per quanto riguarda la mappa Ms, su un totale di circa 1800 punti di validazione, è stata ottenuta una user accuracy per la classe artificiale del 89.7%, contro una overall accuracy del 94.1%.
- per quanto riguarda la mappa Mp, su un totale di circa 1800 punti di validazione, è stata ottenuta una user accuracy per la classe artificiale del 96.9%, contro una overall accuracy del 98.5%.
In defnitiva è possibile indicare un'accuratezza superiore al 90% per la mappa generata.
Il servizio è stato sviluppato da Regione Toscana nell'ambito del progetto TUS:CAN (Territorio Urbanizzato da Satellite: Classificazione e ANalisi), co-finanziato dall'Agenzia Spaziale Italiana tramite il programma “I4DP_PA” (Innovation for Downstream Preparation for Public Administrations).
Bibliografia:
Aiazzi et al., 2006: B. Aiazzi, L. Alparone, S. Baronti, A. Garzelli, and M. Selva, MTF-tailored multiscale fusion of high-resolution MS and pan imagery, 2006
Garzelli et al., 2023: A. Garzelli, C. Zoppetti, A. Arienzo, and L. Alparone, Spatial Resolution Enhancement of Prisma Hyperspectral Data Via Nested Hypersharpening with Sentinel-2 Multispectral Data, 2023
Breiman, 2001: Breiman, L., Random Forests, 2001
conformitySpecifications
referenceSystems
rsFieldAnchor
rsFieldCCS
rsFieldCode
dataDistribution
gmd:distributionFormat
- format
-
TIFF
- format_version
-
1.0
- organisationName
-
Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio
- electronicMailAddress
onlineResource
- gmd:onLine
- access point ( WWW:LINK-1.0-http--link )
resourceMaintenance
Servizi
metadataInfo
- gmd:hierarchyLevel
- Dataset
serviceIdentification
serviceType
couplingType
operatesOn
operatesOn
dataDistribution
- gmd:onLine
- access point ( WWW:LINK-1.0-http--link )
servicesQualityInfo
qualityLevel
- gmd:level
- Dataset
conformitySpecifications
conformitySpecifications
serviceCategory
referenceSystems
spatialReferenceSystem
Dati raster
contentInfo
- gmd:attributeDescription
- Valore 1 = Superficie Naturale - Valore 0 = Superficie Naturale
- gmd:contentType
- thematicClassification
- gmd:bitsPerValue
- 8
- gmd:triangulationIndicator
spatialRepresentation
- gmd:numberOfDimensions
- 2
- gmd:dimensionName
- Row
- gmd:dimensionSize
- 800
- gmd:resolution
- 10 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m
- gmd:dimensionName
- Column
- gmd:dimensionSize
- 1500
- gmd:resolution
- 10 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m
- gmd:cellGeometry
- area
- gmd:transformationParameterAvailability
georectifiedRaster
- gmd:checkPointAvailability
Regione Toscana