Regione Toscana - Mappa di classificazione naturale/artificiale

Mappa di classificazione binaria con distinzione tra superfici artificiali e naturali, realizzata per alcune aree significative della Regione Toscana a partire dall'elaborazione semi-automatica di dati satellitari multispettrali (immagini Sentinel-2) e iperspettrali (immagini PRISMA). Valore 1 = Superficie Naturale - Valore 0 = Superficie Naturale.

Risoluzione spaziale 5 m, accuratezza geometrica 20 m, accuratezza tematica > 90%.

metadataInfo

gmd:fileIdentifier: r_toscan:13838188-0228-496a-85fa-26e85bccd5a0

gmd:characterSet: UTF8

organisationName: Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio

electronicMailAddress: contatto.cartografia@regione.toscana.it

gmd:dateStamp: 2025-09-18

gmd:metadataStandardName: Linee Guida RNDT

gmd:metadataStandardVersion: 2.0

identificationInfo

gmd:date (Creation): 2025-06-20

organisationName: Regione Toscana

electronicMailAddress: urp@regione.toscana.it

datasetcode: r_toscan:13838188-0228-496a-85fa-26e85bccd5a0

descriptiveKeywords

GEMET

ambiente urbano, stress urbano
superficie artificiale
classificazione delle immagini

freeTextKeywords

keyword_libera: EU

keyword_libera: RNDT

organisationName: Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio

electronicMailAddress: contatto.cartografia@regione.toscana.it

rndtDataConstraints

gmd:useLimitation: Nessuna condizione applicabile

accessConstraints

gmd:accessConstraints: Other restrictions

gmd:otherConstraints: no limitations to public access

useConstraints

gmd:otherConstraints: La risorsa è liberamente accessibile e usabile con licenza CC BY

extent

spatialSection

temporalSection

gml:beginPosition: After 2023-06-20

gml:beginPosition: After 2023-06-20

metadataInfo

hierarchyLevel

identificationInfo

gmd:presentationForm: imageDigital

gmd:issueIdentification: r_toscan:13838188-0228-496a-85fa-26e85bccd5a0

descriptiveKeywords

keyword_inspire_theme

GEMET - INSPIRE themes, version 1.0

Copertura del suolo
Utilizzo del territorio

keyword_ambito_territoriale

Spatial scope

Regionale

keyword_interesse_generale

Registro dei dati di interesse generale per il RNDT

Carte Geotematiche

keyword_opendata

keyword_opendata_label: opendata

gmd:characterSet: UTF8

gmd:spatialRepresentationType: Grid

spatialResolution: 5 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m

topicCategory

gmd:topicCategory

imageryBaseMapsEarthCover
planningCadastre
geoscientificInformation

gmd:supplementalInformation: Cod.RT: 189 ClassNatArt 138

extent

verticalSection

verticalExtension

dataQualityInfo

gmd:level: Dataset

positionalAccuracy

gco:Record: 20

topologicalConsistency

lineage

gmd:statement: La mappa utilizza come dati di input due immagini satellitari, multispettrali Sentinel-2 della missione Copernicus di ESA e iperspettrali della missione PRISMA di ASI.

La metodologia di classificazione binaria naturale/artificiale è stata sviluppata principalmente all’interno della piattaforma di cloud computing Google Earth Engine (GEE). Nell’approccio di classificazione proposto si utilizza come dato di input un dataset di immagini Sentinel-2, di livello 2A, selezionate in un intervallo temporale adeguato per garantire a terra un’informazione spettrale significativa, depurata da condizioni meteorologiche variabili (es. copertura nuvolosa, ombre relative, anomala umidità al suolo). Vengono applicate operazioni di Filtering e Reducing che forniscono come output un image composite di Sentinel-2: da una collezione di immagini si è ottenuta una singola immagine, i cui valori di pixel, in ogni banda, sono il risultato della stima della mediana a partire dai valori dei pixel di tutte le immagini selezionate sulla base dei seguenti criteri: copertura nuvolosa minore del 5%, periodo temporale prossimo alla data di acquisizione del dato PRISMA e bande ritenute spettralmente significative per la classificazione (B2, B3, B4, B8 con risoluzione spaziale pari a 10 m, B5, B6, B7, B8A, B11 e B12 con risoluzione spaziale pari a 20 m).

Successivamente viene applicata una procedura di hyper-sharpening per produrre un’image composite di Sentinel-2 con risoluzione spaziale a 10 m per tutte le bande allo scopo di migliorare la capacità di identificazione della complessità geometrica e spettrale dell’ambiente urbano, caratterizzato da una grande varietà di superfici artificiali di dimensioni relativamente modeste alternate a spazi verdi e giardini. La metodologia di hyper-sharpening è basata sulla decomposizione multiscala (multirisoluzione) delle bande di Sentinel-2 a diversa risoluzione spaziale, in modo da realizzare delle bande “sintetiche”a 10 m. La Modulation Transfer Function (MTF) è il modulo della trasformata di Fourier della Point Spread Function (PSF), ovvero della risposta del sistema ottico di acquisizione (per ogni banda) a un ingresso puntiforme. La MTF, dunque, è una caratteristica specifica del sistema di acquisizione e può essere usata per guidare il processo di arricchimento spaziale del dato multispettrale. Per ulteriori dettagli si può fare riferimento al metodo descritto in [Aiazzi et al., 2006]. La procedura esegue una trasformazione delle informazione spaziali delle bande dell’immagine mediante la stima di coefficienti di regressione lineare per la sintesi di una componente di intensità tramite pesi stimati alla risoluzione di 20 m e applicati alla risoluzione finale di 10 m ([Garzelli et al., 2023]).

Il prodotto della tecnica di image fusion descritta è stato utilizzato come dato di input nella classificazione supervisionata basata su algoritmi Machine Learning (ML).

La classificazione supervisionata è stata strutturata nelle seguenti fasi principali:

• Raccolta di un set di addestramento (training set) per riconoscere le categorie di copertura del suolo desiderate tramite dei campioni spettrali selezionati dall’utente;

• Definizione dei parametri di classificazione dell’algoritmo ML Random Forest (RF) [Breiman, 2001] (denominato “Classificatore”);

• Addestramento del classificatore mediante training set;

• Classificazione dell’immagine;

Operazioni di miglioramento della classificazione automatica:

1) La risoluzione spaziale (10 m) del hyper-sharpened image composite non garantisce l’identificazione delle coperture artificiali lungo infrastrutture a sviluppo longitudinale con spessore trasversale prossimo o minore ai 10 m (es., strade, ferrovie). Inoltre, in alcuni casi la presenza di vegetazione arborea ai bordi delle strade può determinare la prevalenza della componente spettrale dell’infrarosso vicino, legata alla chioma degli alberi, rispetto al sottostante fondo stradale. Queste infrastrutture viarie sono rappresentate come strati tematici vettoriali all’interno del Data Base Topografico in scala 1:2.000 della Regione Toscana (DBT2K). La classificazione binaria artificiale/naturale viene quindi migliorata imponendo la classe Artificiale ai pixel identificati dal classificatore RF come di area Naturale ma ricadenti all’interno dei poligoni del DBT2K relativi a strade e ferrovie.

2) Un aspetto critico nella classificazione binaria per la categoria “naturale” risiede nella similarità spettrale tra alcune tipologie di coperture artificiali e il suolo nudo e/o roccia, presenti in aree agricole e incolte, zone di transizione arbustive ed affioramenti rocciosi. Per migliorare la classificazione binaria si interviene localmente con gli strumenti di gestione dei dati vettoriali disponibili in GEE, delimitando le aree erroneamente identificate come “Artificiale”. Sulla base di queste features poligonali i pixel ricadenti al loro interno sono stati correttamente assegnati alla classe “Naturale”.

3) La mappa di classificazione binaria naturale/artificiale realizzata a partire da immagini Sentinel-2 ha restituito ottimi risultati, con accuratezze pari o superiori al 90%. Nonostante ciò sono presenti alcune problematiche residue, legate in particolar modo alla distinzione tra suolo nudo e superfici in laterizio, superabili almeno in parte tramite l'utilizzo di immagini a maggior risoluzione spettrali come le immagini PRISMA. Il sensore HYC è uno spettrometro in grado di acquisire prodotti VNIR (Visible and Near-InfraRed) e SWIR (Short-Wave InfraRed) con una risoluzione spaziale di 30 metri per un totale di 237 bande (66 bande del VNIR, con un intervallo spettrale 400-1010 nm, e 171 bande nel NIR/SWIR con un intervallo spettrale 920-2505 nm). La camera pancromatica fornisce immagini ad una risoluzione spaziale di 5 metri. La pre-elaborazione del dato iperspettrale PRISMA è consistita in una selezione delle bande ad esclusione di quelle a basso rapporto segnale-rumore ed eventuali bande affette da fenomeni di striping (tramite procedura basata sulla Trasformata di Fourier), seguita da una correzione geometrica per l’allineamento (tra le bande HYC e la banda pancromatica) e la georeferenziazione sfruttando il dato Sentine-2 come riferimento. Anche in questo casi viene adottata una metodologia simile a quella di hypersharpening adotattata per Sentinel-2 in modo da raggiungere una risoluzione finale di 5 m. Analogamente alla classificazione del dato Sentinel-2, anche l’immagine PRISMA è stata quindi classificata in due classi, “Copertura Artificiale” e “Copertura Naturale”, tramite metodologia Random Forest (RF). Infine, le due mappe vengono integrate osservando che: La mappa finale M delle classi Artificiale/Naturale dovrà ereditare la qualità geometrica della mappa creata a partire dal dato Sentinel-2 (Ms); La mappa finale M conserverà le regioni della classe di copertura naturale di Ms; Ogni regione della classe artificiale di Ms dovrà essere confermata nella mappa finale M dalla presenza della regione artificiale corrispondente rivelata anche nella mappa creata a partire dal dato PRISMA (Mp); Il criterio guida per il meccanismo di controllo e conferma espresso nel punto precedente è di tipo morfologico. Sarà infatti applicato solo alle regioni:

◦ di forma compatta (rapporto tra l’area della regione e l’area del minimo poligono convesso contenente la regione > 0.7);

◦ di forma non puramente lineare (eccentricità < 0.95);

◦ di estensione sufficiente (ad esempio, maggiore di 50x50 m2).

Valutazione accuratezza:

La stima dell’accuratezza di classificazione (accuracy assessment) è effettuata mediante validazione con un set di dati indipendenti (validation set) sull'area test utilizzata durante lo sviluppo del progetto TUS:CAN ha fornito i seguenti risultati:

- per quanto riguarda la mappa Ms, su un totale di circa 1800 punti di validazione, è stata ottenuta una user accuracy per la classe artificiale del 89.7%, contro una overall accuracy del 94.1%.

- per quanto riguarda la mappa Mp, su un totale di circa 1800 punti di validazione, è stata ottenuta una user accuracy per la classe artificiale del 96.9%, contro una overall accuracy del 98.5%.

In defnitiva è possibile indicare un'accuratezza superiore al 90% per la mappa generata.

Il servizio è stato sviluppato da Regione Toscana nell'ambito del progetto TUS:CAN (Territorio Urbanizzato da Satellite: Classificazione e ANalisi), co-finanziato dall'Agenzia Spaziale Italiana tramite il programma “I4DP_PA” (Innovation for Downstream Preparation for Public Administrations).

Bibliografia:

Aiazzi et al., 2006: B. Aiazzi, L. Alparone, S. Baronti, A. Garzelli, and M. Selva, MTF-tailored multiscale fusion of high-resolution MS and pan imagery, 2006

Garzelli et al., 2023: A. Garzelli, C. Zoppetti, A. Arienzo, and L. Alparone, Spatial Resolution Enhancement of Prisma Hyperspectral Data Via Nested Hypersharpening with Sentinel-2 Multispectral Data, 2023

Breiman, 2001: Breiman, L., Random Forests, 2001

conformitySpecifications

referenceSystems

rsFieldAnchor

rsFieldCCS

rsFieldCode

dataDistribution

gmd:distributionFormat

format: TIFF

format_version: 1.0

organisationName: Regione Toscana - Settore Sistema Informativo e Pianificazione del Territorio

electronicMailAddress: contatto.cartografia@regione.toscana.it

onlineResource

gmd:onLine: access point ( WWW:LINK-1.0-http--link )

resourceMaintenance

metadataInfo

gmd:hierarchyLevel: Dataset

serviceIdentification

serviceType

couplingType

operatesOn

dataDistribution

gmd:onLine: access point ( WWW:LINK-1.0-http--link )

servicesQualityInfo

qualityLevel

gmd:level: Dataset

conformitySpecifications

serviceCategory

referenceSystems

spatialReferenceSystem

contentInfo

gmd:attributeDescription: Valore 1 = Superficie Naturale - Valore 0 = Superficie Naturale

gmd:contentType: thematicClassification

gmd:bitsPerValue: 8

gmd:triangulationIndicator

spatialRepresentation

gmd:numberOfDimensions: 2

gmd:dimensionName: Row

gmd:dimensionSize: 800

gmd:resolution: 10 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m

gmd:dimensionName: Column

gmd:dimensionSize: 1500

gmd:resolution: 10 http://standards.iso.org/iso/19139/resources/uom/ML_gmxUom.xml#m

gmd:cellGeometry: area

gmd:transformationParameterAvailability

georectifiedRaster

gmd:checkPointAvailability

cornerPoints

rt189 ClassNatArt 138

Not available

default

metadataInfo

identificationInfo

descriptiveKeywords

freeTextKeywords

rndtDataConstraints

accessConstraints

useConstraints

extent

spatialSection

temporalSection

Dataset e serie

metadataInfo

hierarchyLevel

identificationInfo

descriptiveKeywords

keyword_inspire_theme

keyword_ambito_territoriale

keyword_interesse_generale

keyword_opendata

topicCategory

extent

verticalSection

dataQualityInfo

positionalAccuracy

topologicalConsistency

topologicalConsistency

lineage

conformitySpecifications

referenceSystems

rsFieldAnchor

rsFieldCCS

rsFieldCode

dataDistribution

gmd:distributionFormat

onlineResource

resourceMaintenance

Servizi

metadataInfo

serviceIdentification

serviceType

couplingType

operatesOn

operatesOn

dataDistribution

servicesQualityInfo

qualityLevel

conformitySpecifications

conformitySpecifications

serviceCategory

referenceSystems

spatialReferenceSystem

Dati raster

contentInfo

spatialRepresentation

georectifiedRaster

cornerPoints