VALUTAZIONE DELLA QUALITÀ DELL’ARIA

La validazione dei dati

La validazione dei dati è rappresentata dall’insieme delle attività, manuali o automatiche, sui valori numerici dei dati rilevati dalla RRQA, per la verifica del soddisfacimento di particolari requisiti, ottenuta a seguito di analisi e supportata da evidenza oggettiva al fine di evitare l’archiviazione e l’utilizzo di dati non validi, da non confondere con le procedure di QC utili a minimizzare questa tipologia di dati.

I criteri di validazione ed i limiti di accettabilità dei dati potranno essere variabili in funzione degli obbiettivi della RRQA e del conseguente utilizzo dei dati da essa prodotti. Ad esempio, per campagne finalizzate di breve durata le serie temporali di interesse potranno essere validate con criteri diversi da quelli adottati quotidianamente per la validazione dei dati.

La validazione si può suddividere in tre fasi:

  1. Giornaliera
  2. Trimestrale
  3. Definitiva

Queste fasi nascono dalla seguente classificazione del dato:

Grezzo: dato come acquisito dal sistema informatico in tempo reale

Validato: dato validato il giorno successivo a quello di acquisizione

Confermato: dato validato su base trimestrale (entro 10 giorni dalla fine del trimestre) per l’ozono tale dato deve essere confermato su base mensile nel periodo aprile-settembre

Storicizzato: dato validato in maniera definitiva (entro 2 mesi dalla fine dell’anno civile)

Le attività di validazione possono essere distinte in due categorie:

  1. attività eseguite da personale qualificato, operante a stretto contatto con il sistema di misurazione della RRQA e che abbia maturato la necessaria esperienza sul comportamento e sulla distribuzione spazio-temporale degli inquinanti; per eseguire tale validazione si opera su due archivi:
    1. uno chiamato grezzi, dove sono conservati i dati grezzi
    2. uno chiamato validi, dove avvengono le operazioni di validazione da parte del personale incaricato in tal modo viene lasciata evidenza delle operazioni eseguite.
  2. attività di “filtraggio” eseguite sull’archivio dati mediante l’uso sistematico di tecniche statistiche per l’identificazione di outliers, serie anomale, rispetto di limiti fisici, etc.

Criteri per la verifica del valore limite

Per la verifica della validità dell’aggregazione dei dati e del calcolo dei parametri statistici sono stati utilizzati i criteri previsti dalla norma vigente che si riportano nella successiva tabella. La raccolta dati deve soddisfare il criterio del “periodo minimo di copertura” (time coverage) previsto nell’allegato 1, tabb. 1 e 2, del D. Lgs. 155/2010. In generale le misure in siti fissi, per gli adempimenti AQD (Air Quality Directives), hanno un time coverage pari ad un anno civile. Fanno eccezione il benzene, il B(a)P, As, Ni, e Cd che devono soddisfare un time coverage più basso (33% per il B(a)p e 50% per As, Ni, e Cd, 35% per le stazioni (sub)urbane di fondo e traffico e 90% per le stazioni industriali.

Va rispettata, inoltre, la “raccolta minima dei dati” (Data capture) prevista nell’allegato 1, tabb. 1 e 2, del D. Lgs. 155/2010. Il valore minimo è pari al 90% per tutti gli inquinanti AQD tranne per l’ozono che per il periodo invernale deve rispettare un data capture del 75%. Per le misure in continuo la verifica si esegue effettuando il rapporto tra i dati validi raccolti e i dati teoricamente misurabili (al netto delle perdite per manutenzione e calibrazione).

Nella “Ipr  guidance 1” viene assunta accettabile una perdita del 5% per manutenzione/calibrazione. Ciò consente, in assenza di raccolta delle informazioni sulla manutenzione/calibrazione nel database regionale, di considerare accettabile un data capture obiettivo pari a 85% (per l’ozono, nel periodo invernale, 70%). Nel caso di misure giornaliere la perdita massima accettabile è pari a 18 giorni.

Parametro Percentuale richiesta di dati validi (data capture)
Valori su 1 h 75 % (ossia 45 minuti)
Valori su 8 h 75 % dei valori (ovvero 6 ore)
Valore medio massimo giornaliero su 8 h 75 % delle concentrazioni medie consecutive su 8 ore calcolate in base a dati orari (ossia 18 medie su 8 ore al giorno)
Valori su 24 h 75 % delle medie orarie(ossia almeno 18 valori orari)
Media annuale 90 % dei valori di 1 ora o (se non disponibile) dei valori di 24 ore nel corso dell’anno


Trattamento dati inferiore al limite di rilevabilità

I dati inferiori al limite di rilevabilità (< LR) sono riferibili come dati NR (non rilevabile) o ND (not detectable e not detected). Il limite di rilevabilità è quello del metodo nelle condizioni sperimentali applicate. È funzione del volume di campionamento (tempo e portata), pulizia del bianco e “LR strumentale”. “LR strumentale” è definito come la concentrazione che dà un segnale strumentale significativamente differente dal segnale del rumore di fondo. La definizione classica è: “la concentrazione che dà un segnale pari al segnale medio di n misure replicate del bianco più tre volte la deviazione standard dei tali misure”. Per molti scopi viene espresso, secondo una definizione classica, come “la concentrazione che dà un segnale pari a tre volte quello del rumore”. In aggiunta o in luogo all’LR viene calcolato il “Limite di Quantificazione”, a questo si applicano le stesse considerazioni fatte per l’LR, salvo che invece di “tre volte” viene comunemente adottato un numero compreso tra sei e dieci.

Il problema dei dati NR si pone quando:

  1. Occorre calcolare, per una sostanza, la concentrazione media a partire da più misure di cui alcune risultano NR
  2. Occorre calcolare la concentrazione cumulativa (o sommatoria) di più sostanze, di cui alcune risultano NR

I criteri più comunemente impiegati consistono nell’assegnare a tali dati di concentrazione il valore di “0” oppure quello corrispondente all’LR. Un terzo criterio consiste nell’assegnare il valore corrispondente all’LR/2.

  1. NR=0 -> stima LOWER-BOUND, dunque sottostima il valore vero della concentrazione media o della sommatoria delle concentrazioni
  2. NR=LR -> stima UPPER-BOUND, dunque sovrastima il valore vero. È dunque una soluzione cautelativa dal punto di vista della protezione dell’ambiente e della salute
  3. NR=LR/2 -> stima MEDIUM-BOUND e si basa sula fatto che mediamente i dati NR siano ≈ LR/2. È la soluzione maggiormente raccomandata in letteratura, anche quando i risultati non servono a valutare la conformità ad un valore limite. L’errore che questa soluzione comporta nella stima della media dipende dall’LR (tende ad aumentare con l’aumento di questo).

Un ulteriore soluzione, tra quelle che prevedono la sostituzione con un valore fisso, consiste nel sostituire NR con LR/. È stata proposta come soluzione che approssima meglio media e deviazione standard nel caso di distribuzione non fortemente asimmetrica. Occorre, tuttavia, conoscere preventivamente la forma della distribuzione.