Archivi tag: Statistica

La Rubrica di NIA: Alcune Basi Statistiche Per Studiare un Clima

Sempre più spesso nei telegiornali e in tutte le migliaia di fonti di informazioni ( purtroppo anche non sempre competenti ) si sente parlare di clima.

Cos’è il clima però? Il clima di una determinata zona è inteso come la media di tutti i fenomeni meteorologici occorsi li nell’arco di un trentennio ( che viene preso come il periodo 1961-90, detto anche periodo Clino ).

Si dice sempre che la Meteorologia e la Climatologia sono 2 cose differenti e che non bisogna confonderle, perché un inverno freddo o un’estate calda non “fanno primavera”, ovvero non dicono assolutamente nulla, ma però alla fine dei conti faranno media e quindi la loro parte la diranno eccome.

Queste 2 scienze non vanno confuse, ma è sbagliato dire che sono 2 cose diverse e che vanno prese singolarmente, questo perché la 2° è la diretta conseguenza della prima, quindi se non si conosce la prima non si conosce neanche la seconda, si può quasi paragonare la Meteorologia come la base fondamentale per capire la Climatologia.

Ho voluto inserire questa prefazione perché era molto importante far capire come in realtà avere un inverno freddo o nevoso dice eccome la sua parte, visto che poi alla fine farà media, e siccome la media ha il difetto di considerare all’interno di essa anche valori molto lontani dagli altri o con uno scarto estremamente alto non si può dire che essa non ne risenta.

Abbiamo parlato di media, penso che la media aritmetica non ci sia neanche bisogno si spiegarla, tutti la conoscono, ma la sua importanza è fondamentale.

Andiamo ad analizzare ora cosa accade allo studio di questo trentennio di riferimento, prenderemo lo studio della temperatura, perché è sicuramente quello più conosciuto e più discusso, ma purtroppo anche quello meno preciso, a differenza per esempio dello studio delle precipitazioni che non presenta sostanziali difetti sia strumentali che di misurazione in se, la differenza però sta nel fatto che le temperature si distribuiscono molto più similmente alla curva gaussiana che le precipitazioni.

Abbiamo detto che la temperatura non è un indice molto preciso, questo perché non ti dice il calore presente nel sistema, ma solo che temperatura ha, e si sa che la temperatura dipende moltissimo dalla pressione ( e anche da un’altra miriade di fattori ), una misura molto più efficace sarebbe quella di calcolare l’Entalpia del nostro sistema, ma anche li incorriamo in problemi, visto che l’entalpia non è calcolabile come valore assoluto, ma solo come variazione rispetto ad un sistema preso di riferimento ( di solito è la differenza all’interno dello sistema dal tempo t-1 al tempo t )

L’Entalpia rappresenta il calore che possiedono le particelle di un determinato sistema

Quindi posto che la temperatura in se non dica assolutamente niente ( ma bisogna lo stesso prenderla in considerazione, sapendo però anche cosa indica veramente, e purtroppo molti di quelli che parlano di clima questo non lo sanno ).

Ovviamente la cosa più semplice che si può fare con le temperature è calcolarne quella media, facendo la somma di tutte e 30 dividendo poi per lo stesso numero.

Ma la media dice solo che nell’ipotetico caso in cui la mia distribuzione sia formata da valori tutti uguali tutti avranno come valore quello della media, per questo bisogna prendere in considerazione come varia il mio protocollo elementare, e questo è misurabile trami la Deviazione Standard.

Il protocollo elementare è l’insieme di tutti i miei dati prima di essere analizzati

E’ conosciuta anche con un altro nome, che è più significativo e spiega bene cosa indica, ovvero Scarto Quadratico Medio, la media degli scarti quadratici rispetto alla media, ed è un indice di quanto sia la variabilità del sistema, abbiamo infatti detto che le temperature tendono ad assomigliare ( per approssimazione si può prenderla come coincidente ) alla distribuzione Gaussiana, le cui particolarità sono di avere il valore medio coincidente con la mediana ( il valore che sta in mezzo al protocollo elementare, su 30 elementi la mediana è rappresentata dalla semi-somma dei valori del 15° e del 16° posto ) e con la moda ( il valore con la più alta frequenza ), di essere simmetrica rispetto al valore medio e di avere un’alta percentuale di elementi che sono molto vicini alla media.

Di solito dopo un’analisi di alcuni dati, essi andrebbero espressi così: Valore Medio ± Dev. Stand.

Nella distribuzione Guassiana all’interno dell’intervallo sopra citato è presente circa il 68% dei valori, quindi 2/3 del nostro protocollo elementare sta li.

Abbiamo detto che la distribuzione delle temperature si approssima alla guassiana, e lo fa sempre più all’aumentare del numero di elementi presi in considerazione.

Infatti per pochi dati non si possono fare le precisazioni che abbiamo fatto prima e la deviazione standard serve a capire se il campione che abbiamo preso in esame è significativo o no, questo perché più il valore è piccolo più saranno vicini alla media i singoli elementi, più è alto più saranno distanti.

Abbiamo detto tante cose, ma non come si calcola la deviazione standard, per prima cosa bisogna calcolare la media, prendere ogni singolo valore e sottrargli la media, elevare poi il tutto al quadrato, fare la stessa cosa anche per tutti gli altri elementi e sommarli tutti, dividere tutto per il loro numero e infine fare la radice quadrato, per eliminare così il fatto di aver elevato al quadrato in precedenza:

\operatorname{\sigma_x} = \sqrt{\frac{\sum_{i=1}^{n} (x_i-\overline x)^2}{n}}

Dove:

sx = deviazione standard

n = numero degli elementi

i = indica lo spostamento della posizione del nostro dato, ovvero, lo spostamento dal 1° all’n°

? = indica la sommatoria, quindi una somma di dati, che va appunto da i=1 a n, cioè dal 1° all’n° ( la sommatoria si riferisce solo all’operazione matematica che gli viene scritta subito dopo, opportunamente messa dentro parentesi )

Xi = rappresenta il nostro dato nella posizione generica i, che cambierà a seconda dello spostamento, e nel caso della sommatoria esso assumerà tutti i valori dal 1° all’n°

la x con il trattino sopra (che non sono riuscito a trovare nei simboli :D) indica il valore medio

Fatte tutte queste considerazioni possiamo parlare un po’ di analisi tramite i grafici, ovviamente per prima cosa bisogna costruire la distribuzione dei nostri dati nel tempo.

Un modo molto interessante, per esempio, per studiare come cambia la media delle temperature è quella di creare una serie continua di medie, si potrebbe costruire così la media mobile.

La media mobile rappresenta la media di tutti quei valori che stanno dietro all’ultimo dato preso in esame in un intervallo preso a nostro piacimento.

Per farmi capire, una media mobile decennale in un punto qualsiasi del nostro ipotetico grafico rappresenta la media dei 10 anni precedenti quel punto, facendo così otterremo oltre al grafico relativo alla distribuzione dei nostri elementi anche quello relativo alla funzione della nostra media mobile, che ci permette di vedere come la media cambia nell’arco di un decennio.

Infatti la media vanta numerose proprietà, una delle più importanti è il fatto di essere equivariante rispetto a traslazioni e cambiamenti di scala, cioè, qualsiasi trasformazione possano subire i nostri dati la media subirà le stesse identiche trasformazioni, questa proprietà vale anche per la Deviazione Standard

Un’altra media importante è quella smooted, molto usata nella statistica solare, che rappresenta la media di un determinato numero di valori precedenti e superiori a quello preso in esame, non sto a spiegare come si calcola visto che è già presenta nella sezione: Conoscenze Base Sole ( http://daltonsminima.wordpress.com/conoscenze-base-sole/ )

Concentriamoci quindi sull’ultima cosa, l’interpolazione lineare, cioè la costruzione della media lineare, essa non è che una retta passante per il grafico della distribuzione con la proprietà fondamentale di annullare tutti gli scarti da essa, è abbastanza complicato andare a spiegare come si calcola, ma la retta si basa sul principio dei minimi quadrati, ovvero elevando al quadrato la differenza che c’è tra ogni singolo valore e quello corrispondente sulla retta e sommando questo per tutti i valori otteniamo un numero minimo che solo attraverso questo studio è possibile ottenere.

Anche la media aritmetica gode della medesima proprietà, ma la differenza è che la funzione della media è una retta parallela all’asse x e quindi con pendenza zero, mentre la lineare possiede una pendenza.

Il calcolo di questa retta è un po’ difficile da spiegare, percui vi lascio solo queste informazioni, e come ultima cosa vi dico che la lineare andrebbe usata solo quando il nostro grafico è realmente rappresentabile sulla retta, esiste un indice chiamato indice di correlazione lineare che indica proprio se il nostro grafico è approssimabile o no ad una retta ( il valore va da 0 per massima indipendenza a 1 per totale dipendenza ), e vi assicuro che il 95% dei grafici climatici non è rappresentabile con una retta.

Concludo qui, non volendo andare troppo nel complicato, visto che comunque le basi dello studio delle serie climatiche non è poi molto più vasto di quello che ho appena spiegato.

Se ci fossero richieste specifiche fate sapere nei commenti ( soprattutto per quanto riguarda l’interpolazione lineare )

FABIO