Lezioni Di Statistica: Come Calcolare Mediana, Moda e Covarianza

Al pari della Matematica, anche la Statistica è una delle materie universitarie più difficili da studiare ed imparare. La statistica è una disciplina costituita da caratteri, cioè aspetti della realtà osservabili (lo stato di una spiaggia, la professione di una persona che lavora) e variabili, nel senso che possono assumere espressioni differenti (balneabile, inquinata; calzolaio, scrittore, deputato, regista). Questi, a loro volta, devono poter essere rilevati sui soggetti che li esprimono (unità statistiche); questi ultimi devono appartenere a una collettività (un unico dato rilevato su un singolo individuo è privo di interesse per la statistica!). La statistica ha quindi due obiettivi principali: sintetizzare, cioè predisporre i dati raccolti in una forma (tabelle, grafici, sintesi numeriche) che consenta di comprendere meglio i fenomeni rispetto ai quali è stata eseguita la rilevazione. Il suo secondo obiettivo è sintetizzare, cioè estendere il risultato dell’analisi effettuata sui dati di un gruppo limitato di unità statistiche (campione) all’intera collettività di appartenenza (universo, popolazione).

lezioni di statistica

Oggi vorrei esporre una breve guida su come calcolare facilmente e senza sforzo la mediana, la moda e la covarianza, che rappresentano la base principale delle discipline matematiche e scientifiche.

In questo articolo si parla di:

MEDIANA

Nella statistica descrittiva, con il termine mediana si indica il valore (o l’insieme di valori) assunto dalle unità statistiche che si trovano nel mezzo della distribuzione…..se i dati sono dispari; mentre è la somma dei due valori diviso due se i dati sono di numero pari. In particolare, per calcolare la mediana:

  • si ordinano i numeri (n) in ordine crescente (o decrescente);
  • se il numero di dati è dispari, la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione (n + 1) / 2
  • se i dati in questione sono in numero dispari, la mediana è stimata usando i due valori che occupano le posizione (n / 2) e [(n / 2) + 1]. Generalmente, però, si sceglie la loro media aritmetica se il carattere è quantitativo.

Dunque, se la lista dei dati è costituita dai numeri: 18 24 32 60 70, la mediana è 32 (cioè, il valore al centro). Se la lista è costituita da dati in numero dispari come 5 22 34 52, la mediana è 28: cioè: 22 + 34 = 56 / 2 = 28.

MODA

La moda o norma della distribuzione di frequenza X, è la modalità (o la classe di modalità) caratterizzata dalla massima frequenza e viene spesso rappresentata con la simbologia ν0. In pratica, è il valore che compare più frequentemente.

Ciò vuol dire che se abbiamo questa lista di dati: 2 2 4 5 6 7 8, la moda è 2; ovvero il numero che si è ripetuto più volte. Nella sequenza 45 46 46 47 48 50 50, invece, le mode sono due: 46 e 50. Esistono casi in cui la moda può essere nulla, in quanto nessun numero si ripete.

COVARIANZA

La covarianza è un indicatore statistico che esprime la dipendenza tra due variabili. Misura cioè quanto queste variano insieme e si calcola andando ad osservare appunto come si distribuiscono queste variabili. Vediamo come calcolarla. Innanzitutto, il calcolo ci spiega quando due variabili abbiano un andamento che varia contemporaneamente e ci fornisce quindi una indicazione sul grado di dipendenza tra le due. Per calcolare la covarianza, dobbiamo partire dalla distribuzione di due variabili casuali: avendo quindi l’insieme dei valori che le due variabili assumono, possiamo calcolarne la media. La varianza non è altro che il valore atteso (E) del prodotto delle distanze delle due variabili dalla rispettiva media, in statistica indicata con E (variabile). La formula è: Cov (X,Y) = E [(X – E [ X] ] * (Y – E[Y])].

Facciamo un esempio. La variabile X assume valori: 3,5,7.

La variabile Y assume valori: 3,6,9. Innanzitutto, bisognerà calcolare i valori attesi delle due variabili (cioè le medie). E[X]= (3 + 5 + 7) / 3 = 5.  E[Y]= 6 (calcolato con lo stesso procedimento). Ora dobbiamo calcolare le distanze delle variabili dalla media, ottenendo per la variabile X: -2 (3-5), 0 (5-5), 2 (7-5).  Allo stesso modo per Y avremo: -3, 0, 3. A questo punto, calcoliamo il prodotto di queste differenze ottenendo 6 (-2 x -3), 0 (0 x 0), 6 (2 x 3). Infine, dobbiamo calcolare la media di questi prodotti per ottenere la covarianza, che in questo caso è uguale a 4 (cioè la media di 6, 0 e 6).

Condividi suShare on Facebook
Facebook
Tweet about this on Twitter
Twitter

Be the first to comment on "Lezioni Di Statistica: Come Calcolare Mediana, Moda e Covarianza"

Leave a comment

Your email address will not be published.


*