Il coefficiente di variazione, chiamato anche coefficiente di variazione di Spearman, è una misura statistica che ci informa sulla dispersione relativa di un insieme di dati. Si calcola dividendo la deviazione standard per il valore assoluto della media dell’insieme e viene solitamente espressa in percentuale per una migliore comprensione.
Il coefficiente di variazione può essere visto espresso con le lettere CV o r, a seconda del manuale o del font utilizzato. La sua formula è la seguente:
Il coefficiente di variazione è utilizzato per confrontare insiemi di dati appartenenti a diverse popolazioni. Se guardiamo la loro formula, vediamo che tiene conto del valore della media. Pertanto, il coefficiente di variazione ci permette di avere una misura di dispersione che elimina le possibili distorsioni delle medie di due o più popolazioni.
Esempi di utilizzo del coefficiente di variazione al posto della deviazione standard
Confronto di serie di dati di diverse dimensioni
Si vuole acquistare la dispersione tra l’altezza di 50 studenti in una classe e il loro peso. Per confrontare l’altezza potremmo usare metri e centimetri come unità di misura e per il peso il chilogrammo. Il confronto di queste due distribuzioni per mezzo della deviazione standard non avrebbe senso, poiché stiamo cercando di misurare due diverse variabili qualitative (una misura di lunghezza e una misura di massa).
Confrontare i set con grandi differenze tra le medie
Immaginate, ad esempio, di voler misurare il peso dei coleotteri e dell’ippopotamo. Il peso dei coleotteri è misurato in grammi o milligrammi e il peso dell’ippopotamo è solitamente misurato in tonnellate. Se per la nostra misurazione convertiamo il peso dei coleotteri in tonnellate in modo che entrambe le popolazioni si trovino sulla stessa scala, utilizzare la deviazione standard come misura della dispersione non sarebbe appropriato. Il peso medio dei coleotteri misurato in tonnellate sarebbe così piccolo, che se usassimo la deviazione standard, non ci sarebbe quasi nessuna dispersione nei dati. Questo sarebbe un errore, poiché il peso tra le diverse specie di coleotteri può variare notevolmente.
Esempio di calcolo del coefficiente di variazione
Pensiamo a una popolazione di elefanti e a una popolazione di topi. La popolazione di elefanti ha un peso medio di 5.000 chilogrammi e una deviazione standard di 400 chilogrammi. La popolazione di topi ha un peso medio di 15 grammi e una deviazione standard di 5 grammi. Se dovessimo confrontare la dispersione di entrambe le popolazioni utilizzando la deviazione standard, penseremmo che vi sia una dispersione maggiore per la popolazione di elefanti che per quella di topi.
Tuttavia, quando si calcola il coefficiente di variazione per entrambe le popolazioni, ci si rende conto che è proprio il contrario.
Elefanti: 400/500=0,08Anti:
5/15=0,33
Se moltiplichiamo entrambi i dati per 100, abbiamo che il coefficiente di variazione per gli elefanti è solo dell’8%, mentre quello dei topi è del 33%. Come risultato della differenza tra le popolazioni e il loro peso medio, vediamo che la popolazione con la maggiore dispersione non è quella con la maggiore deviazione standard.