Come Trovare il Coefficiente di Correlazione

Il coefficiente di correlazione, indicato con “r”, è la misura della correlazione lineare (la relazione, in termini sia di forza che di direzione) fra due variabili. Varia da -1 a +1, con i segni più e meno usati per rappresentare la correlazione positiva o negativa. Se il coefficiente di correlazione è esattamente -1, allora la relazione fra le due variabili è un fit completamente negativo; se il coefficiente di correlazione è esattamente +1, allora la relazione fra le due variabili è un fit completamente positivo. Altrimenti, due variabili possono avere una correlazione positiva, una correlazione negativa, o nessuna correlazione. Se devi trovare il coefficiente di correlazione, vai al Passo 1.

Comprendere le Basi

  1. Capire il concetto di correlazione. La correlazione fa riferimento alla relazione statistica fra due quantità. Gli statistici spesso usano il coefficiente di correlazione per misurare la dipendenza fra due o più variabili.
  2. Capire come trovare una media. La media aritmetica, o “media”, di un insieme di dati è calcolata sommando tutti i valori dei dati fra loro, e poi dividendo per il numero di valori.
    • La media di una variabile viene indicata con la variabile con una linea orizzontale al di sopra di essa.
  3. Notare l’importanza della deviazione standard. In statistica, la deviazione standard misura le variazioni, mostrando come i numeri sono diffusi in relazione alla media.
    • Matematicamente, la deviazione standard viene espressa come Sx, Sy, e così via (Sx idica la deviazione standard di x, Sy la deviazione standard di y, ecc...).
  4. Riconoscere la notazione di sommatoria. L’operatore di sommatoria è uno degli operatori più comuni in matematica ed indica la somma dei valori. Viene rappresentato con la lettera greca maiuscola sigma, o ∑.
  5. Imparare la formula base per trovare il coefficiente di correlazione. La formula per calcolare il coefficiente di correlazione usa le medie, le deviazioni standard, e il numero di coppie nel tuo insieme di dati (rappresentato da n). Appare come in figura.

Trovare il Coefficiente di Correlazione

  1. Radunare i dati. Per calcolare un coefficiente di correlazione, per prima cosa esamina le tue coppie di dati. È utile inserirle in una tabella.
    • Ad esempio, supponiamo che tu abbia quattro coppie di dati per x e y. La tabella avrà l’aspetto mostrato in figura.
  2. Calcolare la media di x. Per calcolare la media, devi sommare tutti i valori di x, poi dividere per il numero di valori, usando la seguente formula:
    • Utilizzando l’esempio precedente, nota che possiedi quattro valori per x. Per calcolare la media, somma tutti i valori dati per x, e poi dividi per 4. I tuoi calcoli avranno l’aspetto mostrato nella figura.
  3. Trovare la media di y. Per trovare la media di y, segui gli stessi passi, sommando fra loro tutti i valori di y, poi dividendo per il numero di valori:
    • Nell’esempio precedente, possiedi quattro valori per y. Somma tutti questi valori, poi dividi per 4. I tuoi calcoli dovranno avere l’aspetto di quelli mostrati in figura.
  4. Determinare la deviazione standard di x. Una volta che possiedi le tue medie, puoi calcolare la deviazione standard. Per farlo, usa la seguente formula:
    • Nell’esempio sopra, i tuoi calcoli dovranno avere l’aspetto mostrato in figura.
    • Nota che la parte dell’equazione che fa riferimento ad Xi – la media di x viene calcolata sottraendo la media da ogni valore di x presente nella tua tavola.
  5. Calcolare la deviazione standard di y. Usando gli stessi passi di base, trova la deviazione standard di y. Usa la formula seguente:
    • Nell’esempio precedente i tuoi calcoli avranno l’aspetto mostrato in figura.
    • Nota, nuovamente, che la parte dell’equazione che fa riferimento ad Yi – la media di y viene valvolata sottraendo la media ad ogni valore di y presente nella tua tavola.
  6. Trovare il coefficiente di correlazione. Ora hai le medie e le deviazioni standard per le tue variabili, quindi puoi procedere ad usare la formula per il coefficiente di correlazione. Ricorda che n rappresenta il numero di valori che possiedi. Hai già ottenuto le informazioni necessarie ai passi precedenti.
    • Nell’esempio precedente, inserirai i tuoi dati nella formula per il coefficiente di correlazione e calcolerai come mostrato in figura. Il tuo coefficiente di correlazione è quindi 0,989949. Nota che questo numero è molto vicino a +1, quindi hai una correlazione completamente positiva.

Consigli

  • Il coefficiente di correlazione viene anche detto “Indice di Correlazione di Pearson” in onore del suo ideatore, Karl Pearson.
  • In generale, un coefficiente di correlazione maggiore di 0,8 (sia positivo che negativo) rappresenta una correlazione forte; un coefficiente di correlazione minore di 0,5 (sia positivo che negativo) ne rappresenta uno debole.
Information
Users of Guests are not allowed to comment this publication.