Cómo hallar el coeficiente de correlación

El coeficiente de correlación, que se denota como r, es la medida de correlación lineal (la relación, en términos tanto de fuerza como de dirección) entre dos variables. Su rango va de -1 a +1, con un signo más y un signo menos para representar la correlación positiva y negativa, respectivamente. Si el coeficiente de correlación es exactamente -1, entonces existe una correlación negativa perfecta entre las dos variables; si el coeficiente de correlación es exactamente +1, entonces existe una correlación positiva perfecta entre las dos variables. Si el coeficiente de correlación tiene otro valor, las dos variables podrían tener una correlación positiva, una correlación negativa o no tener correlación. Si necesitas hallar un coeficiente de correlación, ve al paso 1.

Aprende los principios básicos

  1. Entiende el concepto de correlación. La correlación se refiere a la relación estadística entre dos cantidades. Los estadísticos frecuentemente utilizan la correlación para medir la dependencia de dos o más variables.
  2. Ten en cuenta cómo hallar una media. La media aritmética o “promedio” de un conjunto de datos se calcula sumando los valores de los datos y, posteriormente, dividiendo el resultado entre el número de valores.
    • La media de una variable se denota colocando una línea horizontal sobre ella.
  3. Date cuenta de la importancia de la desviación estándar. En la estadística, la desviación estándar mide la variación, mostrando cómo los números se dispersan en relación a la media.
    • Matemáticamente, la desviación estándar se expresa como Sx, Sy y así sucesivamente (lo que indica “la desviación estándar de x”, “la desviación estándar de y”, etc.).
  4. Reconoce la notación de sumatoria. El operador de sumatoria es uno de los operadores más comunes en las matemáticas, el cual indica una suma de valores. Se representa con la letra griega sigma mayúscula: ∑.
  5. Aprende la fórmula básica para hallar el coeficiente de correlación. La fórmula para calcular el coeficiente de correlación utiliza medias, desviaciones estándar y el número de pares de tu conjunto de datos (representado por n). La fórmula es como se muestra en la imagen.

Halla el coeficiente de correlación

  1. Reúne los datos. Para calcular el coeficiente de correlación, primero deberás examinar los pares de tus datos. Ponerlos es una tabla es útil.
    • Por ejemplo, digamos que tienes cuatro pares de datos para x e y. La tabla será como se muestra en la imagen.
  2. Calcula la media de x. Para calcular la media, debes sumar todas los valores de x; luego, divide el resultado entre el número de valores, utilizando la fórmula que se muestra en la imagen.
    • Usando el ejemplo anterior, verás que tienes 4 valores para x. Para calcular la media, suma los valores dados para x; luego, divide el resultado entre 4. Tus cálculos deben ser como se muestra en la imagen.
  3. Halla la media de y. Para hallar la media de y, sigue los mismos pasos: suma todos los valores de y; luego, divide el resultado entre el número de valores.
    • En el ejemplo anterior, tienes cuatro valores para y. Suma estos valores; luego, divide el resultado entre 4. Tus cálculos deben ser como se muestra en la imagen.
  4. Determina la desviación estándar de x. Una vez que tengas las medias, podrás calcular la desviación estándar. Para hacerlo, utiliza la fórmula que se muestra en la imagen.
    • En el ejemplo anterior, tus cálculos deben ser como se muestra en la imagen.
    • Date cuenta de que la parte de la ecuación que se refiere a xi – la media de x se calcula restando la media a cada uno de los valores dados de x, los cuales están registrados en la tabla.
  5. Calcula la desviación estándar de y. Utilizando los mismos pasos básicos, halla la desviación estándar de y. Utiliza la fórmula que se muestra en la imagen.
    • En el ejemplo anterior, tus cálculos deben ser como se muestra en la imagen.
    • Nuevamente, date cuenta de que la parte de la ecuación que se refiere a yi – la media de y se calcula restando la media de cada uno de los valores dados de y, los cuales están registrados en la tabla.
  6. Halla el coeficiente de correlación. Ahora que tienes las medias y las desviaciones estándar de las variables, puedes proceder a utilizar la fórmula del coeficiente de correlación. Recuerda que n representa el número de valores que tienes. Ya has calculado la información relevante en los pasos previos.
    • En el ejemplo anterior, ingresa los datos a la fórmula del coeficiente de correlación y haz los cálculos que se muestran en la imagen. Tu coeficiente de correlación, por lo tanto, es 0,989949. Date cuenta de que este número es muy cercano a +1; por lo tanto, tienes una fuerte correlación positiva.

Consejos

  • El coeficiente de correlación a veces se conoce como “coeficiente de correlación del producto-momento de Pearson” en honor a Karl Pearson, quien lo desarrolló.
  • En general, un coeficiente de correlación mayor a 0,8 (ya sea positivo o negativo) representa una correlación fuerte; un coeficiente de correlación menor a 0,5 (ya sea positivo o negativo) representa una correlación débil.
Información
Usuarios que están en este grupo no pueden dejar comentarios en la página