Como Encontrar o Coeficiente de Correlação

O coeficiente de correlação, denotado como r, é a medida da correlação linear (a relação, em termos de força e direção) entre duas variáveis. Ele varia de -1 a +1, sendo que os sinais de mais e de menos representam uma relação positiva ou negativa. Se o coeficiente de correlação for exatamente -1, então a relação entre as duas variáveis é um ajuste perfeito negativo; e se for +1, trata-se de um ajuste perfeito positivo. Do contrário, duas variáveis ​​podem ter uma correlação positiva, uma correlação negativa ou não haver nenhuma correlação. Se você precisa encontrar um coeficiente de correlação, comece no Passo 1.

Aprendendo os Fundamentos

  1. Entenda o conceito de correlação. A correlação refere-se à relação estatística entre duas quantidades. Os estatísticos usam-na com frequência para medir a dependência de duas ou mais variáveis.
  2. Saiba como encontrar uma média. A média aritmética, ou simplesmente "média", de um conjunto de dados é calculada somando todos os valores observados, e depois dividindo pelo número de valores dos dados.
    • A média de uma variável é indicada pela variável com uma linha horizontal acima dela.
  3. Saiba a importância do desvio padrão. Em estatística, o desvio padrão mede a variação, mostrando como os números estão espalhados em relação à média.
    • Matematicamente, o desvio padrão é expresso como Sx, Sy, e assim por diante (indicando "o desvio padrão de x", " o desvio padrão de y", etc.).
  4. Reconheça a notação somatória. O operador de soma é um dos operadores mais comuns em matemática, o que indica uma soma de valores. Ele é representado pela letra maiúscula grega sigma, ou Σ.
  5. Aprenda a fórmula básica para encontrar um coeficiente de correlação. Essa fórmula usa médias, desvios-padrão e o número de pares em seu conjunto de dados (representado por n). Ela fica assim:

Encontrando o Coeficiente de Correlação

  1. Reúna seus dados. Para calcular uma correlação eficiente, primeiro examine os seus pares de dados. É útil colocá-los em uma tabela.
    • Por exemplo, digamos que você tem quatro pares de dados para x e y. A tabela será parecida com esta:
  2. Calcule a média de x. Para calcular a média, você deve somar todos os valores de x e depois dividir pelo número de valores, usando a seguinte fórmula:
    • Usando o exemplo acima, note que você tem quatro valores para x. Para calcular a média, some todos os valores indicados para x e depois divida por 4. Seus cálculos ficariam assim:
  3. Encontre a média de y. Para fazer isso, siga os mesmos passos, somando todos os valores de y e depois dividindo pelo número de valores:
    • No exemplo acima, você tem quatro valores para y. Some todos esses valores e depois divida por 4. Seus cálculos ficariam assim:
  4. Determine o desvio padrão de x. Após obter as médias, é possível calcular o desvio-padrão. Para fazer isso, use a seguinte fórmula:
    • No exemplo acima, os cálculos devem ficar assim:
    • Observe que parte da equação referente a x i </ sub> – a média de x – é calculada subtraindo a média de cada valor de x fornecido na tabela.
  5. Calcule o desvio-padrão de y. Usando os mesmos passos básicos, encontre o desvio-padrão de y. Use a seguinte fórmula:
    • No exemplo acima, os cálculos devem ficar assim:
    • Observe, mais uma vez, que a parte da equação referente a yi – a média de y – é calculada subtraindo a média de cada valor de y fornecido na tabela.
  6. Encontre o coeficiente de correlação. Agora você tem as médias e os desvios-padrão para as variáveis, então já é possível continuar a usar a fórmula do coeficiente de correlação. Lembre-se que n representa o número de valores que você tem. Você já descobriu as outras informações relevantes nos passos anteriores.
    • No exemplo acima, você deve digitar seus dados na fórmula do coeficiente de correlação e calcular como se segue: O seu coeficiente de correlação, portanto, é 0,989949. Note que este número está muito próximo de +1, então você tem uma forte correlação positiva.

Dicas

  • O coeficiente de correlação também é chamado de "Coeficiente de correlação produto-momento de Pearson" em homenagem ao seu criador, Karl Pearson.
  • Em geral, um coeficiente de correlação maior que 0.8 (positivo ou negativo) representa uma correlação forte; um coeficiente menor que 0.5 (mais uma vez, positivo ou negativo) representa uma correlação fraca.
Information
Users of Guests are not allowed to comment this publication.