Comment trouver le coefficient de corrélation

Опубликовал Admin
Le coefficient de corrélation, noté r, sert à mesurer la corrélation linéaire (la relation, à la fois en termes de force et de sens) entre deux variables. Il varie entre -1 et 1, les signes moins et plus servant à représenter une corrélation négative ou positive. Si le coefficient de corrélation est égale à -1, alors la relation entre les deux variables est une corrélation négative parfaite. Si le coefficient de corrélation est égale à +1, alors la relation entre les deux variables est une corrélation positive parfaite. Autrement, deux variables peuvent avoir une corrélation positive, une corrélation négative ou pas de corrélation du tout. Si vous devez trouver un coefficient de corrélation, commencez avec l'étape 1.

apprendre les fondamentaux

  1. Comprenez le concept de corrélation. La corrélation renvoie à la relation statistique entre deux quantités. Les statisticiens utilisent souvent la corrélation pour mesurer la dépendance entre deux variables ou plus.
  2. Sachez comment calculer une moyenne. La moyenne arithmétique ou « milieu », est un ensemble de données calculé en additionnant toutes les valeurs de toutes les données, puis en divisant ce nombre par le nombre de valeurs.
    • La moyenne d'une variable se note par la variable dotée d'une ligne horizontale sur le dessus.
  3. Notez l'importance de l'écart-type. En statistiques, l'écart-type mesure la variation, en montrant comment les nombres sont dispersés par rapport à la moyenne.
    • L'écart-type se note mathématiquement Sx, Sy etc. (indiquant « l'écart-type de x, » « l'écart-type de y, » etc.)
  4. Sachez reconnaître la notation des additions. L'opérateur d'additions est l'un des opérateurs les plus courants en mathématiques, indiquant l'addition de valeurs. Il est représenté par la lettre grecque sigma en majuscule ou ∑.
  5. Apprenez la formule de base pour trouver un coefficient de corrélation. La formule pour calculer un coefficient de corrélation utilise la moyenne, l'écart-type et le nombre de paires présent dans votre ensemble de données (représenté par n). Cela ressemble à ça :

trouver le coefficient de corrélation

  1. Rassemblez vos données. Pour calculer un coefficient de corrélation, examinez d'abord vos paires de données. Les mettre dans un tableau peut être utile.
    • Par exemple, disons que vous avez quatre paires de x et y. Le tableau ressemblera à cela :
  2. Calculez la moyenne de x. Afin de calculer la moyenne, vous devez ajouter toutes les valeurs de x, puis diviser ce nombre par le nombre de valeurs, en utilisant la formule suivante :
    • En utilisant l'exemple ci-dessus, notez que vous avez quatre valeurs de x. Pour calculer la moyenne, ajoutez toutes les valeurs données pour x, puis divisez par 4. Vos calculs ressembleront à cela :
  3. Trouvez la moyenne de y. Pour trouver la moyenne de y, suivez les mêmes étapes, en ajoutant toutes les valeurs de y, puis en divisant par le nombre de valeurs :
    • Dans l'exemple ci-dessus, vous avez quatre valeurs de y. Ajoutez toutes ces valeurs, puis divisez par 4. Vos calculs ressembleront à cela :
  4. Déterminez l'écart-type de x. Une fois que vous avez vos moyennes, vous pouvez calculer l'écart-type. Pour ce faire, utilisez la formule suivante :
    • Dans l'exemple ci-dessus, vos calculs devraient ressembler à cela :
    • Notez que la partie de l'équation qui se réfère à xi – la moyenne de x est calculée en soustrayant la moyenne à chaque valeur de x donnée dans votre tableau.
  5. Calculez l'écart-type de y. En utilisant les mêmes étapes simples, trouvez l'écart-type de y. Utilisez la formule suivante :
    • Dans l'exemple ci-dessus, vos calculs devraient ressembler à cela :
    • Encore une fois, notez que la partie de l'équation qui se réfère à yi – la moyenne de y est calculée en soustrayant la moyenne à chaque valeur de y donnée dans votre tableau.
  6. Trouvez le coefficient de corrélation. Vous avez maintenant les moyennes et les écart-types de vos variables, vous pouvez donc poursuivre et utiliser la formule du coefficient de corrélation. Souvenez-vous que n représente le nombre de valeurs que vous avez. Vous avez déjà trouvé les autres informations nécessaires dans les étapes ci-dessus.
    • Dans l'exemple ci-dessus, vous entreriez vos données dans la formule du coefficient de corrélation et calculeriez comme suite : Par conséquent, votre coefficient de corrélation est 0,989949. Notez que ce nombre est très proche de 1, vous avez donc une forte corrélation positive.

Conseils

  • Le coefficient de corrélation est parfois appelé « le coefficient de corrélation de Pearson », en honneur à son concepteur, Karl Pearson.
  • En général, un coefficient de corrélation plus grand que 0,8 (positif ou négatif) représente une forte corrélation. Un coefficient de corrélation inférieur à 0,5 (encore une fois, positif ou négatif) représente une faible corrélation.
Теги: