Как рассчитать линейный коэффициент корреляции

Линейный коэффициент корреляции, обозначаемый буквой r – это мера линейной корреляции (отношение, учитывающее как интенсивность, так и направление) между двумя переменными. Оно находится в интервале от -1 до +1, причем знаки плюс и минус используются для представления положительной и отрицательной корреляции. Если линейный коэффициент корреляции равен -1, то отношение между двумя переменными – это идеальная отрицательная аппроксимация; если же он равен +1, то соотношение представляет собой идеальную положительную аппроксимацию. В других случаях, две переменные могут характеризоваться положительной корреляцией, отрицательной корреляцией или отсутствием корреляции. Если вам нужно найти коэффициент линейной корреляции, то начинайте читать шаг 1.

Часть 1 из 2: Основы

  1. Усвойте концепцию корреляции. Корреляцией называется статистическое отношение между двумя величинами. Специалисты в области статистики часто используют корреляцию для того, чтобы определить взаимосвязь двух или более переменных.
  2. Знайте, как найти среднее. Среднее арифметическое, или просто “среднее”, подборки данных вычисляется сложением всех значений и делением результата на количество значений.
    • Среднее значение обозначается как символ переменной с горизонтальной чертой над ним.
  3. Обратите внимание на важность среднеквадратического отклонения. В статистике среднеквадратическое отклонение является мерой варьирования и отражает то, как данные рассеяны по отношению к среднему значению.
    • Математически среднеквадратическое отклонение обозначается как Sx, Sy, и так далее (что означает “среднеквадратическое отклонение x,” “ среднеквадратическое отклонение y,” и т.д.).
  4. Разберитесь в записи суммы. Оператор суммы – один из самых распространенных в математике и означает сумму значений. Он обозначается заглавной греческой буквой сигма, или ∑.
  5. Изучите простейшую формулу для расчета линейного коэффициента корреляции. Формула расчета линейного коэффициента корреляции использует средние значения, среднеквадратические отклонение и количество пар в группе данных (обозначаемых n). Она выглядит следующим образом:

Часть 2 из 2: Нахождение линейного коэффициента корреляции

  1. Соберите все ваши данные. Чтобы рассчитать линейный коэффициент корреляции, сначала взгляните на ваши пары данных. Полезно записать их в виде таблицы.
    • Допустим, например, что у вас есть пары данных x и y. Таблица будет выглядеть следующим образом:
  2. Вычислите среднее значение x-ов. Чтобы вычислить среднее значение, вам нужно будет сложить все значения x, а затем разделить получившуюся сумму на количество значений, используя следующую формулу:
    • В нашем примере у нас есть четыре значения для x. Чтобы вычислить среднее, сложите все значения x, а затем разделите их на 4. Ваши расчеты будут выглядеть так:
  3. Найдите среднее значение y-ов. Чтобы найти среднее значение y-ов, придерживайтесь таких же шагов, сложив все значения y, а затем разделив их на количество значений:
    • В нашем примере есть четыре значения y. Сложите все эти значения, а затем разделите ответ на 4. Ваши расчеты будут выглядеть так:
  4. Определите среднеквадратическое отклонение x. Как только вы получите ваши средние значения, вы можете вычислить среднеквадратическое отклонение. Для этого воспользуйтесь следующей формулой:
    • Для приведенного выше примера ваши расчеты должны выглядеть следующим образом:
    • Обратите внимание, что часть уравнения, содержащая xi – среднее значение x, вычисляется вычитанием среднего из каждого значения x в вашей таблице.
  5. Вычислите среднеквадратическое отклонение y. Используя такие же шаги, найдите среднеквадратическое отклонение y. Используйте следующую формулу:
    • В нашем примере ваши расчеты будут иметь следующий вид:
    • И снова, обратите внимание, что часть уравнения, содержащая yi – среднее значение y вычисляется вычитанием среднего из каждого значения y в вашей таблице.
  6. Найдите линейный коэффициент корреляции. Теперь у вас есть средние значения и среднеквадратические отклонения ваших переменных, следовательно, вы можете переходить к к использованию формулы линейной корреляции. Помните, что n представляет собой число имеющихся у вас переменных. Другая информация относительно данной формулы была рассмотрена выше.
    • В нашем примере вы должны вводить данные в формулу линейного коэффициента корреляции и производить вычисления следующим образом: Таким образом, коэффициент линейной корреляции будет равен 0,989949. Обратите внимание, что это число очень близко к +1, поэтому эти значения характеризуются сильной положительной корреляцией.

Советы

  • Линейный коэффициент корреляции иногда называют “коэффициентом корреляции Пирсона”, в честь предложившего его ученого, Карла Пирсона.
  • В общем, коэффициент линейной корреляции больше 0,8 (как положительный, так и отрицательный) отражает сильную корреляцию, коэффициент линейной корреляции менее 0,5 (опять же, как положительный, так и отрицательный) отражает слабую корреляцию.
Информация
Посетители, находящиеся в группе Guests, не могут оставлять комментарии к данной публикации.