Корреляция - это просто. Что такое корреляция и как трактовать значение коэффициента

06.06.2018 14 012 0 Игорь

Психология и общество

Все в мире взаимосвязано. Каждый человек на уровне интуиции пытается найти взаимосвязи между явлениями, чтобы иметь возможность влиять на них и управлять ними. Понятие, которое отражает эту взаимосвязь, называется корреляцией. Что она означает простыми словами?

Содержание:

Понятие корреляции

Корреляция (от латинского «correlatio» – соотношение, взаимосвязь) – математический термин, который означает меру статистической вероятностной зависимости между случайными величинами (переменными).



Пример: возьмем два вида взаимосвязи:

  1. Первый – ручка в руке человека. В какую сторону движется рука, в такую сторону и ручка. Если рука находится в состоянии покоя, то и ручка не будет писать. Если человек чуть сильнее надавит на нее, то след на бумаге будет насыщеннее. Такой вид взаимосвязи отражает жесткую зависимость и не является корреляционным. Это взаимосвязь – функциональная.
  2. Второй вид – зависимость между уровнем образования человека и прочтением литературы. Заранее неизвестно, кто из людей больше читает: с высшим образованием или без него. Эта связь – случайная или стохастическая, ее изучает статистическая наука, которая занимается исключительно массовыми явлениями. Если статистический расчет позволит доказать корреляционную связь между уровнем образованности и прочтением литературы, то это даст возможность делать какие-либо прогнозы, предсказывать вероятностное наступление событий. В этом примере с большой долей вероятности можно утверждать, что больше читают книги люди с высшим образованием, те, кто более образован. Но поскольку связь между данными параметрами не функциональная, то мы можем и ошибиться. Всегда можно рассчитать вероятность такой ошибки, которая будет однозначно невелика и называется уровнем статистической значимости (p).

Примерами взаимосвязи между природными явлениями являются: цепочка питания в природе, организм человека, который состоит из систем органов, взаимосвязанных между собой и функционирующих как единое целое.

Каждый день мы сталкиваемся с корреляционной зависимостью в повседневной жизни: между погодой и хорошим настроением, правильной формулировкой целей и их достижением, положительным настроем и везением, ощущением счастья и финансовым благополучием. Но мы ищем связи, опираясь не на математические расчеты, а на мифы, интуицию, суеверия, досужие домыслы. Эти явления очень сложно перевести на математический язык, выразить в цифрах, измерить. Другое дело, когда мы анализируем явления, которые можно просчитать, представить в виде цифр. В таком случае мы можем определить корреляцию с помощью коэффициента корреляции (r), отражающего силу, степень, тесноту и направление корреляционной связи между случайными переменными.

Сильная корреляция между случайными величинами – свидетельство наличия некоторой статистической связи конкретно между этими явлениями, но эта связь не может переноситься на эти же явления, но для другой ситуации. Часто исследователи, получив в расчетах значительную корреляцию между двумя переменными, основываясь на простоте корреляционного анализа, делают ложные интуитивные предположения о существовании причинно-следственных взаимосвязей между признаками, забывая о том, что коэффициент корреляции носит вероятностный характер.

Пример: количество травмированных во время гололеда и число ДТП среди автотранспорта. Эти величины будут коррелировать между собой, хотя они абсолютно не взаимосвязаны между собой, а имеют только связь с общей причиной этих случайных событий – гололедицей. Если же анализ не выявил корреляционной взаимосвязи между явлениями, это еще не является свидетельством отсутствия зависимости между ними, которая может быть сложной нелинейной, не выявляющейся с помощью корреляционных расчетов.




Первым, кто ввел в научный оборот понятие корреляции, был французский палеонтолог Жорж Кювье . Он в XVIII веке вывел закон корреляции частей и органов живых организмов, благодаря которому появилась возможность восстанавливать по найденным частям тела (останкам) облик всего ископаемого существа, животного. В статистике термин корреляции впервые применил в 1886 году английский ученый Френсис Гальтон . Но он не смог вывести точную формулу для расчета коэффициента корреляции, но это сделал его студент – известнейший математик и биолог Карл Пирсон.

Виды корреляции

По значимости – высокозначимая, значимая и незначимая.

Виды

чему равен r

Высокозначимая

r соответствует уровню статистической значимости p<=0,01

Значимая

r соответствует p<=0,05

Незначимая

r не достигает p>0,1

Отрицательная (уменьшение значения одной переменной ведет к росту уровня другой: чем больше у человека фобий, тем меньше вероятность занять руководящую должность) и положительная (если рост одной величины влечет за собой увеличение уровня другой: чем больше нервничаешь, тем больше вероятность заболеть). Если связи между переменными нет, то тогда такая корреляция называется нулевой.

Линейная (когда одна величина возрастает или убывает, вторая тоже увеличивается или уменьшается) и нелинейная (когда при изменении одной величины характер изменения второй невозможно описать с помощью линейной зависимости, тогда применяются другие математические законы – полиномиальной, гиперболической зависимости).

По силе .

Коэффициенты




В зависимости от того, к какой шкале относятся исследуемые переменные, рассчитываются разные виды коэффициентов корреляции:

  1. Коэффициент корреляции Пирсона, коэффициент парной линейной корреляции или корреляция моментов произведений рассчитывается для переменных с интервальной и количественной шкалой измерения.
  2. Коэффициент ранговой корреляции Спирмена или Кендалла – когда хотя бы одна из величин имеет порядковую шкалу либо не является нормально распределённой.
  3. Коэффициент точечной двухрядной корреляции (коэффициент корреляции знаков Фехнера) – если одна из двух величин является дихотомической.
  4. Коэффициент четырёхполевой корреляции (коэффициент множественной ранговой корреляции (конкордации) – если две переменные дихотомические.

Коэффициент Пирсона относится к параметрическим показателям корреляции, все остальные – к непараметрическим.

Значение коэффициента корреляции находится в пределах от -1 до +1. При полной положительной корреляции r = +1, при полной отрицательной – r = -1.

Формула и расчет





Примеры

Необходимо определить взаимосвязь двух переменных: уровня интеллектуального развития (по данным проведенного тестирования) и количества опозданий за месяц (по данным записей в учебном журнале) у школьников.

Исходные данные представлены в таблице:

Данные по уровню IQ (x)

Данные по количеству опозданий (y)

Сумма

1122

Среднее арифметическое

112,2


Чтобы дать правильную интерпретацию полученному показателю, необходимо проанализировать знак коэффициента корреляции (+ или -) и его абсолютное значение (по модулю).

В соответствии с таблицей классификации коэффициента корреляции по силе делаем вывод о том, rxy = -0,827 – это сильная отрицательная корреляционная зависимость. Таким образом, количество опозданий школьников имеет очень сильную зависимость от их уровня интеллектуального развития. Можно сказать, что ученики с высоким уровнем IQ опаздывают реже на занятия, чем ученики с низким IQ.



Коэффициент корреляции может применяться как учеными для подтверждения или опровержения предположения о зависимости двух величин или явлений и измерения ее силы, значимости, так и студентами для проведения эмпирических и статистических исследований по различным предметам. Необходимо помнить, что этот показатель не является идеальным инструментом, он рассчитывается лишь для измерения силы линейной зависимости и будет всегда вероятностной величиной, которая имеет определенную погрешность.

Корреляционный анализ применяется в следующих областях:

  • экономическая наука;
  • астрофизика;
  • социальные науки (социология, психология, педагогика);
  • агрохимия;
  • металловедение;
  • промышленность (для контроля качества);
  • гидробиология;
  • биометрия и т.д.

Причины популярности метода корреляционного анализа:

  1. Относительная простота расчета коэффициентов корреляции, для этого не нужно специальное математическое образование.
  2. Позволяет рассчитать взаимосвязи между массовыми случайными величинами, которые являются предметом анализа статистической науки. В связи с этим этот метод получил широкое распространение в области статистических исследований.

Надеюсь, теперь вы сможете отличить функциональную взаимосвязь от корреляционной и будете знать, что когда вы слышите по телевидению или читаете в прессе о корреляции, то под ней подразумевают положительную и достаточно значимую взаимозависимость между двумя явлениями.

Мы уже неплохо углубились в искусство корреляций и теперь займемся непосредственно валютными парами. Вы наверняка не раз замечали, что когда одна валютная пара идет вверх, то вторая стремится вниз. Либо взаимосвязь между ними и вовсе прямая - падает курс одной пары, вместе с ней падает и курс другой.

Так и выглядит корреляция валютных пар - взаимосвязь, что нередко используется в торгах.

Как валютные пары взаимодействуют друг с другом

Корреляция отображает лишь то, как именно два актива двигаются по отношению друг к другу. В случае валютной корреляции абсолютно та же петрушка. Пары могут двигаться вместе, в разных направлениях или вообще никак не взаимодействовать.

Не забывайте, что мы торгуем не просто валюту - а валютную пару, где каждый участник пары влияет на другого. Поэтому корреляция может стать полезным инструментом и чуть ли не единственным, если вы хотите успешно торговать сразу несколькими валютными парами одновременно.

Валютная корреляция основана на так называемом коэффициенте корреляции , который находится в простом диапазоне между -1 и +1.

  • Идеальная позитивная корреляция (коэффициент +1) означает, что две валютные пары двигаются в одном направлении в 100% случаев.
  • Идеальная негативная корреляция (коэффициент -1) подразумевает ровно противоположное. Пары постоянно двигаются в разных направлениях.

Если же корреляция равна 0, следовательно корреляции нет вообще, она нулевая и пары никак не связаны.

Где искать корреляцию валют

Уж точно не самому на графике, вот еще, время тратить. Мы воспользуемся замечательным инструментом Oanda, что называется Currensee . Он нам покажет, как именно валютные пары смещаются по отношению друг к другу. Находится он по адресу:

Как видите, все сравнения осуществляются по отношению к исходной и самой популярной паре EUR/USD. По умолчанию предлагается «пузырьковый» формат, где чем больше синий кружок - тем больше отрицательная корреляция, а чем больше красный - тем ярче выражена позитивная связь.

Вариант с таблицей корреляции валютных пар более наглядный:

Тепловая карта - расширенный вариант пузырькового графика

Риски валютных корреляций

Если вы одновременно работаете с несколькими валютными парами, вы должны сразу осознавать, насколько такая торговля подвержена риску. Иногда люди выбирают сразу несколько пар чтобы свои риски минимизировать, но забывают про позитивную корреляцию, когда пары идут в одном и том же направлении.

Предположим, мы взяли две пары на 4-часовом таймфрейме, EUR/USD и GBP/USD:

Коэффициент корреляции составляет 0.94 , очень мило. Это значит, что обе пары следуют буквально друг за другом, как маньяк и его жертва. Как видим, обе идут вниз, практически зеркально.

Если открыть сделки на обе пары - мы, тем самым, сразу же удваиваем нашу позицию - и риски. Они увеличиваются! Потому что если вы окажетесь неправы с прогнозом - вы будете неправы сразу вдвойне, поскольку что пары зеркальны.

Поставили вверх, цена пошла вниз - двойной убыток. Вот вам и корреляция. Также нет смысла продавать один инструмент и покупать другой, ведь даже при точном прогнозе, один из них принесет вам убыток. В бинарных одна успешная сделка не перекрывает неудачную - выплаты-то меньше 100%. А в форексе стоимость пунктов для разных валютных пар тоже разная.

Различается и волатильность. Одна пара может подскочить на 200 пунктов, вторая - только на 180. Поэтому играться с одновременными сделками на разных парах нужно предельно аккуратно и без фанатизма, корреляция здесь решает все.

Теперь сравним противоположный вариант, пары EUR/USD и USD/CHF. У них все наоборот, сильная обратная корреляция, где коэффициент нередко достигает абсолютного значения -1.00 .

Пары как два магнита с противоположными полюсами, постоянно отталкиваются друг от друга.

Если открыть противоположные сделки по двум парам с негативной корреляцией, это будет тоже самое, как две одинаковые сделки на парах с позитивной корреляцией - снова удвоение вашего риска.

Самое разумное, безусловно, работать только с одной парой и не играться в противоположные парные сделки, ибо можно очень быстро доиграться до некрасивых показателей.

Коэффиценты корреляции

Теперь посмотрим, как можно рассматривать коррелирующие коэффициенты.

  • -1.0. Идеальная обратная корреляция.
  • -0.8. Очень сильная обратная корреляция.
  • -0.6. Сильная обратная корреляция
  • -0.4. Умеренная обратная корреляция.
  • -0.2. Слабая обратная корреляция
  • 0. Корреляция отсутствует
  • 0.2. Слабая, незначительная корреляция
  • 0.4. Слабая корреляция
  • 0.6. Умеренная корреляция
  • 0.8. Сильная корреляция
  • 1.0. Идеальная корреляция

Так что делать с корреляцией, ее можно использовать или как?

1. Устранение риска

Если вы любите открывать одновременные сделки на разных парах, знание об их корреляции поможет не попасться в описанную ситуацию, когда вы удваиваете риски, если две пары идут в одинаковом направлении.

Либо вы ставите в разных направлениях, не понимая, что у пар - обратная корреляция и это снова удваивает ваш риск.

2. Удвоение доходов или убытков

Если уж вы решили поиграться с одновременными сделками на разные пары, удачная сделка с парами, что имеют прямую корреляцию, удвоит ваши доходы. Или убытки, естественно, если что-то пошло не так и прогноз оказался неверным.

3. Диверсификация рисков

Рыночные риски можно распределять по двум валютным парам. Если вы, безусловно, понимаете, что делаете и если между парами не идеальная корреляция. Для этого берутся пары с прямой корреляцией в районе 0.7 (не выше), скажем, EUR/USD и GBP/USD.

Допустим, вы ставите на рост USD. Вместо двух ставок на понижение курса EUR/USD, можно поставить на понижение EUR/USD и GBP/USD. Если доллар упадет, то евро будет затронуто меньше, нежели фунт.

4. Хеджирование рисков

Этот прием используется уже на форексе, где во внимание берется то, что у каждой валютной пары своя стоимость пункта. Если вы открыли позицию на повышение EUR/USD, а цена идет против вас, то позиция на понижение в противоположной паре, такой как USD/CHF может вас выручить.

Не надо забывать про разную стоимость пунктов в форексе. Скажем, между EUR/USD и USD/CHF почти идеальная корреляция, вот только при торгах минилотом в 10000 долларов, один пункт EUR/USD стоит 1 доллар, а USD/CHF – 0.93 доллара.

В результате, приобретение минилота EUR/USD позволяет хеджировать свои риски при одновременной покупке минилота на USD/CHF. Если EUR/USD упадет на 10 пунктов, вы потеряли 10 долларов. Однако, доход по USD/CHF составит 9.30. А значит, вместо 10 долларов вы потеряете лишь 70 центов, прекрасно.

Хеджирование в форексе выглядит замечательным, однако, недостатков тоже хватает. Ибо при бешеном росте EUR/USD вы одновременно теряете деньги на USD/CHF. Кроме того, корреляция редко бывает идеальной, она постоянно плавает, поэтому вместо хеджирования вы можете все потерять.

5. Корреляция, пробои и ложные пробои

Корреляцию можно использовать и для прогнозирования поведения цены у значимых уровней. Предположим, что EUR/USD тестирует значимый уровень поддержки. Мы это дело изучили и решили входить на пробое уровня. Поскольку EUR/USD позитивно коррелируется с GBP/USD и негативно - с USD/CHF и USD/JPY, необходимо проверить, двигаются ли три другие пары в такой же волатильности, как EUR/USD.

Скорее всего, GBP/USD тоже «трется» около уровня сопротивления, а USD/CHF и USD/JPY около ключевых уровней сопротивления. Все это указывает на то, что балом здесь правит доллар и есть все указания на пробой для EUR/USD, поскольку все три пары двигаются синхронно. Остается дождаться пробоя.

А теперь представим, что эти три пары не двигаются синхронно вместе с EUR/USD. Скажем, GBP/USD и не думает падать, USD/JPY не растет, а USD/CHF вообще «тошнит» в боковом движении. О чем это говорит? Лишь о том, что падение EUR/USD не связано с долларом и явно вызвано негативными новостями из еврозоны.

Цена может находится и ниже ключевого уровня поддержки, однако, если у трех коррелирующих пар нет достаточно синхронного движения с EUR/USD, ждать пробоя не стоит. Мало того - вполне может быть и всеми нами нелюбимый ложный пробой уровня сопротивления.

Да, без корреляционного подтверждения все равно можно входить на пробой, но тогда сделайте объем сделки поменьше, ибо нужно снизить свои риски.

Валютная корреляция постоянно меняется

Валютный рынок не хочет нас порадовать стабильностью и находится в постоянном состоянии возбуждения, как и работающие с ним трейдеры. В результате, даже самые сильные корреляции, что могут держаться месяцами и годами, порой изменяются, причем в самый неподходящий момент. То, что является корреляцией в этом месяце может стать совсем другой историей в месяце новом.

Проиллюстрируем это на примере нескольких пар, выделив USD/CHF:

Как видите, корреляция меняется регулярно, причем зачастую на совершенно полярные значения. Так что они не просто подвержены изменениям - но эти изменения могут быть кардинальными. Следовательно, чтобы использовать эффект корреляции в свою пользу, его банально нужно регулярно проверять и не лениться это делать.

Предположим, целую неделю корреляция между USD/JPY и USD/CHF составляла 0.22. Это весьма низкий коррелирующий коэффициент, который нельзя считать достаточным. Однако, 3-месячный период мы видим, что это число выросло до 0.52, затем 0.78 для 6 месяцев и, наконец, 0.74 для годового таймфрейма.

Другими словами, у пар наблюдается долгосрочная корреляция, но она может сильно изменяться на небольших таймфреймах. Сильная годовая корреляция может превращаться в слабую в краткие периоды времени.

Сравним EUR/USD и GBP/USD, чтобы продемонстрировать и вовсе несусветное поведение.

Неделя - отлично, коэффициент составляет 0.94, пары двигаются практически зеркально. Однако, за месяц это значение падает… до 0.13. В 3-месячный период подскакивает до значимого 0.83 и снова падает в период 6 месяцев.

Как насчет USD/JPY и NZD/USD? Годовая корреляция — -0.69, месячная - аж 0.07, то есть отсутствует. Поэтому такие факторы нужно учитывать.

Почему корреляция меняется? Причин масса. Изменение ключевых ставок и монетарной политики, политические и экономические события, любые фундаментальные факторы, что влияют на настроение трейдеров и их отношение к определенной валюте.

Как подсчитать корреляцию в Excel

Если вам не нравится инструмент Oanda и вы все хотите сделать ручками, Excel позволит вам это сделать без каких-либо проблем, прям как калькулятор. Однако, для получения достоверных результатов нужно взять архив котировок минимум за 6 месяцев, иначе вы не заметите сильные колебания в значениях.

Эти данные затем копируются в таблицу:

В таблице корреляции используются ежедневные значения, что наиболее разумно, хотя, конечно, никто не мешает вам импортировать хоть минутные. Хотя, боюсь, это «повесит» ваш Excel и весь компьютер заодно с ним.

Для примера, возьмем ежедневные данные за месяц.

Теперь, в первой пустой клеткой под нужной парой (в нашем случае, EUR/USD, которую мы будем сравнивать с USD/JPY) вводим значение “=correl(“ (без кавычек). Либо, для русской версии Excel, значение “=КОРРЕЛ(“. Как видим, никаких сложных формул не понадобится.

Остается выбрать столбец с диапазоном данных (появится прямоугольник с пунктирными границами). Ставим запятую.

После запятой, аналогичным образом выбираем ценовой диапазон для USD/JPY. Нажимаем Enter и получим наш коэффициент корреляции для выбранной пары.

Это повторяется для других пар, после чего можно сделать удобную табличку с этими коэффициентами для каждого периода, от недели до года.

Обновлять такие данные можно раз в неделю, едва ли разумно делать это чаще - вы устанете намного раньше.

Корреляция: плюсы и минусы

Здесь все очевидно. Минусы - ваши риски удваиваются, если вы открываете сделки для двух зеркально коррелирующих пар. Кроме того, корреляция регулярно меняется в разные временные промежутки, что следует учитывать в работе.

Из плюсов - корреляция дает возможность диверсифицировать риски, хеджировать свои сделки и, в форексе, зарабатывать благодаря кредитному плечу.

Также помните, что:

  • коэффициенты рассчитываются на основе дневных цен закрытия;
  • позитивный коэффициент означает, что две пары двигаются в одном направлении;
  • негативный - в противоположных направлениях;
  • чем ближе коэффициент к значениям +1 и -1, тем сильнее корреляция.

Примеры пар, что двигаются синхронно:

  • EUR/USD и GBP/USD;
  • EUR/USD и AUD/USD;
  • EUR/USD и NZD/USD;
  • USD/CHF и USD/JPY;
  • AUD/USD и NZD/USD.

Пары с негативной корреляцией:

  • EUR/USD и USD/CHF;
  • GBP/USD и USD/JPY;
  • USD/CAD и AUD/USD;
  • USD/JPY и AUD/USD;
  • GBP/USD и USD/CHF.

Не забываем использовать все то, чему вы уже научились, помните про риск менеджмент и тогда корреляция валютных пар может стать достойным инструментом в вашем торговом арсенале. А самое главное — позволит избежать ошибок, когда вы торгуете сразу две пары, и даже не понимаете, что удваиваете ваши риски, если между выбранными парами есть полная синхронная корреляция.

  • Назад:
  • Вперед:

Термин «корреляция» пугает многих людей и кажется чем-то сложным и непонятным. Однако на практике ничего устрашающего в ней нет. Корреляция – это всего лишь показатель, показывающий зависимость между событиями или объектами.

Данное понятие применяется в экономическом и статистическом анализе, психологии, биологии, математике. Например, если посмотреть на небо и увидеть густые и темные тучи, то можно прийти к выводу, что скоро пойдет дождь. Однако наше умозаключение не дает 100% гарантии. Это и является отличительной особенностью корреляцию от линейной зависимости.

Что такое корреляция?

Корреляция – это взаимозависимость случайных факторов. Она отображает приближенную взаимосвязь и не дает точных ответов. Например, в стране выросла безработица и увеличилось количество преступлений. Можно предположить, что на второй фактор повлияли первый. Но на уровень преступности также влияют воспитание, менталитет людей, уровень образования. Составить точный прогноз нереально, так как всегда есть дополнительные факторы.

Связь между событиями характеризуется коэффициентом корреляции. Значение коэффициента варьируется от -1 до +1.

Связь может быть трех видов:

  • сильной;
  • слабой;
  • отсутствовать.

Например, повышения уровня радиации негативно сказывается на здоровье человека. Межу событиями имеется обратно пропорциональная зависимость – увеличения радиации приводит к ухудшению здоровья. Коэффициент корреляции при этом имеет отрицательное значение.

Некоторые события или явления практически никак не связаны друг с другом. Утром у вас разрядился телефон, а вчера в маршрутке вам на ногу наступил мужчина. Ни одно из событий не влияет на другое. В данном случае коэффициент корреляции равен нулю.

Если коэффициент больше нуля и стремится к 1, то такая корреляция называется положительной. Она показывает прямую взаимосвязь между событиями. Например, чем выше уровень знаний, тем выше шансы поступить в университет на бюджет.

Анализ корреляционного соотношения помогает выдвинуть гипотезу о причинно-следственных связях.

Корреляция цены на нефть и курса доллара

Цена на нефть и курс американского доллара имеют обратную корреляционную связь. При росте стоимости «черного золота» курс доллара снижается и наоборот.

США обладают самой мощной промышленностью в мире и на ее нужды требуется просто огромное количество нефти. В то же время Штаты входят в первую десятку стран по уровню добычи этого природного ресурса. При этом США значительную часть добытой нефти экспортируют, что вызывает дефицит в промышленности. Для его покрытия американцы ежегодно импортируют свыше 8 миллиардов баррелей нефти.

Данного объема достаточно для влияния на курс национальной валюты. Увеличение спроса США на нефть приводит к увеличению цены на международном рынке. В свою очередь, рост объемов импорта влияет на стоимость произведенных товаров. В итоге на валютном рынке наблюдается избыток американской валюты, и ее курс начинает падать.

Корреляция в управлении инвестиционными активами

Корреляция активно используется инвесторами при формировании и управлении своих инвестиционных портфелях. Логично, что нельзя держать все свои активы в одном месте. Диверсификация позволяет значительно снизить риски.

Например, инвестор покупает акции одной крупной компании и нескольких мелких. Коэффициент корреляции акций гигантов отрасли и небольших предприятий приблизительно равен +0,8. Это достаточно большое значение и оно характеризует прямую зависимость между объектами. При падении акции крупной компании существует большая вероятность, что стоимость ценных бумаг небольших фирм тоже снизится существенная. В данном случае лучше подбирать активы таким образом, что корреляционные связи были минимальными.

Для этого, например, инвестор может составить свой портфель из акций и облигаций или акций и казначейских векселей. Облигации между собой, как и акции, также имеют прямую связь. Их коэффициент еще выше. Однако между облигациями и акциями такой зависимости нет, что и позволяет инвестору снизить риски.

Также наблюдается зависимость между странами и даже регионами. Чем ближе они находятся, тем выше коэффициент корреляции. Например, для Канады и США он составляет 0,9. В то же время для Японии и США он на 4 десятых меньше. Собственно, инвестору более выгодно покупать активы эмитентов из разных регионов.

Золото и ценные бумаги практически не коррелируются. Однако серебро и золото очень зависимы друг от друга, так же, как и евро и американский доллар. Их использование в рамках одного инвестиционного портфеля нецелесообразно.

Корреляция – это удобный и необходимый инструмент в различных сферах жизни. Она не является панацеей, но позволяет достаточно точно установить причинно-следственные связи между явлениями.

Понятие корреляции

Все явления в мире взаимосвязаны. Это значит, что каждое событие оказывает влияние на все события, следующие за ним, а само происходит вследствие всех событий, случившихся до него.

До сих пор рассматривались основные статистические характеристики изолированно друг от друга, теперь будем изучать, как и в к5акой форме одно явление оказывает влияние на другое. Это является предметом корреляционно-регрессионного анализа.

Три основные задачи корреляционно-регрессионного анализа:

1. Определение факторов, которые оказывают определяющее воздействие на результативный признак.

2. Определение форм воздействия факторов и результата.

3. Определение степени влияния на результат учтенных и неучтенных факторов.

В статистике изучаются следующие виды связей:

1. Балансовая связь – характеризует зависимость между источниками формирования результатов и их использованием.

2. Компонентные связи – характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель, как множители.

3. Факторные связи – характеризуются тем, что они появляются в согласованной вариации изучаемых показателей.

Одни выступают как факторные, другие как результативные.

При функциональной связи изменение результативного признака обусловлено всецело действием одного факторного признака х, т.е. одному факторному соответствует одно и только одно значение результативного признака y=f(x). Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы изучаемой величины.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, в среднем при большом числе наблюдений, то такая зависимость называется стохастической . Частным случаем стохастической связи является корреляционная , при которой изменение среднего значения результатов признака обусловлено изменением факторных признаков. По степени тесноты связи различают количественные критерии оценки тесноты связи.

По направлению выделяют связь прямую, т.е. с увеличением или уменьшением значения факторного признака происходит увеличение или уменьшение результата.

Например, увеличение производительности труда способствует увеличению уровня рентабельности.

И обратную, когда значения результативного признака изменяются под воздействием факторного, но в противоположном направлении.

Например, с увеличением фондоотдачи снижается себестоимость единицы продукции.

По аналитическому выражению выделяют связи прямолинейные и нелинейные.

В статистике не всегда требуются количественные оценки, важно просто определить форму воздействия одних факторов на другие.

Для выявления наличия связи, и характера, и направления используются следующие методы:

Приведение параллельных данных

Аналитических группировок

Графический

Корреляции

1.Метод приведения параллельных данных - основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Т.е. с увеличением x y, т.е. это может быть либо кривая, либо парабола 2 порядка.

2.Графически - взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а у – результативного.

При отсутствии тесных связей имеет место беспорядочное расположение точки на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака на него оказывают воздействие многие случайные факторы. Поэтому корреляционная связь отражается функцией у=ψ(х)+ε, где ε – влияние случайных факторов.

3.Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при котором изменение одной из случайных величин приводит к уменьшению математического ожидания другой. В статистике принято различать следующие варианты зависимостей:

1. Парная корреляция – связь между двумя признаками.

2. Частная корреляция – зависимость между результатом и одним факторным признаком при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей кол-но определить тесноту связи между двумя признаками (при парной связи) и между результативными и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции. Величина коэффициентов корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям. Одновременно с корреляцией начала использоваться регрессия. Корреляция и регрессия тесно связаны между собой:

Первая оценивает силу статистической связи, вторая исследует ее форму. Та и другая служат для установления соотношения между явлениями.

Корреляционно-регрессионный анализ как общее понятие, включает в себя измерение тесноты направления связей и установления аналитического выражения (формы) связей (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (результативный признак) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной).

- линейная функция и многофакторной (множественной)

+а 2 х 2 - парабола

- гипербола нелинейная регрессия

По направлению связи распределяют:

а) прямую регрессию (положительную)

б) обратную (отрицательную), т.е. с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Прямая (положительная) регрессия

Обратная (отрицательная) регрессия

Методы корреляционно-регрессионного анализа связи показателей

Наиболее разработанная – метод парной корреляции , рассматривающая влияние вариации факторного признака (х) на результативный (у).

Для выявления связи применяются различные виды уравнения прямолинейной и криволинейной связей. Аналитическая связь между ними может быть описана следующими уравнениями:

Прямая

Гипербола

Парабола
+а 2 х 2

Определить тип уравнения можно, исследуя зависимость графически. Однако есть более общее указание.

Если результативный и факторный признаки одинаково, примерно в арифметической прогрессии – прямая.

При обратной – гиперболическая.

Если факторный признак увеличивается в арифметической, а результативный быстрее, то парабола или степенная.

Оценка параметров уравнений регрессии а 0 ; а 1 ; а 2 осуществляется методом наименьших квадратов

при линейной зависимости

n – объем исследуемой совокупности.

; где а 0 – усредненное влияние на результативный признак случайных факторов. а 1 – коэффициент регрессии показывает насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Пример:

Имеются данные, характеризующие деловую активность ЗАО:

прибыль (тыс.р.) и затраты на 1 р. произведенной продукции (коп.)

затраты на 1 р. произв. продукции (коп.)

прибыль (тыс.р.)

На практике часто исследования проводятся по большому числу наблюдений. В этом случае исходные данные представляют в сводной корреляционной таблице . При этом анализу подвергаются сгруппированные данные и по факторному х и по результативному у, т.е. уравнение парной регрессии целесообразно строить на основе сгруппированных данных.

Если значения х и у заданы в определенных интервалах (а-в), то для каждого интервала сначала определяют середину интервала (а+в)/2, а затем уже коррелируют значения х / и у / и строят уравнения регрессии между ними.

Корреляционная таблица дает общее представление о направлении связи. Если оба признака (х и у) располагаются в возрастающем порядке, а частоты (f xy) сосредоточены по диагонали сверху вниз направо.

прямая обратная

О тесноте связи между признаками х и у по корреляционной таблице можно судить по кучности расположения частот вокруг диагонали (поскольку заполненные клетки таблицы в стороне от нее).

Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (f xy) располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (f xy) нет системности, то можно судить об отсутствии связи.

Пример:

величина капитала,

величина работающих активов, тыс.р.

Число банков

Число предпр.

Если у нас наличие линейной связи:

где n=30 коммерческих банков.

f x и f y – число банков согласно распределению соответственно по факторному и результативному признакам.

yf y ; xf x – значение результативного и факторного признаков по конкретной группе коммерческих банков.

Для 1 группы yf y = 1714,5*15=25717,5

хyf y =1714,5*4*42+1714,5*6*98+1714,5*2*154+1714,5*3*210=2904363

х 2 f x =42*42*8=14112

Статистические данные обладают ошибками упрощения , которые возникают как следствие:

1. Неполноты охвата единиц совокупности

2. Неполноты факторов, определяющих явление

3. Характера выбранного уравнения связи

Использование метода наименьших квадратов позволяет получить достоверные оценки при небольшом количестве наблюдений.

При изучении корреляционной связи показателей коммерческой деятельности в условиях наблюдения так называемого малого и среднего бизнеса, анализу подвергается сравнительно небольшие по составу единиц совокупности.

Коэффициент эластичности

Для оценки влияния факторного признака на результативный применяется коэффициент эластичности.

Он рассчитывается для каждой точки и в среднем по всей совокупности.

Коэффициент эластичности (Э)

Э=
Коэффициент эластичности показывает, на сколько % изменяется результативный признак при изменении факторного признака на 1%.

Если х=42, то при увеличении его на 1%, т.е. 42*(1+0,01)=42,42; С 42 до 42,42. Капитал. увеличится. Э=(59,7*42)/(7177,6+59,7*42)=2507,4/(7177,6+2507,4)=2507,4/9685=0,259

Это означает, что при увеличении фактического признака с 42 до 42,42 – результативный признак увеличится на 0,259%.

Измерение тесноты связи

Кроме состав. уравн. регрессии для коррелируемых переменных второй задачей является измерение тесноты связи между ними. Измерить ее означает определить насколько вариация результативного признака зависит от вариации факторного. Измерить тесноту зависимости между х и у можно при помощи:

1. Корреляционного отношения (η) (коэффициент корреляции по Персону)

2. Линейного коэффициента корреляции (r)

Первый применим ко всем зависимостям, второй только при линейной зависимости.

а) корреляционное отношение различается:

1. теоретическое

2. эмпирическое

Теоретическое представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения в ряду выравненных значений результативного признака (), рассчитанных по уравнению регресии, со средним квадратическим отклонением в ряду эмпирических значений результатов признака.

первое – δ, второе – σ.

Учитывая, что выравненные эмпирические совпадают, т.е.

и средние значения признака у рядов одинаково (), среднее квадратическое отклонение ряда выравненных значений результативного признака можно записать

Если дисперсию выравненного σ 2 обозначить через среднее квадратическое для эмпирического ряда результатов признака σ=
σ 2 =D y , то корреляционное отношение можно записать

Возведя обе части в квадрат получим
; это корреляционное отношение называется коэффициентом детерминации. σ 2 =D y , характеризует вариацию в ряду (у) за счет всех факторов, включая и фактор (х), а δ 2 =
характеризует вариацию результативного признака под влиянием фактора х. Если найдем отношение,то получим малую долю, занимаемую дисперсией, определяемую влиянием факторного признака х. Т.е. в основе корреляционного отношения лежит правило сложения дисперсий
.

При изучении корреляционных связей дисперсия в ряду и является межгрупповой дисперсией δ 2 =
ибо она отражает колеблемость групповых значений результативного признака (т.е. характерных для этой группы х) вокруг общей средней ряда, т.е. колеблемость за счет факторного признака.

Т.е. средняя из внутригрупповых дисперсий это и будет остаточная дисперсия, т.е. вариация в ряду у за счет всех остальных факторов, кроме х

Из правила сложения дисперсий

Корреляционное отношение, находится в пределах от 0 до 1.

1. Если результ. полностью зависит от фактора х

2. Фактор х не анализ. влияние на у

Т.е. чем ближе значение корреляционного отношения к 1, тем больше связь у и х. Чем ближе к 0, тем связь слабее. Обычно η меньше 0,3, зависимость маленькая; 0,3-0,6 – зависимость средняя, больше 0,6 – большая.

внесено удобр.,ц/га.

урож.,ц/га

Зависимость параболическая.

5a 0 +15a 1 +55a 2 =50

15a 0 +55a 1 +225a 2 =167

55a 0 +225a 1 +979a 2 =649

Дисперсия ряда теоретическая. Значение результативного признака.

Дисперсия ряда эмпирическая. Значение результативного признака.

Корреляционное отношение характеризует высокую степень тесноты зависимости изменения урожайности от количества внесенных удобрений.

От теоретического следует отличать эмпирическое корреляционное отношение, которое рассчитывается по данным групповых таблиц.

где -дисперсия групповых средних результативного признака

-общая дисперсия результативного признака.

Эмпирическое корреляционное отношение не требует знания и расчета уравнений регрессии, а основывается на сопоставлении межгрупповой и общей дисперсий результативного признака, рассчитанных по групповым таблицам.

Рассмотрим пример с корреляционной таблицей:

На основе этого показателя можно сделать вывод о том, что вариация групповых средних несущественно зависит от вариации группировочного признака.

Линейный коэффициент корреляции

В случае линейной зависимости между двумя коррелируемыми величинами тесноту связи измеряют линейным коэффициентом корреляции (r), который может быть рассчитан по нескольким формулам:

1.

где а 1 - коэффициент регрессии в управлении связи;

σ х - среднее квадратическое отклонение факторного признака;

σ у - среднее квадратическое отклонение результативного признака.

2.

3.

Рассчитаем линейный коэффициент корреляции по разным формулам:

основные произв. фонды, млн.р. х

валовая продукция, млн.р. у

На протяжении веков люди обвиняли полнолуние во многих грехах, в частности, считали его причиной странного, девиантного поведения. В средневековье процветали истории о том, как полная луна превращает людей в оборотней. В XVIII веке бытовало мнение, что полнолуние может вызвать эпилепсию и лихорадку. Даже Шекспир в своей пьесе «Отелло» упоминает этот известный миф:

Отелло
Виновно отклонение луны:
Она как раз приблизилась к земле,
И у людей мутится разум.

Все эти казалось бы фантастические истории находят отражение в нашем языке и сейчас: например, слово «лунатик» (т.е. человек, который совершает какие-либо действия в состоянии сна) происходит от латинского корня «luna».

В XXI веке мы уже не верим мифам, опираясь в своих суждениях на разум и научно доказанные факты. Люди больше не обвиняют фазы Луны в болезнях и недомоганиях. Тем не менее, даже сегодня порой можно услышать, как кто-то именно влиянием полнолуния объясняет безумное поведение. Например, когда в психиатрической больнице начинается «аврал», медсестры часто говорят: «Должно быть, сегодня полнолуние».

Почему так происходит: наука vs. мифы

Между тем, существует не так много доказательств того, что полная фаза Луны действительно влияет на наше поведение. Анализ более чем 30 исследований показал, что нет никакой корреляции между фазами Луны и выигрышами в казино, количеством госпитализированных, числом самоубийств или дорожно-транспортных происшествий, уровнем преступности и многими другими показателями.

Но вот что любопытно: хотя все факты говорят об обратном, проведенное в 2005 году исследование показало, что 7 из 10 медсестер по-прежнему верят в миф о том, что полнолуние приводит к хаосу и странному поведению больных психиатрической клиники. По данным эксперимента, подавляющее большинство сотрудниц больницы (69 %!) верят во влияние полной фазы Луны на количество госпитализированных.

Не стоит думать, что медсестры, которые клянутся, что полнолуние вызывает странное поведение, глупы и поэтому верят во всякую ерунду. Они просто стали жертвами распространенной психологической ошибки, которую совершают многие из нас. Специалисты именуют этот небольшой «сбой» в работе нашего мозга «иллюзорными корреляциями» (illusory correlation).

Как мы обманываем себя, не осознавая этого

Иллюзорная корреляция возникает в тех случаях, когда мы ошибочно придаем повышенное значение одному элементу и при этом игнорируем все другие. Представьте, что вы приехали в большой незнакомый город, спускаетесь в метро и… вдруг кто-то «подрезает» вас перед самым входом в вагон. Добравшись до нужной станции, вы решаете пообедать и заходите в ближайший ресторан, но… официант открыто хамит вам. На улице вы понимаете, что потерялись, спрашиваете дорогу у прохожего и … вам показывают неверное направление. Приехав домой, вы, скорее всего, будете рассказывать родственникам о том, какие неудачи постигли вас в путешествии (еще бы, вы ведь запомнили только эту «полосу невезения»!), доказывать, что обитатели мегаполисов грубы и невоспитаны.

Однако в своем рассказе вы, скорее всего, забудете упомянуть про вкусную еду, которую попробовали в ресторане, про сотни других людей в метро, которые не толкали вас на платформе. Все эти мелочи были так незаметны, что мы не придаем им никакого значения, они даже не получают статус событий в нашей жизни. Это, скорее, «не-события». В результате получается, что легче запомнить, когда кто-то нахамил вам, чем когда вы вкусно пообедали или благополучно зашли в вагон метро.

В игру вступает наука о мозге

Сотни психологических исследований доказали, что мы склонны переоценивать важность событий, которые легко запоминаются, и недооценивать те моменты жизни, которые сложно восстановить в памяти. Принцип работы нашего мозга в этом случае прост: чем легче событие запомнилось, тем сильнее будет связь между ним и другим событием. Но на самом деле данные явления могут быть слабо связаны или не связаны друг с другом вообще.

В психологии этот феномен называется «эвристика доступности» (availability heuristic). Чем легче вспоминается какой-то момент нашей жизни (чем более он доступен), тем больше вероятность того, что мы переоценим его значение.

Иллюзорная корреляция — это своего рода сочетание эвристики доступности и такого когнитивного искажения как «предвзятость подтверждения» (тенденция интерпретировать информацию таким образом, чтобы подтвердить имеющиеся концепции).

Вы можете легко вспомнить какой-то случай (эвристика доступности) и поэтому начинаете думать, что такие случаи повторяются часто и даже складываются в определенную тенденцию. Когда это произойдет снова (как, например, полнолуние в случае с медсёстрами), вы сразу свяжете два явления и подтвердите свои же догадки (предвзятость подтверждения).

Как распознать иллюзорную корреляцию?

Чтобы определить, где ваш мозг дал «сбой» и защитить себя от воздействия иллюзорных корреляций, можно использовать таблицу случайностей (contingency table), которая поможет определить правомерность ваших суждений и реальную значимость событий.

Вспомним пример с полнолунием:

Клетка А: полнолуние и аврал в психиатрической больнице. Два явления представляют собой хорошо запоминающееся сочетание, поэтому мы в будущем будем переоценивать их значение.

Клетка B: полнолуние и затишье в больнице. Ничего особенного не происходит («не-событие»). Нам будет довольно трудно вспомнить эту ночь, поэтому мы склонны игнорировать данную ячейку.

Клетка C: полнолуния нет, но в больнице аврал. В этой ситуации медсестры просто скажут в конце смены: «Суматошная ночь на работе…».

Клетка D: полнолуния по-прежнему нет, и пациенты ведут себя спокойно. Это снова пример «не-события»: ничего запоминающегося не происходит, поэтому мы проигнорируем эту ночь.

Таблица случайностей демонстрирует тот алгоритм, по которому медсестры анализируют ситуацию во время полнолуния. Они могут быстро вспомнить ту ночь, когда в полнолуние больница была переполнена, но совершенно не учитывают (просто забывают) те многочисленные смены, когда в полнолуние пациенты вели себя обычным образом. Их мозг легко «выдает» информацию об авралах во время полнолуния, именно поэтому они уверены, что эти два события связаны.

Данную таблицу из книги «50 великих мифов популярной психологии» («50 Great Myths of Popular Psychology») можно адаптировать для любых жизненных ситуаций. В большинстве случаев мы уделяем слишком много внимания клетке А, но почти не замечаем клетку В, что может привести к иллюзорной корреляции. Использование всех четырех клеток позволяет вам вычислять реальную корреляцию между двумя событиями и не поддаваться влиянию известных мифов, таких как «эффект полнолуния».

Как исправить ошибки нашего мозга?

Оказывается, мы проводим иллюзорные корреляции во многих сферах жизни: Все слышали истории успеха Билла Гейтса (Bill Gates) или Марка Цукерберга (Mark Zuckerberg), которые бросили колледж, чтобы начать бизнес, принесший им миллиарды. Мы придаем повышенное значение этим случаям, обсуждаем их с друзьями и знакомыми. Между тем, вы никогда не услышите о тех нерадивых учениках, которые не добились успеха и не создали всемирно известных компаний. В потоке информации мы улавливаем только самые экстраординарные случаи, собираем «сливки», игнорируя при этом сотни или даже тысячи историй людей, бросивших колледж, но не уложившихся в парадигму успеха.

Если вы слышите, что арестовали представителя определенной этнической группы или расы, то, вероятно, вы будете в дальнейшем воспринимать каждого выходца из этой страны или континента как потенциального бандита. Но при этом вы забываете о тех 99% неизвестных вам людей, которые ведут примерный образ жизни и никогда не были арестованы (потому что арест — это событие, а не-арест — не-событие).

Если мы читаем в новостях о нападении акулы, то отказываемся заходить в океан во время отпуска на побережье. Вероятность нападения не увеличилась с тех пор, как мы плавали в последний раз, ведь мы не учитываем миллионы людей, которые вернулись невредимыми. Но никому не интересны скучные заголовки: «Миллионы туристов остаются живы каждый день», поэтому журналисты делают акцент на экстраординарных случаях, а мы проводим иллюзорную корреляцию и отказываемся от отдыха на побережье.

Когнитивные заблуждения подталкивают нас «видеть» множество ассоциаций, которых нет. Например, многие люди, страдающие артритом, настаивают на том, что их суставы болят больше в дождливую погоду, чем в ясную. Однако исследования показывают, что эта ассоциация — плод их воображения. По-видимому, такие люди обращают слишком большое внимание на клетку А — случаи, когда идет дождь и у них болят суставы, — что заставляет их воспринимать корреляцию, которой не существует.

Многие из нас даже не догадываются, что наша избирательная память о событиях влияет на убеждения, которых мы придерживаемся. Теперь вы знаете о когнитивных искажениях и сможете выявить и устранить иллюзорные корреляции в повседневной жизни с помощью таблицы случайностей.