От возраста потребителя
Важной формой донесения полученных в ходе исследования результатов являются диаграммы. Хорошо продуманная и правильно подготовленная диаграмма поможет быстрее и точнее, чем обычные таблицы, донести материал. Плохо продуманные или выполненные диаграммы не только не помогают, но и ещё сильнее запутывают читающего отчет об исследовании. Несмотря на разнообразие графических средств, используемых в различных видах коммуникации (таблицы, схемы, графики, матрицы и карты), при иллюстрации количественных данных применяется пять основных типов диаграмм (рис.20):
Рис.20. Основные типы диаграмм
Для того чтобы правильно выбрать тип диаграммы, в первую очередь необходимо четко сформулировать конкретную идею, которую нужно донести до аудитории при помощи диаграммы. Сформулированная идея будет обязательно заключать в себе один из пяти основных типов сравнения данных: покомпонентное, позиционное, временное, частотное и корреляционное. Каждому типу сравнения соответствует один из пяти видов диаграмм. Процесс выбора типа диаграммы можно описать с помощью следующей схемы (рис.21)
Рис.21. Процесс выбора типа диаграммы
Формулирование идеи Тип диаграммы определяют вовсе не данные (рубли или иены, проценты или литры) и не те или иные параметры (прибыль, узнаваемость марки или доли рынка), а идея – то, что необходимо показать, тот смысл, который нужно вложить в диаграмму. Одни и те же данные можно представить разными способами. Например, данные об объёмах продаж компаний А и Б по регионам в январе (табл.12), можно представить различным количеством вариантов (рис.22). Таблица 12 Объем продаж по регионам в январе, %
Какую диаграмму из представленных на рисунке 21выбрать зависит от того смысла, который хотят вложить в диаграмму, – от ИДЕИ. Каждая представленная диаграмма, в зависимости от ее типа, наиболее полно выражает определенную идею. Например, используя для представления данных две круговые диаграммы или гистограммы (варианты 1 и 2), нормированные на 100%, акцент делают на том, что структура продаж компаний А и Б различна. Если представить данные в виде двух линейчатых диаграмм (вариант 3), расположив цифры в порядке следования в исходной таблице, то в таком виде диаграмма подчеркнет, что региональная структура продаж компаний А и Б неоднородна. Можно расположить доли продаж каждой компании в различных регионах в порядке убывания (возрастания) (вариант 4), в этом случае внимание обращают на то, что наибольших успехов компания А добилась на юге страны, а компания Б – на севере. Наименьших успехов компания А добилась на севере, а компания Б – на юге. Группируя линейки по одну сторону от общей основы (вариант 5), сравнивают уровень отрыва компаний друг от друга по продажам в различных регионах. Из этой диаграммы следует, что на юге компания А значительно опережает компанию Б; на востоке и западе компании активно конкурируют друг с другом; на севере компания А отстает от компании Б. На этапе формулирования идеи можно нарисовать несколько диаграмм, которые будут демонстрировать исходные данные с различных точек зрения. Более эффективным будет выделение того аспекта исходных данных, который кажется наиболее важным, и выбор той формулировки идеи, которая бы отражала именно этот аспект. В 1
В2
В3
В4
В 5
Рис. 22. Различные варианты расположения данных Прежде чем выбирать подходящий тип диаграммы, необходимо сформулировать основную мысль, которую хотят донести до аудитории. Её и используют в качестве заголовка диаграммы. Зачастую заголовки диаграмм выглядят весьма загадочно. Например:
ДИНАМИКА ОБЪЕМА ПРОДАЖ КОМПАНИИ ПРОИЗВОДИТЕЛЬНОСТЬ ПО РЕГИОНАМ РАСПРЕДЕЛЕНИЕ АКТИВОВ ПО ПОДРАЗДЕЛЕНИЯМ ВОЗРАСТНАЯ СТРУКТУРА ШТАТА КОМПАНИИ СООТНОШЕНИЕ ЗАРАБОТНОЙ ПЛАТЫ И РЕНТАБЕЛЬНОСТИ
Эти заголовки указывают, какие данные содержатся в диаграмме, но не объясняют, в чем их важность, что именно происходит с объемом продаж, возрастной структурой штата, соотношением заработной платы и рентабельности. Д.Желязны рекомендует: «Не храните это в секрете, используйте вашу основную идею в качестве заголовка диаграммы»[32]. Это поможет читателю правильно понять мысль и быть уверенным в том, что он сконцентрирует свое внимание именно на том аспекте представленных данных, который особенно важен. Рассмотрим несколько примеров, подчеркивающих преимущества заголовков, выражающих главную мысль диаграммы, перед заголовками, описывающими данные, содержащиеся в диаграмме. В случае, показанном на рис.23 заголовок просто называет тему – данные, которые использовались при подготовке диаграммы, и читающему самому приходится решать, что именно она иллюстрирует. Боль-
Рис. 23. В названии заголовка использованы данные, на основе которых готовилась диаграмма
шинство читателей, изучая данную диаграмму, наверняка обратят внимание на Западный регион, предполагая, что основная идея диаграммы состоит в следующем: «На долю Западного региона приходится почти половина совокупной прибыли». Но возможно, это совсем не то, на что хотел обратить внимание разработчик диаграммы. Может быть, он хотел подчеркнуть, что: «В совокупной прибыли компании Северныйрегион занимает наименьшую долю». Таким образом, используя тематический заголовок, можно ввести своего читателя в заблуждение. Если применить заголовок, демонстрирующий основную мысль, т. е. «В совокупных доходах компании Северный регион имеет наименьшую долю», то внимание читателя будет сфокусировано на наиболее значимом для исследователя аспекте данных. В следующем примере заголовок просто указывает на то, что отражает линия тренда – КОЛИЧЕСТВО КОНТАКТОВ (рис. 24). Но есть еще четыре аспекта, на которые можно обратить внимание: 1) количество контактов возросло. 2) количество контактов изменяется. 3) в августе было заключено наибольшее количество контактов. 4) количество заключенных контрактов снижалось в двух из восьми месяцев.
Рис.24. Тематический заголовок, не отражающий передаваемой идеи
В качестве заголовка диаграммы необходимо использовать идею, которую хотят выразить с помощью диаграммы. Заголовок, выражающий основную мысль диаграммы, должен отличаться краткостью и четкостью. Непонятные заголовки, о которых мы говорили ранее, можно переформулировать так, как показано в табл.13.
Определение типа сравнения данных Любой аспект данных, на который необходимо обратить внимание, может быть выражен посредством одного из пяти основных типов сравнения: покомпонентного, позиционного, временного, частотного, корреляционного. Таблица 13 Переформулирование тематических заголовков в заголовки, выражающие идею
Рассмотрим примеры идей, связанных с данными типами сравнения. Одновременно дадим описания этих типов и характерные для них ключевые слова. Это необходимо для того, чтобы научиться определять, с помощью какой разновидности сравнений может быть выражена та или иная мысль. 1. Покомпонентное сравнение. При покомпонентном сравнении, прежде всего, показывают размер каждого компонента в процентах от некоего целого.
Например: В мае продажи продукции А составилинаибольшую долю в общем объеме продаж компании. Доля рынка клиента в 2010 г. составляет менее 10% рынка отрасли. Почти половина корпоративных ресурсов привлечены из двух источников.
Увидев слова «доля», «проценты от целого», «составило Х% », можно быть уверенным, что имеем дело с покомпонентным сравнением. 2. Позиционное сравнение. При позиционном сравнении выявляют, как объекты соотносятся друг с другом: одинаковы ли они, больше или меньше других.
Например: В мае продажи продукции А превысили продажи продукции Б и В. Выручка клиента от продаж находится на четвертом месте. Текучесть кадров в шести подразделениях примерно одинакова.
Ключевыми словами для позиционного сравнения являются: «больше чем», «меньше чем», «равно». 3. Временное сравнение. Этот вид сравнения один из наиболее распространенных. В данном случае исследователя интересует не размер каждой доли в сравнении с целым, не соотношение долей, а то, как они изменяются во времени – что происходит с определенными показателями на протяжении недель, месяцев, кварталов, лет: возрастают ли они, снижаются, колеблются или остаются неизменными. Например: Продажи в январе неуклонно росли. Рентабельность инвестиций за последние пять лет резко сократилась. Ставки процента в течение последних семи кварталов колебались. Ключевые слова в данном случае: «изменяться», «расти», «убывать», «возрастать», «снижаться», «колебаться» и т. д. 4. Частотное сравнение. Данный вид сравнения помогает определить, сколько объектов попадает в определенные последовательные области числовых значений. Например, частотное сравнение используется для того, чтобы показать, сколько респондентов зарабатывает менее чем 10 тыс. руб., сколько – 10-15тыс. руб. и т. д.; сколько жителей относится к возрастной группе до 10 лет, сколько – от 10 до 20, от 20 до 30 и т. д.
Примеры типичных формулировок такого вида: В мае сделки в основном заключались в диапазоне от 30-ти до 60-ти тысяч рублей. Большая часть грузов была получена за 2–5 дней. Возрастная структура штата нашей компании сильно отличается от структуры штата нашего конкурента.
Термины, характерные для этого вида сравнения, «в диапазоне от х до у», «концентрация», «частотность» и «распределение ». 5. Корреляционное сравнение. Корреляционное сравнение показывает наличие (или отсутствие) зависимости между двумя переменными. Например, обычно ожидается, что при увеличении объемов продаж возрастает прибыль или что при увеличении скидок возрастают объемы продаж. Если формулировка идеи содержит такие слова, как «относится к», «возрастает при (в случае)», «снижается при (в случае)», «меняется при (в случае)» или, наоборот, «не возрастает при (в случае)» и т. д., это указывает на применение корреляционного сравнения.
Например: Результаты продаж в мае демонстрируют отсутствие взаимосвязи между объемом продаж и опытом продавцов. Зарплата исполнительных директоров не зависит от размера компании. Страховая сумма возрастает при росте доходов индивидов.
Итак, мы рассмотрели пять типов сравнения, с помощью которых можно выразить любую идею, сформулированную на основе табличных данных: покомпонентное: процент от целого; позиционное: соотношение объектов; временное: изменения во времени; частотное: число объектов в интервалах; корреляционное: зависимость между переменными.
Выбор типа диаграммы
По наблюдениям Д.Желязны, круговая диаграмма пользуется наибольшей популярностью. Он считает это абсолютно неоправданным, поскольку данный тип наименее практичен и должен составлять немногим более 5% всех диаграмм, используемых в презентации или докладе[33]. С другой стороны, линейчатая диаграмма применяется реже всего, тогда как она достойна гораздо большего внимания. Это наиболее гибкий и универсальный тип, который должен был бы составлять 25% всех используемых диаграмм. Гистограмма, по его мнению, вполне заслуживает звания «старой доброй» и надежной, а график вполне может быть охарактеризован как «рабочая лошадка». К этим двум типам должна относиться половина всех используемых диаграмм. Довольно устрашающие на первый взгляд точечные диаграммы используются в 10% случаев. Вышеперечисленные типы составляют 90% всех диаграмм. Остальные 10% – это комбинации различных видов диаграмм: например, график с гистограммой или круговая диаграмма с линейчатой. Теперь необходимо уяснить, что различные типы диаграмм лучше всего приспособлены для иллюстрации различных типов сравнения данных. Приведенная на рисунке 25 матрица иллюстрирует данный тезис. По вертикали обозначены пять основных типов диаграмм, по горизонтали – пять типов сравнения. Для временного, частотного и корреляционного сравнения, как можно видеть, используют по два типа диаграмм, в зависимости от того, какой объем информации требуется отразить. При временном и частотном сравнении следует использовать гистограмму, если значений немного (скажем, шесть или семь), и график, если их больше. При корреляционном сравнении лучше использовать линейчатую диаграмму для малого количества значений и точечную – для большого. Выбор и особенно использование различных типов диаграмм – это далеко не точная наука. Для правильного составления диаграмм необходимо учитывать и собственное мнение разработчика диаграммы. Варианты, представленные в таблице, так же как и советы по составлению большинства диаграмм, – это лишь самые общие инструкции. Впрочем, эти инструкции в большинстве случаев весьма полезны.
Рис.25. Различные типы диаграмм для иллюстрации различных типов сравнения данных
Далее дадим описание конкретных типов сравнения и соответствующих им типов диаграмм. Покомпонентное сравнение Покомпонентное сравнение данных лучше всего демонстрируется при помощи круговой диаграммы. Поскольку круг создает прекрасное впечатление целого, круговая диаграмма идеально подходит для выполнения единственной цели покомпонентного сравнения – показать каждую долю как определенный процент от целого (к примеру, доли продаж каждой компании в отрасли). Для построения большинства круговых диаграмм лучше использовать не более шести компонентов. Если нужно отобразить большее число компонентов, выбирают из них пять наиболее важных, а остальные группируют в категорию «прочие». Поскольку взгляд при рассматривании изображений обычно движется по часовой стрелке, наиболее важный компонент следует располагать на линии 12 часов; для усиления эффекта можно использовать наиболее контрастный цвет или самую яркую штриховку, если диаграмма черно-белая. Если нет необходимости выделять какой-либо отдельный компонент, расставляйте их от самого большого к самому маленькому или наоборот и используйте одинаковый цвет или штриховку для всех сегментов. Итак, доли целого нагляднее всего отображаются посредством круговых диаграмм. Однако когда нужно сравнить компоненты нескольких целых лучше использовать линейчатую диаграмму или гистограмму, нормированную на 100% (рис.26). И вот почему. Надписи приходится повторять для каждой из двух круговых диаграмм. Конечно, можно использовать легенду. Однако в этом случае читателю придется смотреть то в легенду, то на диаграмму, чтобы понять, какой из компонентов что означает. Кроме того, хотя тени или цвета помогают зрителю различить три компонента, взгляд должен постоянно перемещаться с одной диаграммы на другую, чтобы уловить взаимосвязи.
Рис.26. Использование круговой диаграммы и гистограммы для сравнения компонентов нескольких объектов
Используя же гистограмму, нормированную на 100%, можно избежать этих проблем. В данном случае надписей меньше, а взаимосвязи между соответствующими сегментами, усиленные связывающими две колонки линиями, отображены более наглядно.
Позиционное сравнение Для иллюстрации позиционного сравнения лучше всего подходит линейчатая диаграмма. При составлении линейчатых диаграмм необходимо убедиться, что пространство, разделяющее линейки, меньше, чем ширина самих линеек. Используют самый контрастный цвет или штриховку для того, чтобы выделить самый важный элемент, подчеркивая, таким образом, основную идею, выраженную в заголовке. Для обозначения количественных величин можно использовать либо шкалу вверху (иногда — внизу), либо цифры на концах линеек, но ни в коем случае и то и другое одновременно. Шкалу используют, если хотят только кратко ознакомить с взаимосвязями, цифры – если эти взаимосвязи важны для передачи основной идеи. Иногда неплохо использовать шкалу и одну цифру, на которой необходимо сделать акцент. Сочетание же шкалы и нескольких цифр излишне и создает помехи, как в линейчатых диаграммах, так и в гистограммах и графиках. Используя цифры, желательно округлять их и избегать дробей, если точная величина несущественна. К примеру, 12% запоминается гораздо лучше, чем 12,3% или 12,347%. Иногда для иллюстрации позиционного сравнения вместо линейчатой диаграммы используют гистограммы – вертикальные столбцы вместо горизонтальных линеек (рис.27). Это не ошибка, однако в девяти случаях из десяти линейчатые диаграммы смотрятся лучше – по двум причинам. Во-первых, применяя их для иллюстрации позиционного сравнения, снижается вероятность путаницы между позиционным и временным сравнением. В последнем случае как раз лучше использовать гистограммы. Поэтому, чтобы подчеркнуть это различие, лучше не иллюстрировать изменения во времени посредством линейчатых диаграмм: мы привыкли рассматривать время как движение слева направо, а не сверху вниз.
Рис.27. Использование гистограммы и линейчатой диаграммы для позиционного сравнения
Вторая причина – практическая. Чаще всего сравниваемые элементы имеют довольно длинные наименования (регионы – северо-восток, юго-запад; отрасли – сельское хозяйство, промышленность; имена продавцов), которые требуют много места. Слева от линеек можно разместить любые наименования, тогда как под столбцами места для названий зачастую не хватает – в силу узости колонок. Поэтому приходится сильно уменьшать шрифт, переносить слова или писать их неудобными для чтения способами.
Временное сравнение Если покомпонентное и позиционное сравнения показывают взаимосвязи в определенный момент времени, то временное сравнение отражает динамику изменений. Данный тип сравнения лучше всего иллюстрировать при помощи гистограмм или графиков. Выбрать, что именно использовать, просто. Когда нужно показать лишь несколько значений (скажем, семь или восемь), используйте гистограмму. Для демонстрации поквартальных изменений за 20 лет правильнее использовать график. Выбирая между гистограммой и графиком, можно также руководствоваться характером имеющихся данных. С помощью гистограммы лучше отражать точные значения параметра в определенные моменты времени. К этой категории относятся, например, данные по объемам производства. Графики больше подходят для отображения тенденции на протяжении некоторого непрерывного периода. Из всех типов диаграмм график используется наиболее часто, и это вполне оправданно. Во-первых, его легче всего нарисовать. Во-вторых, это самый компактный из всех типов диаграмм. Наконец, на графике наиболее наглядным образом можно показать, что значение определенного параметра растет, уменьшается, изменяется или остается стабильным. Частотное сравнение
Частотное сравнение показывает, сколько значений данного параметра попадает в последовательные области числовых значений. Этот тип сравнения применяется в двух основных случаях. Во-первых, для обобщения сходных событий на основе выборки наблюдений. Здесь частотное сравнение используется для того, чтобы предсказывать риск, вероятность или возможность. К примеру, посредством данного вида сравнения можно показать, что в 25% случаев грузы доставляются за пять или менее дней. Второй случай использования этого типа сравнения – суммирование больших объемов информации для того, чтобы продемонстрировать значимую взаимосвязь. Подобное применение особенно полезно для отражения демографической информации – количества работников с определенным размером заработной платы, распределения семей по уровням дохода или модели потребления по возрастным группам. В вышеназванных целях данный тип сравнения лучше всего иллюстрировать с помощью ступенчатых гистограмм или графиков.Гистограммы нагляднее, когда используется не больше 5 – 7 областей числовых значений, в противном случае удобнее будет график. Корреляционное сравнение
Корреляционное сравнение показывает, соответствует ли соотношение двух переменных ожидаемой зависимости. Например, обычно можно ожидать, что более опытный продавец работает эффективнее, чем менее опытный, или что люди с более высоким уровнем образования получают более высокую стартовую заработную плату. Подобные сравнения лучше всего иллюстрируются при помощи точечных (рассеянных) или двусторонних линейчатых диаграмм.
Корреляционный анализ
Выявление степени зависимости между факторами часто служит одной из целей маркетинговых исследований. Корреляция – статистическая взаимосвязь двух или нескольких случайных величин. При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции. Метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными, называется корреляционным анализом. Цель корреляционного анализа – обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б: если обе переменные растут то корреляция положительная, если одна переменная растёт, а вторая уменьшается, корреляция отрицательная. Коэффициент корреляции обозначается латинской буквой r и может принимать значения между -1 и +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи (при коэффициенте корреляции равном единице говорят о функциональной связи), а если ближе к 0, то слабой. После проведения расчетов исследователь, как правило, отбирает только наиболее сильные корреляции, которые в дальнейшем интерпретируются (табл. 14). Таблица 14 Интерпретация коэффициентов корреляции
Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент корреляции Пирсона. Если, по меньшей мере, одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую корреляцию Спирмена или Кендала. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими: четырёхполевая корреляция(табл.15). Таблица 15 Метод вычисления коэффициента корреляции в зависимости от типа шкалы, к которой относятся переменные
Коэффициент корреляции Пирсона. Пусть X,Y — две случайные величины, определённые на одном вероятностном пространстве. Тогда их коэффициент корреляции задаётся формулой:
Квадрат коэффициента парной корреляции называют коэффициентом детерминации, который показывает, насколько вариации результативного признака объясняются изучаемым фактором. Считают, что чем ближе модуль коэффициента парной корреляции к единице, тем сильнее приближается изучаемая взаимосвязь к линейной. Чем ближе модуль коэффициента парной корреляции к нулю, тем слабее линейная взаимосвязь. Коэффициент ранговой корреляции Спирмена. Практический расчет коэффициента включает следующие этапы: 1) сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию); 2) определить разности рангов каждой пары сопоставляемых значений; 3) возвести в квадрат каждую разность и суммировать результаты; 4) вычислить коэффициент корреляции рангов по формуле:
Где – сумма квадратов разностей рангов, а n – число парных наблюдений
При использовании коэффициента ранговой корреляции Спирмена условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 – показателями умеренной тесноты связи, а значения 0,7 и более – показателями высокой тесноты связи. Коэффициент ранговой корреляции Кенделла применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кенделла по формуле:
где S = P – Q; P – суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y; Q – суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются)
Если исследуемые данные повторяются (имеют одинаковые ранги), то в расчетах используется скорректированный коэффициент корреляции Кенделла:
где t – число связанных рангов в ряду X и Y соответственно
Коэффициент множественной ранговой корреляции Кендела называют ещё коэффициентом конкордации и рассчитывают по формуле:
Пример расчета коэффициента конкордации приведен в главе 12 «Экспертные оценки». Коэффициент корреляции знаков Фехнера. Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.
U – число пар, у которых знаки отклонений значений от их средних совпадают; V – число пар, у которых знаки отклонений значений от их средних не совпадают.
При сравнении двух переменных, измеренных в дихотомической шкале, мерой корреляционной связи служит так называемый коэффициент j, который представляет собой коэффициент корреляции для дихотомических данных. Величина коэффициента j лежит в интервале между +1 и –1. Он может быть как положительным, так и отрицательным, характеризуя направление связи двух дихотомически измеренных признаков. Коэффициент j можно вычислить методом кодирования, а также используя так называемую четырехпольную таблицу или таблицу сопряженности. Данный вид корреляции рассчитывают в компьютерной программе SPSS на основании определения мер расстояния и мер сходства. Для применения коэффициента корреляции j необходимо соблюдать следующие условия: - сравниваемые признаки измерены в дихотомической шкале; - число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым. Корреляционный анализ весьма популярен в экономике и социальных науках, хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Коэффициенты парной корреляции бывают близки к единице даже в тех случаях, когда взаимосвязи быть не может. Исследованию этой проблемы посвящено много работ, а сама проблема получила название ложной корреляции. Ложными корреляциями называют такие корреляции между переменными, которые не могут быть объяснены с точки зрения сколько-нибудь «разумной» теории; подобные корреляции следует рассматривать как результат простого совпадения. Например, корреляция между производством обуви промышленностью нашей страны и численностью населения Карибских островов будет явно ложной. На практике исследователь, получивший высокие значения коэффициентов корреляции, спешит делать вывод о высокой степени взаимосвязи между факторами. О ложной корреляции заговорили давно, впервые этот термин употребил в начале века известный математик-статистик К.Пирсон. Он показал, что ложная корреляция может возникать в том случае, когда на взаимосвязь двух переменных влияет некоторая третья переменная, называемая в факторном анализе латентной (т.е. скрытой) переменной.[34]
9.4. Регрессионный анализ
Регрессионный анализ представляет собой метод установления формы связей между зависимой переменной y и одной или несколькими независимыми переменными xj (j = 1, 2, …, k). Регрессионный анализ позволяет исследовать форму связи, в то время как в корреляционном анализе исследуется её сила. Регрессионный анализ используют в тех случаях, когда нужно: 1) определить форму связи – математическое уравнение, описывающее зависимость между зависимой и независимой переменными; 2) предсказать значение зависимой переменной. Различаются однофакторный и многофакторный регрессионные анализы.В первом случае результатом является уравнение парной регрессии , а во втором – множественной регрессии Форма зависимости в соответствии с характером изменения результативного признака может быть линейной и нелинейной. Наиболее полно разработан в теории и реализован в программном обеспечении линейный регрессионный анализ (парная регрессия), когда метод наименьших квадратов применя
Популярное: Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (913)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |