Предварительная проверка на нормальность
Проверка на нормальность распределения Проверка на нормальность распределения играет большую роль, так как многие статистические методы предполагают, что анализируемые с их помощью данные распределены в соответствии с нормой. Необходимость такого сопоставления возникает, когда мы сомневаемся, в какой шкале представлен признак – в порядковой или метрической. А сомнения такие возникают очень часто, так как заранее, как правило, неизвестно, в какой шкале удается измерить изучаемое свойство(исключая случаи явно номинативного измерения). Наиболее весомым аргументом в пользу того, что признак измерен в метрической шкале, является соответствие выборочного распределения норме. Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения. Он характеризуется тем, что крайние значения признака встречаются достаточно редко, а значения близкие к средней величине – достаточно часто. По форме – это колоколообразная кривая, вершина которой соответствует среднему значению признака, а слева и справа она симметрична. График нормального распределения называется кривой Гаусса. Нормальным такое распределение называется потому, что оно очень часто встречается в естественнонаучных исследованиях и являлось«нормой» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя разными учеными в разное время: Муавром в 1733 в Англии, Гауссом в1809 в Германии, Лапласом в1812 во Франции. Кривая нормального распределения обладает свойствами: 68% испытуемых попадает в промежуток[М-σ; M+σ], 95% [М-2σ; M+2σ], 99% [М-3σ; M+3σ], где М– среднее арифметическое, σ – стандартное отклонение(рисунок4).
Рисунок4 – Кривая нормального распределения. Свойства кривой нормального распределения В качественной интерпретации числовых значений дисперсии и стандартного отклонения следует руководствоваться правилом: чем выше значения S² или σ, тем больше разбросаны значения переменной относительно среднего, и наоборот.
Целью процедуры проверки нормальности распределения являетсярешение вопроса о возможности применения тех или иных параметрических критериев. Для того, чтобы распределение было нормальным, выборка должна соответствовать условиям репрезентативности и однородности. Нормальное распределение задаётся несколькими параметрами. Среди них среднее арифметическое, стандартное отклонение, эксцесс, асимметрия. Статистические ошибки репрезентативности(ошибка средней, погрешность) (m) показывают, в каких пределах могут отклоняться отпараметров генеральной совокупности (от математическогоожидания илиистинных значений) частные определения, полученные на основе конкретныхвыборок. Очевидно, величина ошибки тем больше, чем больше варьированиепризнака и чем меньше выборка. Формула нахождения статистической ошибки репрезентативности: m = σ/корень(n), гдеm – ошибка средней арифметической, σ – стандартное отклонение, n – число значений признака. В зависимости от эксцесса и стандартного отклонения нормальное распределение может иметь разную форму(рисунок5).
Рисунок5 – Формы нормального распределения Если распределение не является нормальным, то его нельзя охарактеризовать средним арифметическими стандартным отклонением. В таком случае говорят о непараметрических данных, для которых применяются непараметрические методы статистики. Непараметрические данные – данные, распределение вероятности которых не соответствует нормальному и не может быть задано параметрами нормального распределения. Вопросы для самоконтроля: 1. Меры центральной тенденции. 2. Меры изменчивости признака. 3. Понятие нормального распределения. Задания и упражнения: 1. Для данного числового ряда вычиcлите Мо, Мd, М, сделайте выводы: 2 2 2 3 3 4 5 5 5 6 6 6 6 7 7 8. 2. Для данного числового ряда вычислитеD, σ, m, сделайте выводы: 2 2 2 3 3 4 5 5 5 6 6 6 6 7 7 8. 3. Вычислите дисперсии для двух групп: Группа1 3 2 2 1 1 Группа26 5 5 4 4 Какой будет дисперсия10 значений, полученных путем объединения групп? Объясните полученный результат. 4. Некоторое свойство измеряется при помощи тестовой шкалы(М=500, σ=100). Какая приблизительно доля генеральной совокупности имеет балл от 600 до700?
Предварительная проверка на нормальность
С помощью вычисленных числовых характеристик можно определить, является ли выборочное распределение близким к нормальному. Если выборочное распределение близко к нормальному (или является таковым), то: 1. в интервалы ± σ, ± 2σи ± 3σдолжны попадать соответственно приблизительно 68%, 95% и 100% выборочных значений; 2. в не слишком маленькой выборке величина коэффициента вариации должна быть не более 33%, т.е. V<0,33 (см., например, [4]); 3. Оценка эксцесса Êx и коэффициента асимметрии Ŝk должны быть близки к нулю; 4. ≈ Ме≈Мо Пример 4.В результате измерения температуры раздела фракции бензин-авиакеросин на установке первичной переработки нефти были получены значения температур, приведенные в таблице 1 (в градусах Цельсия).
Таблица 1
По этой выборке вычислены основные числовые характеристики для объема выборки n = 50:
Проведена предварительная проверка на нормальность распределения:
1. в интервалы ± σ, ± 2σи ± 3σ, которые в этом случае равны соответственно: 140, 2 ± 2, 78, (137, 40 ÷ 142, 98); 140, 2 ± 5, 56, (134, 64 ÷ 145, 76); 140, 2 ± 8, 34, (131, 86 ÷ 148, 54), попало, соответственно, 70%, 94% и 100 % выборки; 2. величина ; 3. = 0,19 и Ŝk = 0,0083 можно считать близкими к нулю; 4. = 140,2 ≈ = 140,0. Предварительный анализ показывает, что распределение температуры раздела фракции бензин-авиакеросин не противоречит предположению о нормальности. Задачи Для каждой из приведенных выборок вычислить основные числовые характеристики. Провести предварительную проверку на нормальность распределения в задачах 1.1. − 1.3. 1.1.11, 15, 12, 0, 16, 19, 6, 11, 12, 13, 16, 8, 9, 14, 5, 11, 3. 1.2.3,1; 3,0; 1,5; 1,8; 2,5; 3,1; 2,4; 2,8; 1,3. 1.3.Распределение скорости автомобилей на одном из участков шоссе (км/час).
1.4. Как изменяется выборочное среднее и дисперсия, если результаты наблюдения подвергнуть преобразованию масштаба, т.е. увеличить или уменьшить одновременно в k раз?
1.5. Найти выборочную дисперсию и коэффициент вариации признака по данному распределению.
1.6. Дано распределение. Найдите оценки асимметрии и эксцесса.
Популярное: Почему стероиды повышают давление?: Основных причин три... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2039)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |