Лабораторная работа № 3. Парная линейная регрессия
Цель работы. Освоение построения по выборочным данным модели парной линейной регрессии, оценки точности и надежности параметров и всей модели, построения прогнозов значений зависимой переменной в MS Excel 2010. Интерпретация модели. Краткие сведения. Модель парной линейной регрессии описывает зависимость условного среднего Случайная величина Основные предпосылки парной линейной регрессии. 1. Связь значений зависимой величины от значений фактора задается соотношением (4). (Эта зависимость называется спецификацией модели). 2. 3. Ошибки регрессии 4. Ошибки регрессии 5. Ошибки регрессии Модель парной линейной регрессии содержит три неизвестных параметра: коэффициенты отклонений наблюдаемых значений
где
Оценки дисперсий оценок
Стандартные отклонения коэффициентов уравнения регрессии определяются соотношениями Интервальные оценки параметров уравнения регрессии надежности
где Оцененное уравнение регрессии Верификация и оценка качества модели. Верификация модели парной линейной регрессии означает проверку соответствие модели эмпирическим данным и заключается в установлении значимости уравнения регрессии, т.е. в значимости влияния фактора Дисперсионный анализ в линейной регрессии основывается на том, что общая сумма квадратов отклонений Мерой качества уравнения регрессии и характеристикой прогностической силы регрессионной модели является коэффициент детерминации
который показывает, какая доля вариации зависимой переменной объясняется вариацией фактора. Использование элементов теории корреляции при проверке значимости уравнения регрессии основано на соотношении где Для парной линейной регрессии коэффициент детерминации Прогнозирование по уравнению регрессии. Точечный прогноз Здесь Содержание лабораторной работы. 1. Ввести выборочные данные и построить диаграмму рассеяния. 2. Оценить параметры уравнения парной линейной регрессии. 3. Проверить значимость коэффициента корреляции, параметров уравнения регрессии и самого уравнения регрессии при уровне значимости 4. Оценить точность построенной модели. Построить 95%-й доверительный интервал для дисперсии 5. Построить точечные и интервальные, надежности 6. Дать общее заключение об оцененной модели и ее интерпретацию. Выполнение работы в MS Excel. Выполнение работы в Excel рассмотрим на примере построения регрессионной зависимости Ввод данных и построение диаграммы рассеяния . Выборочные данные по расходам на жилье и располагаемому личному доходу разместим по столбцам: в ячейке А1 имя независимой переменной Для построения диаграммы рассеяния выберем вкладку «Вставка», в группе «Диаграммы» выберем «Точечная», в ее окне выберем тип диаграммы «Точечная с маркерами». Далее во вкладке «Работа с диаграммами» откроем вкладку «Конструктор» и в группе «Макеты диаграмм» выберем «Макет 1», а в группе «Данные» откроем «Выбрать данные». В открывшемся окне «Выбор источника данных» в поле «Диапазон данных для диаграммы» введем диапазон ячеек с данными для диаграммы, в рассматриваемом примере $A$1:$B$13. Внимание! В первом столбце (строке) должны находится значения независимой переменной. По «ОК» на открытом листе Excel получим диаграмму рассеяния, выделив на ней соответствующие поля введем необходимые названия осей координат и название диаграммы. Диаграмма рассеяния представлена на рис.4. Рис. 4. Данные и диаграмма рассеяния Оценка уравнения парной линейной регрессии . Откроем вкладку «Данные», в группе «Анализ» выберем надстройку «Анализ данных». В открывшемся окне «Инструменты анализа» выберем функцию «Регрессия». В появившемся окне "Регрессия" укажем входные данные для оценки параметров регрессии, выводимые результаты и их расположение. Заполнение окна "Регрессия" для рассматриваемого примера приведено на рис.5. В части "Входные данные" в поле ввода "Входной интервал Y" указываем диапазон ячеек, содержащий значения зависимой переменной, в нашем примере это B 1: B 13; в поле ввода "Входной интервал X" – диапазон ячеек, содержащий значения независимой переменной, в примере это A 1: A 13. В поле "Метки" устанавливаем флажок Рис. 5. Заполнение окна регрессия В части "Параметры вывода" указывается одно из мест расположения выводимых результатов: · "Выходной интервал" – для помещения результатов на текущем рабочем листе, положение результатов указывается заданием верхней левой ячейки, начиная с которой располагаются результаты; · "Новый рабочий лист" – для расположения результатов на новом рабочем листе; · "Новая книга" – для помещения результатов в новой книге. В нашем примере выбран "Выходной интервал" и ячейка А20. Далее, выставляя флажки, указываем какую дополнительную информацию, предлагаемую функцией "Регрессия", мы хотим иметь в результатах: · "Остатки" – для выдачи прогнозов · "Стандартизованные остатки" – для вывода нормированных остатков · "График нормальной вероятности" – для вывода таблицы, в которой указывается какими персентилями являются наблюдаемые значения зависимой переменной · "График остатков" – для вывода точечной диаграммы остатков · "График подбора" – для вывода наложенных на диаграмму рассеяния точек ( В нашем примере выбраны "Остатки", "График остатков" и "График подбора". По ОКполучаем результаты регрессии, которые включают в себя таблицу регрессионной статистики, таблицу дисперсионного анализа, таблицу коэффициентов регрессии, таблицу остатков и графики остатков и подбора. Результаты регрессии приведены на рис.6-7. В действительности на экране несколько иная картина, что обусловлено тем, что заголовки некоторых строк и столбцов таблиц не умещаются в ячейках и выводимые графики наложены друг на друга и расположены в правой верхней части экрана. Проведем коррекцию представления полученных результатов. Рис. 6. Таблицы итогов регрессии. Прежде всего, отформатируем ячейки содержащие заголовки для получения их полного текста. Для этого, выделив ячейку, щелкнем на ней правой клавишей мышки и в появившемся меню выберем Формат ячейки, затем в окне формата ячейки щелкнем Выравниваниеи в его окне установим флажок в позиции перенос по словам, щелкнув ОК получим полный текст заголовка. Разнесем графики подбора и остатков, разместив их рядом с таблицей остатков. Рис. 7. Остатки и графики результатов регрессии Пояснения к таблице "Регрессионная статистика": · Множественный · · Нормированный · Стандартная ошибка – оценка · Наблюдений – объем выборки Пояснения к таблице "Дисперсионный анализ": · df – число степеней свободы. · SS – сумма квадратов. · MS – средние квадраты. · F – вычисленное значение критерия Фишера (F-статистики). · Значимость F – уровень значимости, при котором вычисленное значение критерия Фишера является критической точкой распределения Фишера. Нулевая гипотеза о незначимости уравнения регрессии · В строке «Регрессия» приведены число степеней свободы равное · В строке «Остаток» приведены число степеней свободы равное · В строке «Итого» приведены число степеней свободы Следующая таблица содержит МНК-оценки коэффициентов уравнения регрессии, их стандартные ошибки, значения t-статистик для проверки нулевых гипотез В строке с именем "Y-пересечение" приводятся: · оценка · ее стандартная ошибка · вычисленное значение t-статистики, равное · P-значение – вероятность того, что случайная величина распределенная по закону t(n-2) примет значение по абсолютной величине больше, чем модуль вычисленного значения t-статистики, т.е. P-значение это уровень значимости, при котором вычисленное значение t-статистики является критической точкой, следовательно, нулевая гипотеза · нижняя и верхняя границы 95%-о доверительного интервала для В строке с именем "X" приводятся аналогичные данные для коэффициента Таблица "Вывод остатка" содержит порядковые номера наблюдений На графике подбора выводится диаграмма рассеяния и точки Таким образом, в рассматриваемом примере выполнив функцию "Регрессия" мы получили: · уравнение регрессии · оценку среднеквадратического отклонения ошибок регрессии, · 95%-е доверительные интервалы для коэффициентов уравнения регрессии · значение t-статистики для коэффициента · значение t-статистики для коэффициента · коэффициент детерминации · выборочный коэффициент корреляции, совпадающий со значением "Множественный R" таблицы "Регрессионная статистика", т.е. · прогнозные значения · линию регрессии, наложенную на диаграмму рассеяния и график остатков. Проверка значимости коэффициента корреляции. Проверка значимости коэффициента корреляции, гипотезы Построение 95%-о доверительного интервала для дисперсии Построение интервальных прогнозов, надежности
Популярное: Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Почему стероиды повышают давление?: Основных причин три... ![]() ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (382)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |