Ожидаемая
продолжительность жизни при рождении в 1997 г., лет, x1
Суточная
калорийность
питания населения, ккал на душу, x2
Содержание углеводов в рационе питания,%, x3
1. Россия
0,747
66,6
48,1
2. Румыния
0,752
69,9
44,15
3. США
0,927
76,6
35,7
4. Турция
0,728
69,0
36,45
5. Украина
0,721
68,8
47,2
6. Финляндия
0,913
76,8
44,6
7. Франция
0,918
78,1
36,6
8. Чехия
0,833
73,9
40,9
9. Швейцария
0,914
78,6
39,65
10. Швеция
0,923
78,5
41,15
11. ЮАР
0,695
64,1
44,3
12. Япония
0,924
80,0
44,75
Требуется:
1. Найти матрицу парных коэффициентов корреляции. Сделать выводы.
2. Построить уравнение множественной регрессии в стандартизованной и естественной форме.
3. Сделать выводы о силе влияния факторов на результат на основе -коэффициентов и средних коэффициентов эластичности.
4. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Проанализировать линейные коэффициенты парной и частной корреляции. Рассчитать значение скорректированного коэффициента множественной детерминации.
5. С помощью общего F-критерия Фишера оценить статистическую надежность уравнения регрессии.
6. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение регрессии фактора после фактора и насколько целесообразно включение в уравнение регрессии фактора после фактора .
7. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных и множественного уравнения регрессии.
8. Сделать выводы.
Решение.
1. Матрицу парных коэффициентов можно получить, рассчитав линейные коэффициенты парной корреляции аналогично тому, как это делалось в первой лабораторной работе. Однако, эффетивнее воспользоваться инструментом «Корреляция» ППП Exel. При построении матрицы парных коэффициентов корреляции исследуемых показателей, учитываем, что эта матрица должна быть симметричной относительно главной диагонали:
0,968
0,398
-0,42
0,968
0,389
-0,418
0,398
0,389
-0,996
-0,42
-0,418
-0,996
Очевидно, что факторы и явно коллинеарны , то есть они дублируют друг друга, один из них следует исключить. Для дальнейшего анализа предпочтительнее оставить фактор , так как он меньше коррелирует с фактором ( ), чем фактор ( ).
2. Линейное уравнение регрессии от и имеет вид:
.
Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе:
.
В нашем примере число объясняющих факторов .
Стандартизованные коэффициенты регрессии ( -коэффициенты) определяются из следующей системы уравнений:
.
При эта система принимает вид:
.
Для нахождения -коэффициентов применим метод Крамера:
;
,
;
,
.
;
Получим уравнение в стандартизованном масштабе .
Для построения уравнения в естественной форме рассчитаем и , используя формулы для перехода от к :
; ;
Для расчета необходимых величин составим расчетную таблицу 3.2.1.
Таблица 3.2.1
N
y
x1
x2
1.
0,747
66,6
0,558009
4435,56
2.
0,752
69,9
0,565504
4886,01
3.
0,927
76,6
0,859329
5867,56
4.
0,728
69,0
0,529984
5.
0,721
68,8
0,519841
4733,44
6.
0,913
76,8
0,833569
5898,24
7.
0,918
78,1
0,842724
6099,61
8.
0,833
73,9
0,693889
5461,21
9.
0,914
78,6
0,835396
6177,96
10.
0,923
78,5
0,851929
6162,25
11.
0,695
64,1
0,483025
4108,81
12.
0,924
80,0
0,853776
среднее
0,832917
73,40833
3127,667
0,702248
5415,971
дисперсия
0,008498
27,18743
95881,39
Ср.кв.откл.
0,092183
5,214157
309,6472
; .
Значение параметра определим из соотношения
Получим уравнение в естественной форме .
3. При сравнении модулей значений стандартизованных коэффициентов и приходим к выводу, что сила влияния на оказалась большей, чем сила влияния :
.
К аналогичным выводам можно прийти, рассчитав средние коэффициенты эластичности:
;
; .
С увеличением на 1 % от его среднего уровня возрастает на 1,49 % от своего среднего уровня; при повышении на 1 % от его среднего уровня повышается на 0,03 % от своего среднего уровня. Очевидно, что сила влияния на оказалась большей, чем сила .
4. Линейные коэффициенты частной корреляции рассчитываются по рекуррентной формуле:
.
При получаем:
;
;
.
Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленным в модели. Сравним парные и частные коэффициенты корреляции:
– выводы о связи между и совпадают;
– связь между и на основе частного коэффициента корреляции оказалась гораздо слабее;
– связь между и на основе частного коэффициента корреляции оказалась гораздо слабее.
Различия в выводах на основе частных и парных коэффициентов корреляции различаются из-за довольно существенной межфакторной связи .
Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и :
Зависимость от и характеризуется как тесная, в которой 93,7 % вариации среднего душевого дохода определяются вариацией учтенных в модели факторов. Прочие факторы, не включенные в модель, составляют соответственно 6,3 % от общей вариации .
Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается следующим образом:
.
5. Общий F-критерий проверяет гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи:
Определяем по таблице значений F-критерия Фишера .
Так как , то гипотеза о случайной природе оцениваемых характеристик отклоняется, и с вероятностью делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов и .
6. Частные F-критерии – и оценивают статистическую значимость присутствия факторов и в уравнении множественной регрессии. оценивает, насколько целесообразно включение в уравнение регрессии фактора после фактора , а указывает целесообразность включения в уравнение регрессии фактора после фактора .
Фактическое значение частного F-критерия рассчитываетcя по формуле:
.
.
Так как , то гипотезу о несущественности прироста за счет включения дополнительного фактора отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения в уравнение регрессии фактора после фактора .
Целесообразность включения в модель фактора после фактора проверяет :
.
Так как , то гипотезу о несущественности прироста за счет включения дополнительного фактора принимаем. Это означает нецелесообразность включения в уравнение регрессии фактора после фактора .
7. Оценка с помощью t-критерия Стьюдента значимости коэффициентов и связана с сопоставлением их значений с величиной их случайных ошибок и . Расчет значений случайных ошибок достаточно сложен и трудоёмок. Поэтому предлагается расчёт значения t-критерия Стьюдента по следующим формулам:
;
.
Табличные (критические) значения t-критерия Стьюдента зависят от принятого уровня значимости и от числа степеней свободы , где – число единиц совокупности, – число факторов в уравнении.
В нашем примере . Так как , то коэффициент регрессии является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе. Так как , то приходим к заключению, что величина является статистически незначимой, ненадежной в силу того, что формируется преимущественно под воздействием случайных факторов. Еще раз подтверждается статистическая значимость влияния на и ненадежность, незначимость влияния на .
8.Проведенные выше исследования показывают, что в данном примере парная регрессионная модель зависимости индекса человеческого развития от средней ожидаемой продолжительности жизни является достаточно статистически значимой, и нет необходимости улучшать ее, включая дополнительный фактор (суточную калорийность питания).
Варианты индивидуальных заданий к лабораторной работе №3
Задание
1. Найти матрицу парных коэффициентов корреляции. Сделать выводы.
2. Построить уравнение множественной регрессии в стандартизованной и естественной форме.
3. Сделать выводы о силе влияния факторов на результат на основе -коэффициентов и средних коэффициентов эластичности.
4. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Проанализировать линейные коэффициенты парной и частной корреляции. Рассчитать значение скорректированного коэффициента множественной детерминации.
5. С помощью общего F-критерия Фишера оценить статистическую надежность уравнения регрессии при уровне значимости .
6. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение регрессии фактора после фактора и насколько целесообразно включение в уравнение регрессии фактора после фактора при уровне значимости .
7. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных и множественного уравнения регрессии при уровне значимости .
8. Сделать выводы.
Варианты исходных данных 1–21
По 10 однотипным фирмам (i – номер фирмы) имеются данные за год по зависимости цены товара yi, тыс. руб., от дальности его перевозки xi1, км, расходов на рекламу в месяц xi2, тыс. руб. и расходов на прочие нужды в месяц xi3, тыс. руб.
1.
i
yi
48,72
53,02
51,39
73,71
67,16
69,27
42,09
46,42
51,11
49,09
xi1
xi2
xi3
1,5
1,1
1,5
1,4
2,5
2,1
1,3
1,4
1,4
2.
i
yi
47,22
50,41
49,39
70,61
65,16
67,07
40,59
71,51
64,46
66,67
xi1
xi2
xi3
19,2
12,5
13,9
8,9
11,4
10,9
22,7
9,6
12,5
11,9
3.
i
yi
39,99
45,92
48,81
47,59
67,91
62,56
64,47
39,69
47,62
49,41
xi1
xi2
xi3
27,8
19,2
12,5
13,9
8,9
11,4
10,9
22,7
19,2
12,5
4.
i
yi
48,79
68,01
63,76
65,47
41,39
36,52
36,61
36,19
52,51
49,56
xi1
xi2
xi3
22,7
41,7
35,7
20,8
17,9
22,7
41,7
5.
i
yi
51,07
31,09
35,42
33,71
34,09
48,31
47,06
48,27
30,19
40,32
xi1
xi2
xi3
35,7
20,8
22,7
16,7
22,7
20,8
35,7
31,3
19,2
20,8
6.
i
yi
35,42
34,61
35,59
52,51
50,96
52,17
28,99
41,91
42,49
63,31
xi1
xi2
xi3
22,7
13,9
15,6
9,6
12,5
11,9
27,8
13,2
14,7
9,3
7.
i
yi
59,86
61,37
32,89
49,52
52,21
52,19
74,11
69,56
71,27
42,09
xi1
xi2
xi3
11,9
11,4
19,2
12,5
13,9
8,9
11,4
10,9
22,7
8.
i
yi
36,22
38,01
37,39
56,61
52,36
54,07
29,99
50,12
51,91
51,29
xi1
xi2
xi3
20,8
15,6
20,8
19,2
31,3
27,8
17,9
17,9
9.
i
yi
70,51
66,26
67,97
43,89
37,52
35,91
35,69
49,11
47,46
48,77
xi1
xi2
xi3
9,3
11,9
11,4
22,7
13,9
15,6
9,6
12,5
11,9
10.
i
yi
32,89
49,92
51,81
50,59
69,01
64,36
66,17
44,29
49,92
50,91
xi1
xi2
xi3
19,2
17,9
22,7
41,7
35,7
20,8
31,3
20,8
11.
i
yi
51,09
70,11
66,86
68,37
43,29
40,72
40,81
40,39
56,71
53,76
xi1
xi2
xi3
13,2
8,6
10,9
10,4
20,8
27,8
15,6
17,9
10,4
13,9
12.
i
yi
55,27
35,29
42,92
46,51
45,09
66,41
60,46
62,47
36,49
58,02
xi1
xi2
xi3
62,5
27,8
31,3
20,8
31,3
27,8
62,5
35,7
13.
i
yi
62,61
61,19
81,41
77,76
79,87
50,99
44,72
46,61
45,39
63,81
xi1
xi2
xi3
13,2
14,7
9,3
11,9
11,4
27,8
15,6
17,9
10,4
14.
i
yi
59,16
60,97
39,09
37,92
39,21
39,59
59,51
56,16
57,67
30,89
xi1
xi2
xi3
62,5
17,9
22,7
41,7
35,7
20,8
15.
i
yi
42,82
43,81
43,99
63,01
59,76
61,27
36,19
47,12
49,21
48,79
xi1
xi2
xi3
20,8
13,2
14,7
9,3
11,9
11,4
27,8
15,6
17,9
16.
i
yi
68,91
64,56
66,27
40,49
51,12
50,71
51,29
68,31
66,26
67,57
xi1
xi2
xi3
27,8
62,5
35,7
22,7
35,7
31,3
83,3
62,5
17.
i
yi
44,89
53,12
57,01
55,79
78,01
71,96
73,97
46,29
43,12
45,71
xi1
xi2
xi3
27,8
20,8
13,2
14,7
9,3
11,9
11,4
22,7
13,9
18.
i
yi
44,29
63,71
58,46
60,37
37,29
53,12
56,61
55,79
77,91
72,36
xi1
xi2
xi3
22,7
20,8
35,7
31,3
19,2
35,7
22,7
35,7
31,3
83,3
19.
i
yi
74,27
46,09
49,52
51,21
51,19
71,21
67,36
68,97
42,69
43,72
xi1
xi2
xi3
11,4
22,7
13,9
15,6
9,6
12,5
11,9
27,8
27,8
20.
i
yi
48,01
46,39
68,71
62,16
64,27
37,09
47,22
50,51
48,89
69,31
xi1
xi2
xi3
16,7
22,7
20,8
35,7
31,3
19,2
35,7
22,7
35,7
31,3
21.
i
yi
63,46
65,47
41,19
36,92
39,41
38,59
58,81
53,96
55,77
30,49
xi1
xi2
xi3
12,5
11,9
27,8
20,8
13,2
14,7
9,3
11,9
11,4
Варианты исходных данных 22–29
Имеются данные о рынке строящегося жилья в Санкт-Петербурге: y – цена квартиры, тыс. долл.; x1 – количество комнат в квартире; x2 – общая площадь квартиры, м2; x3 -площадь кухни, м2 .