|
16641 |
4624 |
66,353 |
1,647 |
2,713 |
-4,650 |
21,623 |
|||
итого |
2673 |
1341 |
180882 |
367443 |
91065 |
1342,22 |
-1,219 |
881,640 |
10,500 |
110,250 |
Средн. Знач |
133,65 |
67,05 |
9044,1 |
18372,2 |
4553,25 |
|
|
|
|
|
509,827 |
57,548 |
|
|
|
|
|
|
|
|
|
22,579 |
7,586 |
|
|
|
|
|
|
|
|
1. Построение уравнения регрессии сводятся к оценке ее параметров. Для оценки параметров регрессии, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна т.е
Для линейных уравнений, решается следующая система уравнений:
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
Уравнение регрессии:
2.Рассчитаем линейный коэффициент парной корреляции:
Значение коэффициентов парной корреляции лежит в интервале от -1 до +1. его положительное значение свидетельствует о прямой связи, отрицательное – об обратной, т.е. когда растет одна переменная, другая уменьшается. Чем ближе значение к 1, тем теснее связь. Связь считается достаточно сильной, если коэффициент корреляции по абсолютной величине превышает 0,7, и слабой, если меньше 0,4. При равенстве его нулю связь полностью отсутствует. Это коэффициент дает объективную оценку тесноты связи лишь при линейной зависимости переменных.
Рассчитаем коэффициент детерминации. Он показывает долю вариации результативного признака, находящего под воздействием изучаемых факторов.
3. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации , которая показывает среднее отклонение расчетных значеий от фактических. Допустимый предел ее значений 8-10%.
4. Рассчитаем F-критерий Фишера, применяемый для оценки качества уравнения регрессии. Выполняется сравнение Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Если табличное значение меньше фактического, то признается статистическая значимость и надежность характеристик, если наоборот, то признается статистическая незначимость, ненадежность уравнения регрессии.:
Рассчитаем t-критерий Стьюдента, применяемый для оценки статистической значимости коэффициентов регрессии и корреляции. Если табличное значение показателя меньше фактического, то значения коэффициентов не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х, Если наоборот, то признается случайная природа формирования коэффициентов.
для числа степеней свободы и .
Определим случайные ошибки:
тогда
Рассчитаем доверительный интервал для a и b. Для этого определим предельную ошибку для каждого показателя:
Доверительные интервалы:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр признается нулевым, т.к. он не может одновременно принимать отрицательное и положительное значение.
5. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение фактора составит тогда прогнозное значение результата будет
Ошибка прогноза составит:
Предельная ошибка прогноза:
Доверительный интервал прогноза:
6. Аналитическая записка:
Линейный коэффициент парной корреляции равен 0,484, следовательно связь изучаемых явлений является умеренной, прямой.
Коэффициент детерминации равен 0,234, т.е. вариация результата на 23,4% объясняется вариацией фактора х.
Средняя ошибка аппроксимации равна 4,010%, что попадает в допустимый предел значений 8-10% и говорит о том, что расчетные значения отклоняются от фактических примерно на 4%.
Полученное значение F-критерия превышает табличное, следовательно параметры уравнения и показателя тесноты статистически незначимы.
Полученные значения t-критерия показывают, что параметры a и b статистически незначимы, т.к. их фактические значения t-критерия меньше табличного. А коэффициент парной корреляции статистически значим, т.к. фактическое значение его t-критерия больше табличного.
Определение доверительных интервалов показало, что параметр b является статистически незначимым и равен нулю, т.к. в границы его доверительного интервала попадает ноль:
ЗАДАЧА 2.
По данным, представленным в таблице, изучается зависимость бонитировочного балла (У) от трех факторов .
№ п/п
Внесено минеральных удобрений на посевную площадь, ц
Коэффициент износа основных средств
Запасы влаги в почве, мм
Бонитировочный балл
Х1
Х2
Х3
У
1
13,9
57,6
144
75
2
8,8
41,6
110
54
3
4
66,5
110
61
4
0,01
52,8
177
64
5
4,2
51,6
186
72
6
0,7
37,3
112
69
7
6,7
44,2
148
79
8
15,9
46,3
151
73
9
1,9
39,6
110
60
10
1,9
28,3
151
72
11
0,01
64,6
131
54
12
0,01
49,4
113
77
13
0,01
58,4
110
57
14
1,2
58,9
127
72
15
0,01
49,6
136
72
16
0,01
51,9
136
67
17
3,7
49,7
144
72
18
0,01
37,6
100
55
19
0,01
50,3
148
68
20
1,6
43,2
129
68
21
2,5
36,2
125
73
22
0,01
53,5
113
61
23
6,3
49,6
129
70
24
0,01
54,3
168
70
25
13,1
42,9
125
69
26
0,4
31,1
125
75
27
0,01
49,7
131
47
28
0,8
24,6
146
70
29
0,01
58,7
88
66
30
0,01
56,3
127
66
31
0,5
48,4
113
69
32
0,01
50,6
151
68
33
2,3
49,4
129
68
34
0,01
56,8
177
67
35
0,01
40,1
131
46
Задание следует решить с помощью ППП MS EXCEL или любого другого статистического пакета прикладных программ.
Задание.
1. Постройте матрицу парных коэффициентов корреляции. Установите какие факторы мультиколлинеарны.
2. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.
3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
4. Отберите информативные факторы по пунктам 1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.
5. Оцените полученные результаты, выводы оформите в аналитической записке.
Решение.
Для проведения корреляционного анализа воспользуемся программой «Excel»:
1) загрузить среду Excel ;
2) выделить рабочее поле таблицы;
3) выбрать пункт меню «Сервис» и в появившемся меню выбрать «Анализ данных» (рис. 1);
Рис. 1 Меню «Сервис».
4) в появившемся диалоговом окне «Анализ данных» (рис. 2) выбрать «Корреляция;
Рис. 2. Диалоговое окно «Анализ данных».
5) в появившемся диалоговом окне «Корреляция» (рис. 3) убедиться, что все проставленные в нем установки соответствуют таблице исходных данных. После выполнения этих операций нажать клавишу «ОК»;
Рис. 3. Диалоговое окно «Корреляция».
В результате получим:
Х1
Х2
Х3
У
Х1
1
Х2
-0,03376
1
Х3
0,098684
0,033191
1
У
0,26943
-0,13538
0,312057
1
Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. бонитировочный балл имеет слабую прямую связь со всеми независимыми переменными, т.к. значения коэффициентов парной корреляции ниже 0,4.
При использовании материалов активная ссылка на источник обязательна.