Войдя в функцию «регрессия» пакета «анализ данных» меню «сервис» можно провести полноценный корреляционно-регрессионный анализ первичных статистических данных. Ниже приводятся соответствующие таблицы:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R
0,673393962
R-квадрат
0,453459428
Нормированный R-квадрат
0,423096063
Стандартная ошибка регрессии
219310,9469
Наблюдения
20
Дисперсионный анализ
Число степеней свободы
Суммы квадратов отклонений
Дисперсия на одну степень свободы
F-критерий
Фишера
df
SS
MS
F(факт)
Значимость F
Регрессия (факторная вариация)
k1=число объясняющих переменных (m) = 1
7,18305E+11
14,93442598
0,001135789
Остаток (остаточная дисперсия)
k2 =N-m-1=18
8,65751E+11
48097291434
Итого (общая вариация)
N-1=19
1,58406E+12
Коэффициенты
Стандартная ошибка
t-статистика
P-Значение
Y-пересечение
563057,7803
195686,483
2,877346313
0,01002362
Переменная X 1
0,286565481
0,074153151
3,864508505
Если коэффициенты разделить на их стандартные ошибки, то получится их t-статистика, которую мы сравниваем с табличной.
Нижние 95%
Верхние 95%
151935,736
974179,8247
0,130775493
0,442355469
Доверительные интервалы для коэффициентов регрессионной модели показывают, в каких пределах с уверенностью 95% (при вероятности ошибки 5%) могут располагаться истинные значения свободного члена и коэффициента регрессии. Следовательно, параметр a может варьировать в пределах от 151935 до 974149, а параметр b в пределах от 0,13 до 0,44.
ВЫВОД ОСТАТКА
Наблюдение
Предсказанное Y
Остатки
1
902899,796
66438,20401
2
912771,1171
-78098,11711
3
1027059,162
-179482,1622
4
1090180,941
-192951,9406
5
1184321,426
-228063,4264
6
1354165,348
-205203,3482
7
1365330,512
-102595,5124
8
1317501,014
124060,9857
9
1352737,392
242763,6076
10
1315315,379
303078,6206
11
1250044,36
122116,6402
12
1302952,658
178550,3421
13
1423255,139
293423,8607
14
1409104,249
332334,7507
15
1413657,202
230584,7983
16
1287009,587
-29309,58742
17
1352946,299
-116213,2986
18
1392323,834
-169819,8345
19
1581722,985
-284599,9846
1667874,598
-307014,5979
В итоге нам остается только дать интерпретацию, полученных результатов (приведена ниже), но мы также проведем аналогичные расчеты вручную, чтобы показать «механизм» работы корреляционно-регрессионного анализа.
ВЫВОД: результаты проведенного исследования не противоречат утверждению о том, что между числом выявленных лиц и числом зарегистрированных преступлений существует умеренная положительная линейная корреляционная связь, позволяющая как объяснять, так и прогнозировать число выявленных лиц, совершивших преступления с помощью полученного уравнения. Нулевая гипотеза отвергается и принимается альтернативная (исследовательская гипотеза).
Обоснование вывода:
1). F-критерий Фишера, оценивающий статистическую значимость полученного уравнения в целом, выше критического табличного значения, что говорит о статистической значимости данного уравнения.
2). Коэффициент корреляции r=0,67 говорит об умеренной связи между переменными.
3). Коэффициент детерминации R2=r2=0,45 указывает на то, что 45% вариации числа выявленных лиц, совершивших преступления, объясняется числом зарегистрированных преступлений, в то время как оставшиеся 55% вариации результирующей переменной объясняется действием других сил неучтенных в данной модели.
4). Обратим внимание на P-значение (p-value), позволяющее принять или отклонить нулевую гипотезу (H0). Гипотезу H0 принято отвергать, когда p-value)<0,05. В нашем случае и для свободного члена[86] и для коэффициента регрессии[87] P-значение меньше 0,05, а, следовательно, коэффициенты надежны.
Продолжение (к задаче №1)
График зависимости (диаграмму рассеяния) можно было построить первоначально по меньшему числу точек по переменным х и у, рассчитав в обычном порядке длину интервала, чтобы выбрать оптимальный вид аппроксимирующей кривой[88].
Для наших данных оптимальной будет парабола второго порядка, дающая коэффициент детерминации равный 0,54 (в линейном уравнении – парабола первого порядка (0,45).
5). Вычислим параметры уравнения (в данном случае найдем свободный член и коэффициент регрессии (первую производную).
Вспомогательная таблица.
№/№
х
y
x∙y
x2
y2
1185914
969338
1,1496E+12
1,40639E+12
9,39616E+11
1220361
834673
1,0186E+12
1,48928E+12
6,96679E+11
1619181
847577
1,3724E+12
2,62175E+12
7,18387E+11
1839451
897229
1,6504E+12
3,38358E+12
8,0502E+11
2167964
956258
2,0731E+12
4,70007E+12
9,14429E+11
2760652
1148962
3,1719E+12
7,6212E+12
1,32011E+12
2799614
1262735
3,5352E+12
7,83784E+12
1,5945E+12
2632708
1441562
3,7952E+12
6,93115E+12
2,0781E+12
2755669
1595501
4,3967E+12
7,59371E+12
2,54562E+12
2625081
1618394
4,2484E+12
6,89105E+12
2,6192E+12
2397311
1372161
3,2895E+12
5,7471E+12
1,88283E+12
2581940
1481503
3,8252E+12
6,66641E+12
2,19485E+12
3001748
1716679
5,153E+12
9,01049E+12
2,94699E+12
2952367
1741439
5,1414E+12
8,71647E+12
3,03261E+12
2968255
1644242
4,8805E+12
8,81054E+12
2,70353E+12
2526305
1257700
3,1773E+12
6,38222E+12
1,58181E+12
2756398
1236733
3,4089E+12
7,59773E+12
1,52951E+12
2893810
1222504
3,5377E+12
8,37414E+12
1,49452E+12
3554738
1297123
4,6109E+12
1,26362E+13
1,68253E+12
3855373
1360860
5,2466E+12
1,48639E+13
1,85194E+12
Сумма
51094840
25903173
6,86825E+13
1,39281E+14
3,51328E+13
Среднее
2554742
1295158,65
3,43413E+12
6,96406E+12
1,75664E+12
σ
678506,3275
288741,0682
σ 2
4,60371E+11
83371404461
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32