3. Проводить кластерный анализ преступности и её структурных составляющих.
4. Вычислять коэффициент локализации (коэффициент Джини) по дискретным (с помощью дискретных сумм) или непрерывным (с помощью интегральных вычислений) значениям.
5. Строить на плоскости кривую Лоренца.
6. Вычислять размах вариации и коэффициент осцилляции (относительный размах вариации).
7. Вычислять коэффициент вариации.
Основная литература:
1. Вентцель Е.С. Теория вероятностей: Учебник для студ. вузов/Елена Сергеевна Вентцель. – 9-е изд. Стер. – М.: Издательский центр «Академия», 2003. С. 66-79.
2. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/Под ред. И.И.Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. С.158-159; 615-616.
3. Ольков С.Г. Аналитическая криминология. – Казань: Институт экономики, управления и права, 2007.
4. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М. Многомерный статистический анализ в экономике: Учеб. пособие для вузов/Под ред. проф. В.Н.Тамашевича. – М.: ЮНИТИ-ДАНА, 1999. С.468-506.
5. Теория статистики: Учебник/Под ред. проф. Г.Л.Громыко. – 2-е изд., перераб. и доп. – М.: ИНФРА-М, 2006. С.104-128.
4. Юзиханова Э.Г. Техника криминологического исследования: Учебное пособие/Под ред. проф. В.В.Лунеева. – Тюмень: Тюменский юридический институт МВД РФ, 2005. С 62-66.
Содержание лекции:
1. Изучение законов распределения преступности в пространстве.
Одним из наиболее общих и важных вопросов при изучении преступности, как массового социально-правового феномена является вопрос, по какому вероятностному закону распределена преступность в пространстве? Под пространством здесь мы можем понимать различные населенные пункты - города, районы области, субъекты Российской Федерации, страны мира. Изучая закон нормального распределения[30], мы уже обращали внимание на то, что преступность по различным территориям Российской Федерации часто распределяется по нормальному закону, хотя можно найти годы, когда эмпирическая форма распределения заметно отличается от аппроксимирующей теоретической. Кроме того, вполне очевидно, что параметры нормального распределения - математическое ожидание и стандартное отклонение не остаются постоянными, а колеблются от периода к периоду (увеличиваются или уменьшаются).
Поскольку преступность является случайной величиной (до наступления отчетного момента, а в отношении латентной - всегда) мы можем установить закон её распределения[31]. То есть уместно говорить, что преступность подчиняется такому-то закону распределения или распределение преступности можно представить интегральной и дифференциальной функциями. F(y) – интегральная функция распределения преступности или интегральный закон распределения преступности, обладающий рядом общих свойств: 1) F(y) – неубывающая функция своего аргумента (аргумент – преступления), то есть при y1>y0 F(y1)≥F(y0); 2) на минус бесконечности F(-¥)=0; 3) на плюс бесконечности F(¥)=1.
Учитывая тот факт, что в реальности совершается достаточно большое число преступлений от дискретных значений преступлений допустимо перейти к непрерывным, чтобы работать с гладкими функциями. Тогда вместо Y=получим интегральные суммы вида: . Производная функции распределения - характеризует плотность, с которой распределяются значения случайной величины (преступности) в данной точке, поэтому её называют дифференциальной функцией или дифференциальным законом распределения.
Величина f(y)dy называется элементом вероятности и представляет собой площадь элементарного прямоугольника, опирающегося на отрезок dy: . Функция распределения через плотность распределения выражается формулой: . По сути F(y) – площадь кривой распределения, лежащая левее крайней правой точки y. Плотность распределения имеет следующие свойства: 1) всегда неотрицательная функция f(y)≥0. Это вызвано тем, что F(y) – неубывающая функция своего аргумента. В нашем случае предполагается, что число преступлений не может убывать[32]. 2) Интеграл плотности распределения в бесконечных пределах равен единице: , что следует из F(¥)=1.
Закон распределения представляет собой функцию в полной мере, описывающую случайную величину с вероятностной точки зрения. Проведенные исследования[33] показывают, что преступность обычно распределена в пространстве территорий Российской Федерации (по областям, районам, населенным пунктам и т.п.) по нормальному закону[34]:
; .
Рис. №1. Интегральная функция распределения преступности для 2005 года с параметрами распределения: m =2404, s =708. Построена по нижеприведенной формуле:
.
Примеры дифференциальных функций (нормальный закон распределения) приведены в приложении. Напомним, что Гауссову же закону подчиняется распределение деяний в пространстве юридической ответственности[35] (m=0, σ»3), а также β-коэффициенты крайм-риска по субъектам Российской Федерации (m»1, σ»0,5)[36] (Приложение, рис.№1; №2).
2. Кластерный анализ преступности и её структурных составляющих.
Сущность кластерного анализа заключается в образовании групп схожих между собой объектов, причем с учетом всех группировочных признаков одновременно. То есть в кластерном анализе используется политетический подход в формировании групп в отличие от обычных классификаций, где применяется монотетический принцип. Слово кластер происходит от английского: cluster - сгусток, пучок, группа. В настоящее время существует достаточно много методов кластеризации, в том числе реализованных в различных статистических компьютерных пакетах.
Кластерный анализ позволяет: 1) разделить исследуемую совокупность объектов, например, стран, районов, областей, каких-либо населенных пунктов на ряд различающихся между собой групп; 2) строить наглядные карты преступности и её структурных составляющих. В статистической литературе отмечается, что методы кластерного анализа позволяют решать следующие задачи: 1) проведение классификации объектов с учетом признаков, отражающих их сущность, а это приводит к углублению знаний о совокупности классифицируемых объектов; 2) проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов; 3) построение новых классификаций для слабоизученных явлений, когда необходимо установить наличие связей внутри совокупности объектов и попытаться привнести в нее структуру[37].
Изучая преступность и её структурные составляющие по различным территориям, представляется достаточно удобным одним взглядом приблизительно оценить существующую картину по цветной карте, например, того, как распределена преступность по всем изучаемым объектам, скажем, по территории Российской Федерации в целом, Республике Татарстан, Московской области и т.д. Далее кластерный анализ позволит разгруппировать изучаемые объекты и обратить внимание на те из них, которые представляют особый интерес.
Все существующие методы кластерного анализа разделяют на две группы: объединяющие (агломеративные) и разделяющие (дивизимные). Первые последовательно объединяют исследуемые объекты в кластеры, а вторые разбивают группы на отдельные объекты. Техника различных методов кластерного анализа подробно описана в соответствующей учебной литературе[38]. Здесь мы рассмотрим решение соответствующих задач кластерного анализа с помощью подходящего программного обеспечения (задача №2).
3. Изучение степени неравенства распределения преступности по населенным пунктам (в пространстве).
На практике часто возникает вопрос, а значимо ли различаются между собой конкретные населенные пункты и другие объекты по уровню преступности? Отвечая на данный вопрос уместно использовать различные статистические методы и показатели. Самым простым будет измерение размаха преступности, когда из максимального по изучаемой совокупности значения вычитается минимальное, но размах плохо отражает состояние дел по всей изучаемой совокупности, поскольку в расчет принимаются лишь два крайних значения. Можно рассчитать так называемый коэффициент фондовой дифференциации, когда во внимание принимается по несколько крайних сверху и снизу значений вариационного признака, что также непоказательно для всей вариации. Существуют и другие меры вариации, концентрации и дифференциации о которых повествует учебная литература по статистике: стандартное отклонение, дисперсия, коэффициент вариации, квартили, квинтили, децили, коэффициент концентрации Джини, коэффициенты Герфиндаля, Лоренца и другие[39]. Мы же сделаем акцент на коэффициент Джини или коэффициент локализации, который удачно характеризует неравенство распределения изучаемого признака, например, коэффициента преступности на 100 тысяч населения, по всей исследуемой совокупности (по всем изучаемым объектам). Этот коэффициент одной цифрой характеризует всю исследуемую совокупность, и к тому же позволяет построить наглядную геометрическую конструкцию. То есть мы отвечаем на вопрос - значимо ли различаются между собой по уровню преступности те или территориальные объекты (районы, города, области, страны). Для этого показатели преступности в объектах исследования должны приводиться к сопоставимому виду:
1). Нельзя ни при каких условиях сравнивать между собой показатели по различным объектам (пространственным, временным), выраженные в абсолютных величинах, поскольку это приведет к ошибочным выводам. Так, если мы сравним между собой число зарегистрированных преступлений в городе Москве и городе Казани за один и тот же временной период, то число преступлений в Москве будет намного больше, однако это вовсе не означает, что уровень зарегистрированных преступлений в Москве действительно выше, чем в Казани, поскольку население Москвы многократно превышает население Казани. Следовательно, между собой должны сравниваться только относительные величины – коэффициенты преступности, приведенные на определенное количество народонаселения (обычно на 100 тысяч).
2). Нельзя непосредственно сравнивать между собой показатели преступности за разные временные периоды по разным территориям, например, коэффициенты преступности в Казани за период с 1985 по 1995 годы и в Москве за период с 1995 по 2005 годы. В таком случае данные несопоставимы не по численности населения, а по временному периоду, поскольку имело место разное уголовное и уголовно-процессуальное законодательство, практика деятельности правоохранительных органов, разные политические, экономические и другие эффекты и т.п. Для сравнения нужно делать соответствующие поправки.
3) Нельзя непосредственно сравнивать между собой показатели преступности за разные временные периоды по одной и той же территории, например, коэффициенты преступности в Казани за период с 1985 по 1995 годы и в Казани за период с 1995 по 2005 годы. Нужно проводить корректировку.
4). Нельзя непосредственно сравнивать между собой показатели (коэффициенты) преступности по разным странам мира даже за один и тот же период времени. Чтобы проводить сравнение нужно сделать соответствующую корректировку данных – соответствующие поправки.
В статистической литературе приводится такая техника, как «смыкание рядов динамики» и «приведение рядов к одному основанию» [40]. Под смыканием рядов динамики понимают объединение в один ряд (более длинный) двух или нескольких рядов, уровни которых исчислены по разным методологиям или в разных границах. При этом для осуществления такого смыкания необходимо, чтобы данные для одного из периодов (переходного) были исчислены по двум методологиям[41]. Переход к относительным величинам целесообразно осуществлять и при параллельном анализе динамики нескольких показателей (или одного и того же показателя по разным объектам), если по абсолютным данным трудно выявить особенности развития. В таких случаях уровни всех рассматриваемых рядов приводятся в процентах (или коэффициентах) к уровню одного и того же периода или момента времени (либо иной базе сравнения). Этот прием перехода от абсолютных показателей к относительным именуют в статистике приведением рядов к одному основанию[42].
В то же время ничто не мешает нам сравнивать качественные характеристики, в частности уголовное и иное законодательство за любой период времени и по любым территориям. Если же мы сравниваем количественные показатели за разные временные периоды, в разных странах, то должны делать соответствующие оговорки и поправки. Например, сравнивая уровень умышленных убийств в США и Российской Федерации даже за один и тот же временной период, нужно знать, какой смысл вкладывается в понятие умышленного убийства в США и России в этот временной период, а также, каковы особенности регистрации данного вида преступлений. Может случиться так, что в одной стране регистрируют сам факт умышленного убийства без учета числа трупов, а в другой считают число убитых. Следовательно, в одной стране убийство 10-ти человек будет спрятано за фактом одного умышленного убийства, а в другой вместо одного умышленного убийства будет зарегистрировано 10. Без соответствующих поправок простое сравнение коэффициентов в таком случае будет иметь значительные погрешности. В Российской Федерации реальные убийства издавна прячут за «ширму» умышленного причинения тяжкого вреда здоровью, повлекшего смерть потерпевшего, и используют много других способов укрытия убийств от учета, что отрицательно сказывается на изучении и преодолении данного социально-патологического явления.
РЕЗЮМЕ (основные определения)
закон распределения представляет собой функцию в полной мере, описывающую случайную величину с вероятностной точки зрения;
F(y) – интегральная функция распределения преступности или интегральный закон распределения преступности, обладает рядом общих свойств: 1) F(y) – неубывающая функция своего аргумента (аргумент – преступления), то есть при y1>y0 F(y1)≥F(y0); 2) на минус бесконечности F(-¥)=0; 3) на плюс бесконечности F(¥)=1;
производная функции распределения - характеризует плотность, с которой распределяются значения случайной величины (преступности) в данной точке, поэтому её называют дифференциальной функцией или дифференциальным законом распределения;
кластер происходит от английского: cluster - сгусток, пучок, группа;
кластерный анализ – группа статистических методов объединяющего (агломеративные методы) или разделяющего (дивизимные методы) типов, позволяющих проводить классификацию исследуемых объектов с учетом всех закладываемых группировочных признаков одновременно, строить наглядные карты и дендрограммы, анализировать полученные кластеры;
размах вариации – показатель разницы между максимальным и минимальным значением исследуемого вариационного ряда;
дисперсия (от лат. dispersio - рассеяние) – характеристика рассеяния значений вариационного ряда (дисперсия преступности (Y), как случайной величины определяется, как математическое ожидание квадрата отклонения Y от её математического ожидания);
коэффициент концентрации Джини (коэффициент локализации) – показатель степени неравномерности распределения какого-либо признака, например, уровня преступности, в исследуемой совокупности, например, по территории страны, вычисляемый по специальной формуле;
кривая Лоренца – графическое представление коэффициента Джини.
ОСНОВНЫЕ ТЕРМИНЫ
интегральная функция распределения преступности или интегральный закон распределения преступности; дифференциальной функцией или дифференциальным законом распределения; стандартное отклонение, дисперсия, коэффициент вариации, квартили, квинтили, децили, коэффициент концентрации Джини, коэффициент Герфиндаля, коэффициент Лоренца; относительные показатели вариации: относительный размах вариации (коэффициент осцилляции); относительное отклонение по модулю; коэффициент вариации, относительное квартильное расстояние.
♫ Практическое применение (показательные примеры):
Задача №1.
1. Найти закон распределения преступности в Российской Федерации в 2005 году.
Дано: первичные данные статистического учета о числе зарегистрированных преступлений по всем субъектам Российской Федерации за 2005 год.
Таблица к задаче.
Субъект РФ
Преступления, шт.
Население
КП
Белгородская область
25243
1511620
1669,93
Брянская область
31004
1378941
2248,392
Владимирская область
36862
1523990
2418,782
Воронежская область
43818
2378803
1842,019
Ивановская область
26370
1148329
2296,38
Калужская область
26057
1041641
2501,534
Костромская область
17404
736641
2362,616
Курская область
26198
1235091
2121,139
Липецкая область
18592
1213499
1532,099
Московская область
116428
6618538
1759,12
Орловская область
18906
860262
2197,703
Рязанская область
17313
1227910
1409,957
Смоленская область
28596
1049574
2724,534
Тамбовская область
22913
1178443
1944,345
Тверская область
40586
1471459
2758,215
Тульская область
20477
1675758
1221,954
Ярославская область
45190
1367398
3304,817
г. Москва
218011
10382754
2099,742
Республика Карелия
15409
716281
2151,251
Республика Коми
31043
1018674
3047,393
Архангельская область
31301
1336539
2341,944
Вологодская область
37176
1269568
2928,24
Калининградская область
22612
955281
2367,052
Ленинградская область
36097
1669205
2162,526
Мурманская область
18257
892534
2045,524
Новгородская область
15399
694355
2217,742
Псковская область
18524
760810
2434,773
г. Санкт-Петербург
100355
4661219
2152,978
Республика Адыгея
6026
447109
1347,77
Республика Дагестан
13658
2576531
530,0926
Кабардино-Балкарская Республика
9283
901494
1029,735
Республика Калмыкия
5458
292410
1866,557
Карачаево-Черкесская Республика
6305
439470
1434,683
Республика Северная Осетия - Алания
6841
710275
963,1481
Краснодарский край
63494
5125221
1238,854
Ставропольский край
48088
2735139
1758,156
Астраханская область
28410
1005276
2826,09
Волгоградская область
54178
2699223
2007,17
Ростовская область
80056
4404013
1817,797
Республика Башкортостан
88877
4104336
2165,442
Республика Марий Эл
22029
727979
3026,049
Республика Мордовия
17063
888766
1919,853
Республика Татарстан
92232
3779265
2440,475
Удмуртская Республика
54155
1570316
3448,669
Чувашская Республика
33958
1313754
2584,807
Кировская область
39249
1503529
2610,458
Нижегородская область
97379
3524028
2763,287
Оренбургская область
51122
2179551
2345,529
Пензенская область
26898
1452941
1851,28
Пермская область
123923
2955497
4192,967
Самарская область
82206
3239737
2537,428
Саратовская область
53939
2668310
2021,467
Ульяновская область
28280
1382811
2045,11
Курганская область
38232
1019532
3749,956
Свердловская область
154723
4486214
3448,855
Тюменская область
122608
3264841
3755,405
Челябинская область
98710
3603339
2739,404
Республика Алтай
5433
202947
2677,054
Республика Бурятия
30341
981238
3092,114
Республика Тыва
10301
305510
3371,739
Республика Хакасия
19273
546072
3529,388
Алтайский край
75508
2607426
2895,883
Красноярский край
82540
3023525
2729,926
Иркутская область
85614
2717032
3151,012
Кемеровская область
52235
2899142
1801,74
Новосибирская область
89103
2692251
3309,61
Омская область
55084
2079220
2649,263
Томская область
32175
1046039
3075,889
Читинская область
33080
1155346
2863,212
Республика Саха (Якутия)
18993
949280
2000,78
Приморский край
61848
2071210
2986,081
Хабаровский край
52182
1436570
3632,402
Амурская область
22898
902844
2536,208
Камчатская область
9907
358801
2761,141
Магаданская область
4659
182726
2549,719
Сахалинская область
14592
546695
2669,13
Еврейская автономная область
5578
190915
2921,719
Чукотский автономный округ
851
53824
1581,079
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32