Classification without training of subjects of the Volga federal district by indicators of development of the level of education
- Authors: Trusova A.Y.1, Ilina A.I.1
-
Affiliations:
- Samara National Research University
- Issue: Vol 14, No 3 (2023)
- Pages: 228-254
- Section: MATHEMATICAL AND INSTRUMENTAL METHODS OF ECONOMICS
- URL: https://journals.ssau.ru/eco/article/view/26943
- DOI: https://doi.org/10.18287/2542-0461-2023-14-3-228-254
- ID: 26943
Cite item
Full Text
Abstract
Анализ показателей развития сферы образования в настоящее время является важным и одним из первостепенных. Данная сфера определяет стратегию дальнейшего развития трудового потенциала отдельного региона и страны в целом, формирует устойчивые тенденции в развитии показателей социально-экономической сферы. Регулярный мониторинг результатов развития и формирование тенденций являются актуальными и практически значимыми. Изучению вопросов развития показателей сферы образования на примере данных по Приволжскому федеральному округу посвящено настоящее исследование. В работе в качестве математического инструментария использовался аппарат многомерных статистических методов. Классификация без обучения позволила выявить однородные по показателям субъекты Приволжского федерального округа. Средствами факторного анализа проведена визуализация субъектов Приволжского федерального округа, а также изучена структуризация субъектов, факторов. Субъекты Приволжского федерального округа представлены в теоретическом пространстве двух латентных факторов, что позволяет выявить долевое соотношение между изучаемыми показателями с учетом их взаимосвязи с латентными факторами. Используя компоненты матрицы факторного отображения, проведена кластеризация субъектов Приволжского федерального округа с использованием взвешенной евклидовой метрики.
Keywords
Full Text
Введение
Вопросы развития образования всегда находились и находятся в фокусе государственной политики. Показатели данной сферы изучаются на всех уровнях, в том числе и на региональном. Сравнительный анализ способствует развитию данной сферы в отдельных субъектах. В настоящее время цифровые технологии плавно появляются на всех ступенях данного социального направления. Многие показатели развития социально-экономической сферы являются ключевыми индикаторами, так как они оказывает непосредственное влияние на экономику страны. Кроме того, вопросы качественного и количественного подходов при изучении сферы образования способствуют формированию человека как личности, что также оказывает огромное влияние на уровень жизни людей.
С внедрением цифровых технологий сфера образования стала более доступной для людей с ограниченными возможностями и приобрела еще большую важность как для отдельно взятого человека, так и для государства в целом. Таким образом, актуальность исследования заключается в существенном влиянии уровня развития показателей сферы образования на развитие показателей социально-экономической сферы, а также на тенденции развития страны и отдельно взятых регионов. Целью исследования является изучение особенностей сферы образования в субъектах Приволжского федерального округа средствами кластерного и факторного анализов. Объектом исследования выступают субъекты Приволжского федерального округа. Предметом исследования являются показатели развития сферы образования, в том числе затрагивающие цифровые технологии в изучаемой области. Научная новизна исследования выражается в комбинированном использовании многомерных статистических методов. Классификация без обучения обеспечивает выявление структуры в субъектах Приволжского федерального округа по степени развитости показателей, характеризующих уровень образования. Факторный анализ способствует решению задачи визуализации субъектов Приволжского федерального округа и сжатия исходного массива данных. Практическая значимость исследования выражается в выявлении тенденции изменения показателей с целью построения прогноза.
Обзор научной литературы
Современное состояние научной мысли характеризуется широким спектром проблем, которые непрерывно возникают в процессе исследования вопросов социально-экономической сферы. Особенно остро они описываются применительно к региональным аспектам. Учеными всесторонне описываются актуальные ситуации в социально-экономической сфере. В статье [1] авторами рассматриваются теоретические аспекты региональных финансов, фундаментально описаны выделенные основные функции и составные элементы финансовой составляющей региональной экономики, отмечена важность изучения их роли в развитии территории. Авторы [2] подчеркивают, что в «условиях отсутствия значительной динамики темпов экономического роста в Российской Федерации и ее регионах и исчерпания потенциала восстановительного роста особенно ярко проявляется негативное влияние экономических кризисов и сложившейся экспортно-сырьевой ориентации производства». Отмечают важность структурного фактора экономического роста на региональном уровне. Методический подход в исследовании основан на расчете показателей структурных сдвигов – величины, индекса, скорости и мощности. На основе глобального анализа в исследовании [3] обобщается влияние информационных технологий на экономический рост в региональном разрезе. Авторами описывается период исследования с 1996 по 2019 год. Объекты исследования государства ОАЭ, Колумбия, Вьетнам, Болгария, Российская Федерация и Сербия. Анализируется влияние электронной коммерции на региональную экономику за счет интенсификации информационных технологий. В качестве вывода отмечается, что на региональном уровне внедрение информационных технологий положительно влияет на экономический рост, а также на образовательные навыки их пользователей, что положительно сказывается на благосостоянии региона. Авторы описывают трудности законодательного характера на региональном уровне, а также связанные с качеством и стоимостью трудовых ресурсов и доступа в Интернет. В статье [4] освещены вопросы совершенствования государственного регулирования инновационного развития региональной экономики. Авторы статьи подчеркивают важность углубленного анализа, имеющегося зарубежного и отечественного опыта регионального инновационного развития. В исследовании [5] предложена концепция развития частного сельскохозяйственного предпринимательства на основе группового создания крестьянских хозяйств в сельских поселениях, что также, по мнению авторов, будет целесообразным при решении проблем экономики региона. Авторы [6] в исследовании описывают эффективные пути регионального роста, присущие новому типу воспроизводства. Разработка стратегии стимулирования инновационной активности регионов рассматривается в условиях современных трансформационных процессов. Методология исследования базируется на положениях экосистемного подхода, методов системного, логического и сравнительного анализа, научного обобщения и систематизации.
В статье [7] изучается цифровая инновация как фактор развития региональной экономики Сибирского федерального округа. Авторами установлено, что существует линейная зависимость между значением показателей инновационного развития регионов и показателями развития цифровой экономики. Дополнительно авторы включили swot-анализ развития цифровых инноваций на примере Кемеровской области – Кузбасса, как сырьевого региона с потенциалом развития в сфере цифровизации. В основе исследования [8] – оценка состояния и приоритетов развития региональной экономики с учетом среднесрочных социально-экономических задач. Авторы изучают вопросы экономического развития Северного Кавказа. Основной вывод по результатам исследования: инновационная экономика базируется на накопленном человеческом капитале, который является определяющей составляющей нового социально-экономического развития общества. В статье [9] исследуется система показателей, характеризующих инновационное развитие регионов. Проведена иерархическая классификация субъектов Приволжского федерального округа РФ по показателям, характеризующим результаты инновационной деятельности организаций, в том числе сельскохозяйственных предприятий. Проведен сравнительный анализ регионов по уровню инновационного развития. Выявленные закономерности позволили авторам определить перспективы развития региона. Для каждого кластера определены перспективные направления инновационного развития экономики. Автор статьи [10] фокусирует исследование на вопросах, связанных с реализацией конкурентных преимуществ России и ее регионов. Среди них выделяются в качестве ключевых следующие: обеспечение целостности социально-экономического пространства, инфраструктурное развитие территорий, развитие территориально-производственных комплексов (кластеров). Вопросы социально-экономического развития РФ, а также вариационный анализ межрегиональной дифференциации регионов ПФО рассматриваются в исследовании [11]. Авторы [12] в своем исследовании в рамках изучения актуальных вопросов неоэкономики выявляют «сущность информационно-инновационно-технологических процессов как составляющей современного макроэкономического цикла». Авторами «на основе сопоставления определений технологического цикла и использования постулатов рекуррентного подхода» предложено описание информатизации, инноватизации и технологизации производства как единого процесса, характеризующегося колебаниями «показателей инновационности», используемых в процессе производства технологий в определенные промежутки времени. В исследовании [13] описаны методики оценки уровня цифровизации экономики. Предложены индикаторы, которые характеризуют состояние региональной экономики в Республике Мордовия. В статье [14] «исследуется внедрение информационных технологий и информационно-телекоммуникационных сетей в Приволжском федеральном округе. Проведен анализ современного состояния процессов цифровизации как в округе, так и в разрезе субъектов, входящих в его состав. Подчеркивается особая значимость внедрения информационных технологий и информационно-телекоммуникационных сетей в социально-чувствительные сферы экономики (органы государственной власти и местного самоуправления, образовательные учреждения, здравоохранение, домашние хозяйства)». Многомерный подход предлагается в статье [15] в качестве инструмента «анализа основных показателей регионального производства для оценки интегрального индикатора – относительного уровня эффективности экономики российских регионов. Исходными данными для оценки эффективности региональной экономики выбраны удельные показатели производства валового регионального продукта: объемы энергопотребления, использования основных фондов, трудовых ресурсов, экологического влияния, которые рассчитываются по данным Росстата». В статье [16] анализируется динамика основных показателей экономического роста регионов ПФО с 2000 по 2017 г., дана их сравнительная характеристика. Автор статьи [17] исследует конкурентоспособность экономики Cамарской области, описывает всесторонне индекс конкурентоспособности регионов. Авторами [18] проведен анализ понятия «цифровая экономика», выделены нормативно-правовые акты в области цифровизации. В исследовании представлены показатели цифровизации экономики, проведен анализ уровня цифровизации Приволжского федерального округа. В статье [19] представлен анализ социально-экономического развития субъектов Российской Федерации, в том числе Чувашской Республики. Выявлены основные проблемы обеспечения экономической безопасности дотационных регионов, определены резервы их экономического роста. В работе «предложена методика оценки конкурентоспособности регионов на основе выделения агрегированных факторов, которая была апробирована на регионах Приволжского федерального округа. По результатам расчетов показателей выведен сводный индекс конкурентоспособности регионов и показана его динамика. Представлена прогнозная оценка сводного индекса конкурентоспособности регионов». В статье [21] выделяются «пути создания цифрового образовательного пространства и приложен контент с помощью цифровых технологий. Рассмотрены основные направления применения средств ИКТ в образовательном процессе вуза для совершенствования содержания педагогического образования, формирования высокого уровня информационной культуры». В статье [22] «рассматриваются проблемы образовательного процесса в период цифровой трансформации. Проведен анализ возможных рисков цифровизации образовательного процесса, в том числе использования цифрового следа обучаемого и изменения роли преподавателя».
Таким образом, вопросы развития регионов в социально-экономическом аспекте являются широко представленными в научной литературе. Изучая многопланово, а именно комплексно и дифференцированно проблемы развития социально-экономической сферы, необходимо при обобщении учитывать особенности развития отдельных частей регионов, а также учитывать вектор государственного регулирования проблем в стране в целом. В настоящее время в рамках научных исследований выделяются в качестве актуальных показатели развития сферы образования. Методы исследования показателей развития регионов также широко представлены в исследованиях, однако методы многомерного подхода в анализе представлены недостаточно полно. Показатели образовательного блока имеют непосредственную связь с показателями сферы труда. Численностью рабочей силы, уровень занятости и безработицы, динамика среднегодовой численности занятых и другие показатели непосредственно зависят в том числе и от числа выпускников высших и профессиональных учебных заведений. Отдельно взятый регион, реализуя функции развитии страны в целом, решает масштабно проблемы развития сферы образования и взаимно влия-
ющих друг на друга других сфер, связанных с образованием. Таким образом, изучение показателей, характеризующих развитие сферы образования, является актуальным и практически значимым. Показатели сферы образования изучаются в рамках других наук, в частности психологии, педагогики, педагогики высшей школы, социологии. У каждой науки своя методология исследования. В данной работе рассматриваются математический инструментарий кластерного анализа, факторного анализа и эконометрического моделирования. Теоретические положения указанных методов детально описаны в научных монографиях и учебниках [23–26].
Основная часть
Многомерный подход как инструмент анализа способствует решению разного типа задач: от структуризации до визуализации многомерных данных. Классификация без обучения в настоящее время становится широко применяемым инструментом анализа многомерных данных, неструктурированных больших данных, потоковых данных. В частности, реализация классификации объектов на основе признаков позволяет сформировать структуру в заданной совокупности объектов. Начальным этапом кластерного анализа является выбор метрики или меры расстояния и весов для изучаемых объектов. От данного выбора зависит состав и количество образующихся кластеров, а также степень сходства анализируемых объектов внутри кластеров. Для обработки больших объемов статистических данных метод k-средних является оптимальным. Формирование большого набора количественных показателей является достаточно трудоемким процессом, так как требуется изучить и провести первичную обработку многочисленных массивов данных. Для решения этой проблемы используются различные программные среды, одной из таких программ является программа SPSS Statistics (Statistical Package for the Social Sciences). Многомерные статистические методы способствуют анализу всей совокупности данных, результаты которого обеспечивают грамотно и научно обоснованно принимать решения о развитии сферы образования. Федеральной службой государственной статистики ежегодно фиксируются изменения по социально-экономическим показателям как по Российской Федерации в целом, так и по всем субъектам.
В работе исследуются субъекты Приволжского федерального округа по 14 показателям. Данные собраны из разделов, которые представляют показатели, характеризующие сферу образования, инвестиции и науки, а также сферу трудовых ресурсов и населения. Выбранные статистические данные по трем периодам 2012, 2015, 2018 годов представлены в таблицах 1–3.
Таблица 1 – Исходные данные за 2012 год
Table 1 – Initial data for 2012
№ | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
РФ | 143347 | 75676 | 5,5 | 100,4 | 2981 | 486,3 | 119662 | 152 | 1046 | 1397,2 | 342030 | 216 | 10,3 | 213184 |
ПФО | 29772 | 15715 | 5,3 | 100,2 | 735 | 117,2 | 27817 | 140 | 152 | 280,1 | 63227 | 200 | 11,9 | 37486 |
1 | 4061 | 2042 | 6,1 | 103,1 | 80 | 19,1 | 3999 | 121 | 13 | 33,9 | 7439 | 207 | 13,1 | 4343,5 |
2 | 690 | 366 | 6,5 | 99,1 | 24 | 2,4 | 732 | 158 | 3 | 5,9 | 1397 | 187 | 10,6 | 1192,3 |
… | ||||||||||||||
13 | 2503 | 1282 | 5,4 | 99,2 | 42 | 9,9 | 2390 | 113 | 8 | 23,2 | 6061 | 218 | 7 | 2351,2 |
14 | 1274 | 680 | 5,6 | 100,6 | 34 | 5,3 | 1176 | 124 | 5 | 10,9 | 2625 | 137 | 6,3 | 2013 |
Все показатели в исследовании перегруппированы, а именно выделяются показатели масштаба развития образования, эффективности развития образования, показатели развития цифровизации сферы образования, экономического стимулирования, а также показатели социальной сферы. В таблице 4 представлена группировка изучаемых показателей.
По результатам первичного статистического анализа установлено, что наблюдается постоянный темп роста следующих показателей: количества профессиональных образовательных учреждений, числа выпускников профессиональных образовательных организаций. При расчетах цепного темпа роста зафиксировано увеличение от 10 до 20 %, при расчете базисного темпа – в среднем на 5 %, при расчете темпов роста, так же как и при анализе средних значений, медиан и квантилей отмечается рост инвестиций в образование и, как следствие, увеличение числа персональных компьютеров в образовательных организациях. Однако, несмотря на постоянное увеличение инвестиций, прослеживается уменьшение числа ПК в 2015 году, но в 2018 году данный показатель имеет самый высокий прирост.
Таблица 2 – Исходные данные за 2015 год
Table 2 – Initial data for 2015
№ | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
РФ | 146545 | 76588 | 5,6 | 99,13 | 2891 | 446 | 126024 | 148 | 896 | 1300,5 | 279758 | 164 | 9,3 | 239790 |
ПФО | 29674 | 15502 | 4,8 | 98,4 | 677 | 105,8 | 28101 | 143 | 131 | 255,2 | 51447 | 151 | 10,6 | 41388 |
1 | 4071 | 2017 | 6,1 | 96,7 | 70 | 14,7 | 3769 | 125 | 11 | 34,7 | 6001 | 155 | 9,1 | 4008,2 |
2 | 686 | 359 | 5,3 | 99,3 | 24 | 2,2 | 670 | 164 | 3 | 4,4 | 1004 | 183 | 8,3 | 630,7 |
| … |
|
|
|
|
|
|
|
|
|
|
|
|
|
13 | 2488 | 1257 | 4,7 | 97,4 | 30 | 9,1 | 2289 | 114 | 7 | 23,5 | 5019 | 149 | 6,3 | 1764,2 |
14 | 1258 | 650 | 4,9 | 98,4 | 33 | 3,9 | 1148 | 138 | 5 | 11 | 2061 | 124 | 5,2 | 2293,9 |
Таблица 3 – Исходные данные за 2018 год
Table 3 – Initial data for 2018
№ | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
РФ | 146781 | 76190 | 4,8 | 99,6 | 3311 | 531,5 | 104474 | 160 | 741 | 933,2 | 234142 | 259 | 3,4 | 267857 |
ПФО | 29397 | 15070 | 4,4 | 98,8 | 747 | 122,8 | 22624 | 155 | 116 | 183,5 | 42406 | 256 | 9,1 | 48299 |
1 | 4051 | 1955 | 4,9 | 97,4 | 97 | 17,8 | 3089 | 121 | 10 | 23,9 | 5050 | 329 | 8,5 | 5842,4 |
2 | 681 | 331 | 5 | 96,5 | 24 | 2,3 | 514 | 124 | 3 | 3,6 | 932 | 269 | 7,4 | 602 |
| … |
|
|
|
|
|
|
|
|
|
|
|
|
|
13 | 2441 | 1197 | 5 | 97,2 | 53 | 10,2 | 1963 | 108 | 7 | 17,4 | 4095 | 266 | 4,3 | 3942,7 |
14 | 1238 | 626 | 3,7 | 98,3 | 39 | 4,3 | 950 | 148 | 5 | 7,2 | 1659 | 222 | 5 | 3606,6 |
Таблица 4 – Группировка показателей сферы образования, труда, инвестиций и науки
Table 4 – Grouping indicators of the sphere of education, labor, investment and science
Группа | Обозначение | Наименование показателя |
Показатели масштаба развития образования | X5 | X5 – Количество профессиональных образовательных организаций, которое складывается из частных и государственных |
X7 | X7 – Число преподавателей профессиональных образовательных организаций (тыс. чел.) | |
X9 | X9 – Количество высших учебных заведений | |
X11 | X11 – Число преподавателей высших учебных заведений (тыс. чел.) | |
Показатели эффективности развития образования | X6 | Число выпускников профессиональных образовательных организаций (тыс. чел.) |
X10 | X10 – Число выпускников высших учебных заведений, которое складывается из бакалавров и магистров (тыс. чел.) | |
Показатели социальной сферы | X1 | X1– Численность населения (тыс. чел.) |
X2 | X2 – Численность рабочей силы (тыс. чел.) | |
X3 | X3 – Уровень безработицы (%) | |
X4 | X4 – Изменение среднегодовой численности занятых (%) | |
Показатели цифровизации сферы образования | X8 | X8 – Количество персональных компьютеров, используемых в учебных целях, в профессиональных образовательных организациях на 1000 обучающихся (студентов) |
X12 | Количество персональных компьютеров, используемых в учебных целях, в высших образовательных организациях на 1000 обучающихся (студентов) | |
Показатели экономического стимулирования | X13 | X13 – Инновационная активность организаций (%), обозначающая удельный вес организаций, осуществлявших технологические, организационные, маркетинговые инновации, в общем числе обследованных организации |
X14 | X14 – Инвестиции в сферу образования (млн руб.) |
По результатам статистического анализа установлено, что ПФО по показателям числа профессиональных образовательных организаций, числа выпускников данных учебных заведений, числа преподавателей в них, числа высших учебных заведений, числа выпускников и преподавателей в них имеет долю в структуре РФ от 15 до 26 %. Данные показатели имеют стабильную долю в структуре РФ за годы с 2012 по 2018. По итогам статистического анализа заметна тенденция увеличения количества профессиональных образовательных организаций и инвестиций в сферу образования на один миллиард рублей, несмотря на уменьшение численности населения и численности рабочей силы. В связи с этим определяется важность сферы образования для других сфер жизни и развития государства в целом.
Классификация без обучения субъектов ПФО
Методом k-средних проводилось разбиение субъектов Приволжского федерального округа на 2 и 3 кластера с использование SPSS.
В таблице 5 представлены координаты центра тяжести кластеров с учетом группировки показателей.
Таблица 5 – Сводка конечных центров кластеров
Table 5 – Summary of end centers of clusters
Группа показателей | Обо-зна-чение | 2012 | 2015 | 2018 | |||
1 | 2 | 1 | 2 | 1 | 2 | ||
Показатели масштаба развития образования | X5 | 100 | 24 | 105 | 24 | 91 | 24 |
X7 | 3529 | 732 | 4044 | 670 | 2946 | 514 | |
X9 | 28 | 3 | 25 | 3 | 23 | 3 | |
X11 | 10060 | 1397 | 8711 | 1004 | 7368 | 932 | |
Показатели эффективности развития образования | X6 | 13 | 2 | 16 | 2 | 17 | 2 |
X10 | 43 | 5 | 43 | 4 | 33 | 3 | |
Показатели социальной | X1 | 3822 | 690 | 3869 | 686 | 3899 | 681 |
X2 | 2051 | 366 | 2062 | 359 | 2037 | 331 | |
X3 | 4 | 6 | 4 | 5 | 3 | 5 | |
X4 | 100 | 99 | 100 | 99 | 100 | 96 | |
Показатели цифровизации сферы образования | X8 | 150 | 158 | 192 | 164 | 260 | 124 |
X12 | 193 | 187 | 161 | 183 | 255 | 269 | |
Показатели экономического стимулирования | X13 | 19 | 10 | 20 | 8 | 12 | 7 |
X14 | 8219 | 1192 | 14555 | 630 | 10618 | 602 |
Центры кластеров располагаются на значительном расстоянии, это позволяет выявить числовую границу показателей для субъектов ПФО.
В таблице 6 представлено разбиение структурных единиц ПФО на 2 кластера по данным периодам. Расшифровка номера субъекта ПФО и его название представлены в таблице 7.
Таблица 6 – Принадлежность данных к кластерам по 2 кластерам
Table 6 – Data belonging to clusters for 2 clusters
№ субъекта | 2012 | 2015 | 2018 | |||
Кластер | Расстояние | Кластер | Расстояние | Кластер | Расстояние | |
1 | 1 | 4708,818 | 2 | 4488,203 | 1 | 969,574 |
2 | 2 | 0 | 2 | 3287,567 | 2 | 2294,085 |
3 | 2 | 1275,914 | 2 | 2131,357 | 2 | 1283,349 |
4 | 1 | 0 | 1 | 0 | 1 | 4630,863 |
5 | 2 | 2466,630 | 2 | 1169,130 | 2 | 147,419 |
6 | 2 | 1441,032 | 2 | 2158,387 | 2 | 759,493 |
7 | 2 | 4508,169 | 2 | 1333,195 | 2 | 2352,350 |
8 | 2 | 1085,374 | 2 | 2195,954 | 2 | 818,612 |
9 | 1 | 5731,901 | 2 | 4211,555 | 1 | 1931,341 |
10 | 2 | 3005,476 | 2 | 916,440 | 2 | 1292,339 |
11 | 2 | 1641,188 | 2 | 2079,987 | 2 | 581,541 |
12 | 1 | 5705,100 | 2 | 3595,634 | 1 | 2187,787 |
13 | 2 | 5474,932 | 2 | 1893,186 | 2 | 2975,843 |
14 | 2 | 1680,067 | 2 | 1651,348 | 2 | 1407,688 |
Таблица 7 – Наименования субъектов ПФО и их номер
Table 7 – Names of subjects of the Volga Federal District and their number
№ | Наименование | № | Наименование |
1 | Республика Башкортостан | 8 | Кировская область |
2 | Республика Марий Эл | 9 | Нижегородская область |
3 | Республика Мордовия | 10 | Оренбургская область |
4 | Республика Татарстан | 11 | Пензенская область |
5 | Удмуртская Республика | 12 | Самарская область |
6 | Чувашская Республика | 13 | Саратовская область |
7 | Пермский край | 14 | Ульяновская область |
По данным таблицы 6, следует вывод, что степень сгущенности субъектов достаточно высокая. Это свидетельствует о стабильном расположении субъектов в кластере, однако три региона Приволжского федерального округа, а именно Республика Башкортостан, Нижегородская и Самарская области, характеризуются динамичностью, т. е. меняют свое положение относительно центров кластера в каждом анализируемом году.
Состав первого кластера существенно меняется в 2015 году. В этот период времени в ведущий кластер входит только один субъект – Республика Татарстан. В 2012 и 2018 годах состав кластера не отличается и включает в себя 4 региона: Республика Татарстан, Нижегородская область, Самарская область и Республика Башкортостан. Эти субъекты характеризуются наиболее высокой численностью населения, развитым уровнем образования и большими инвестициями в данную сферу и высоким показателем цифровизации сферы образования. Ко второму кластеру относятся регионы с менее развитой сферой образования и меньшим объемом инвестиций в образование внутри этих субъектов. Состав первого: Республика Башкортостан, Республика Татарстан, Нижегородская область и Самарская область. Остальные субъекты формируют второй кластер.
Для каждого кластера были рассчитаны среднее значение, медиана, дисперсии, а также квантили уровня 0,25 и 0,75 для 2012 и 2018 годов. Таблица 8 представляет исходные данные субъектов первого кластера и итоговые значения анализа.
Таблица 8 – Исходные данные и статистические показатели для первого кластера
Table 8 – Initial data and statistical indicators for the first cluster
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
2012 | 1 | 4061 | 2042 | 6,1 | 103,1 | 80 | 19,1 | 3999 | 121 | 13 | 33,9 | 7439 | 207 | 13,1 | 4343,5 |
4 | 3822 | 2051 | 4,1 | 100,1 | 100 | 13,8 | 3529 | 150 | 28 | 43,9 | 10060 | 193 | 19,1 | 8219,7 | |
9 | 3290 | 1817 | 5,4 | 100,7 | 83 | 11,7 | 2688 | 149 | 15 | 36,4 | 7763 | 184 | 14,7 | 3068,2 | |
12 | 3213 | 1748 | 3,4 | 100,3 | 82 | 11,2 | 2658 | 127 | 28 | 33,2 | 7575 | 209 | 6,3 | 3204,3 | |
Ср. зн. | 3596,5 | 1914,5 | 4,8 | 101,1 | 86,3 | 13,9 | 3218,5 | 136,8 | 21 | 36,9 | 8209,3 | 198,3 | 13,3 | 4708,92 | |
Ме | 3556 | 1929,5 | 4,8 | 100,5 | 82,5 | 12,8 | 3108,5 | 138 | 21,5 | 35,2 | 7669 | 200 | 13,9 | 3773,9 | |
D | 169208 | 24039 | 1,5 | 1,93 | 85,6 | 13,1 | 433727 | 222,9 | 66 | 24 | 1539991 | 140,9 | 28,2 | 5804984 | |
0,25 кван | 3270,8 | 1799,8 | 3,9 | 100,3 | 81,5 | 11,6 | 2680,5 | 125,5 | 14,5 | 33,7 | 7541 | 190,8 | 11,4 | 3170,27 | |
0,75 кван | 3881,8 | 2044,3 | 5,6 | 101,3 | 87,3 | 15,1 | 3646,5 | 149,3 | 28 | 38,3 | 8337,3 | 207,5 | 15,8 | 5312,55 | |
2018 | 1 | 4051 | 1955 | 4,9 | 97,4 | 97 | 17,8 | 3089 | 121 | 10 | 23,9 | 5050 | 329 | 8,5 | 5842,4 |
4 | 3899 | 2037 | 3,3 | 100 | 91 | 17,5 | 2946 | 260 | 23 | 33,9 | 7368 | 255 | 12,5 | 10618,8 | |
9 | 3215 | 1760 | 4,2 | 98,5 | 77 | 12,6 | 2456 | 157 | 11 | 19,2 | 4753 | 222 | 9,5 | 4693,6 | |
12 | 3183 | 1714 | 3,7 | 99,8 | 70 | 13,3 | 2453 | 152 | 19 | 21,9 | 5317 | 243 | 20,7 | 4246,6 | |
Ср. зн. | 3587 | 1866,5 | 4,1 | 98,9 | 83,8 | 15,3 | 2736 | 172,5 | 15,8 | 24,7 | 5622 | 262 | 12,8 | 6350,35 | |
Ме | 3557 | 1857,5 | 3,9 | 99,2 | 84 | 15,4 | 2701 | 154,5 | 15 | 22,9 | 5183,5 | 249 | 11 | 5268 | |
D | 2047467 | 23834 | 0,5 | 1,48 | 154,3 | 7,5 | 109066 | 3656,3 | 39,6 | 41,1 | 1407962 | 2166 | 30,63 | 8549421 | |
0,25 кван | 3207 | 1748,5 | 3,6 | 98,2 | 75,3 | 13,1 | 2455,3 | 144,3 | 10,8 | 21,23 | 4975,8 | 237,8 | 9,25 | 4581,85 | |
0,75 кван | 3937 | 1975,5 | 4,4 | 99,9 | 92,5 | 17,6 | 2981,8 | 182,8 | 20 | 26,4 | 5829,8 | 273,5 | 14,55 | 7036,5 |
Аналогичные показатели представлены в таблице 9 для второго кластера.
Таблица 9 – Статистические показатели внутри второго кластера
Table 9 – Statistical indicators within the second cluster
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
2012 | 2 | 690 | 366 | 6,5 | 99,1 | 24 | 2,4 | 732 | 158 | 3 | 5,9 | 1397 | 187 | 10,6 | 1192,3 |
3 | 819 | 457 | 4,9 | 97,6 | 29 | 3 | 836 | 180 | 3 | 8,5 | 2170 | 175 | 13,1 | 2189,7 | |
5 | 1518 | 830 | 6 | 99,6 | 41 | 6,6 | 1356 | 161 | 8 | 15 | 2687 | 197 | 13 | 2961,5 | |
6 | 1244 | 655 | 5,9 | 99,3 | 27 | 4,2 | 1072 | 166 | 5 | 13,1 | 2608 | 160 | 20,9 | 1513,3 | |
7 | 2634 | 1358 | 6,3 | 98,1 | 70 | 10,7 | 2477 | 158 | 16 | 19,1 | 4703 | 262 | 14,1 | 2448,8 | |
8 | 1319 | 688 | 7,1 | 98,4 | 54 | 5,5 | 1167 | 173 | 7 | 11,4 | 2060 | 237 | 8,7 | 1407,8 | |
10 | 2016 | 1040 | 4,4 | 102,5 | 41 | 9,2 | 2075 | 120 | 8 | 15,2 | 3592 | 209 | 12,7 | 1635,8 | |
11 | 1369 | 703 | 4,9 | 99,8 | 28 | 4,6 | 1662 | 136 | 5 | 10,3 | 2487 | 169 | 11,4 | 937,1 | |
13 | 2503 | 1282 | 5,4 | 99,2 | 42 | 9,9 | 2390 | 113 | 8 | 23,2 | 6061 | 218 | 7 | 2351,2 | |
14 | 1274 | 680 | 5,6 | 100,6 | 34 | 5,3 | 1176 | 124 | 5 | 10,9 | 2625 | 137 | 6,3 | 2013 | |
Ср. зн. | 1538,6 | 805,9 | 5,7 | 99,42 | 39 | 6,14 | 1494,3 | 149 | 7 | 13,26 | 3039 | 195,1 | 11,78 | 1865,05 | |
Ме | 1344 | 695,5 | 5,75 | 99,25 | 37,5 | 5,4 | 1266 | 158 | 6 | 12,25 | 2616,5 | 192 | 12,05 | 1824,4 | |
D | 425560 | 107246 | 0,68 | 1,92 | 202,00 | 8,40 | 394853 | 562 | 14 | 26,04 | 1933635 | 1412 | 17,39 | 400627 | |
0,25 кван | 1251,5 | 661,25 | 5,03 | 98,575 | 28,25 | 4,3 | 1095,75 | 127 | 5 | 10,45 | 2249,25 | 170,5 | 9,175 | 1434,18 | |
0,75 кван | 1891,5 | 987,5 | 6,23 | 99,75 | 41,75 | 8,55 | 1971,75 | 164 | 8 | 15,15 | 3365,75 | 215,8 | 13,08 | 2310,83 | |
2015 | 1 | 4071 | 2017 | 6,1 | 96,7 | 70 | 14,7 | 3769 | 125 | 11 | 34,7 | 6001 | 155 | 9,1 | 4008,2 |
2 | 686 | 359 | 5,3 | 99,3 | 24 | 2,2 | 670 | 164 | 3 | 4,4 | 1004 | 183 | 8,3 | 630,7 | |
3 | 807 | 446 | 4,2 | 97,8 | 29 | 3 | 978 | 170 | 3 | 7,3 | 1929 | 182 | 16,6 | 1616,5 | |
5 | 1517 | 821 | 5 | 99,5 | 45 | 4,8 | 1345 | 113 | 7 | 12,1 | 2382 | 139 | 10,2 | 1901,3 | |
6 | 1237 | 671 | 5 | 99,6 | 23 | 4,2 | 1126 | 143 | 5 | 10,8 | 1860 | 117 | 24 | 879,6 | |
7 | 2634 | 1305 | 6,3 | 98,8 | 70 | 8,6 | 2624 | 139 | 12 | 17,1 | 3951 | 180 | 10,5 | 2556,1 | |
8 | 1297 | 679 | 5,3 | 99 | 48 | 4,3 | 1123 | 148 | 6 | 8,8 | 1553 | 130 | 9,8 | 1236,1 | |
9 | 3260 | 1764 | 4,3 | 96,5 | 72 | 11,1 | 2968 | 158 | 13 | 27,4 | 5870 | 136 | 13,5 | 4831 | |
10 | 1995 | 1012 | 4,8 | 96,9 | 44 | 8,5 | 2124 | 124 | 5 | 14,7 | 2698 | 158 | 10,8 | 1418,6 | |
11 | 1349 | 702 | 4,7 | 99,8 | 16 | 4,1 | 1203 | 128 | 4 | 11 | 2070 | 126 | 14,7 | 682,9 | |
12 | 3206 | 1758 | 3,4 | 99,9 | 68 | 11,1 | 2690 | 135 | 25 | 28,6 | 6338 | 159 | 5 | 3013,1 | |
13 | 2488 | 1257 | 4,7 | 97,4 | 30 | 9,1 | 2289 | 114 | 7 | 23,5 | 5019 | 149 | 6,3 | 1764,2 | |
14 | 1258 | 650 | 4,9 | 98,4 | 33 | 3,9 | 1148 | 138 | 5 | 11 | 2061 | 124 | 5,2 | 2293,9 | |
Ср. зн. | 1985,00 | 1033,9 | 4,92 | 98,43 | 44,00 | 6,89 | 1850,54 | 138 | 8 | 16,26 | 3287,38 | 149,1 | 11,08 | 2064,02 | |
Ме | 1517 | 821 | 4,9 | 98,8 | 44 | 4,8 | 1345 | 138 | 6 | 12,1 | 2382 | 149 | 10,2 | 1764,2 | |
D | 1116846 | 292435 | 0,6 | 1,5 | 408,0 | 14,9 | 906406 | 324 | 36 | 87,6 | 3586371 | 519,2 | 27,1 | 1617930 | |
0,25 кван | 1258 | 671 | 4,7 | 97,4 | 29 | 4,1 | 1126 | 125 | 5 | 10,8 | 1929 | 130 | 8,3 | 1236,1 | |
0,75 кван | 2634 | 1305 | 5,3 | 99,5 | 68 | 9,1 | 2624 | 148 | 11 | 23,5 | 5019 | 159 | 13,5 | 2556,1 | |
2018 | 2 | 681 | 331 | 5 | 96,5 | 24 | 2,3 | 514 | 124 | 3 | 3,6 | 932 | 269 | 7,4 | 602 |
3 | 795 | 421 | 4,2 | 98,1 | 28 | 3,3 | 715 | 197 | 3 | 6,2 | 1502 | 260 | 7,1 | 1528,9 |
Продолжение таблицы 9
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
2018 | 5 | 1507 | 782 | 4,8 | 98,6 | 49 | 6,1 | 1032 | 121 | 7 | 9,9 | 1982 | 246 | 22,2 | 2332,4 |
6 | 1223 | 619 | 5 | 97,9 | 26 | 4,8 | 915 | 167 | 4 | 8,1 | 1416 | 195 | 6,7 | 2009 | |
7 | 2611 | 1265 | 5,4 | 99,2 | 73 | 11,7 | 2161 | 159 | 10 | 11,6 | 3254 | 290 | 24,7 | 3503 | |
8 | 1272 | 667 | 5,1 | 99,8 | 50 | 4,9 | 873 | 180 | 4 | 6,2 | 1276 | 260 | 6,4 | 2210,9 | |
10 | 1963 | 1011 | 4,4 | 99,3 | 45 | 9,3 | 1667 | 125 | 5 | 7,4 | 2114 | 256 | 11,1 | 1225,2 | |
2019 | 11 | 1318 | 685 | 4,4 | 99,7 | 25 | 4,6 | 890 | 134 | 5 | 7 | 1688 | 187 | 6,4 | 1937 |
13 | 2441 | 1197 | 5 | 97,2 | 53 | 10,2 | 1963 | 108 | 7 | 17,4 | 4095 | 266 | 4,3 | 3942,7 | |
14 | 1238 | 626 | 3,7 | 98,3 | 39 | 4,3 | 950 | 148 | 5 | 7,2 | 1659 | 222 | 5 | 3606,6 | |
Ср. зн. | 1504,9 | 760,4 | 4,7 | 98,46 | 41,2 | 6,15 | 1168 | 146 | 5 | 8,46 | 1991,8 | 245,1 | 10,13 | 2289,77 | |
Ме | 1295 | 676 | 4,9 | 98,45 | 42 | 4,85 | 932,5 | 141 | 5 | 7,3 | 1673,5 | 258 | 6,9 | 2109,95 | |
D | 414694 | 95616 | 0,26 | 1,17 | 252,40 | 9,92 | 310482 | 834 | 4 | 14,52 | 937963 | 1111 | 52,83 | 1190029 | |
0,25 кван | 1226,75 | 620,75 | 4,4 | 97,95 | 26,5 | 4,375 | 877,25 | 124 | 4 | 6,4 | 1437,5 | 228 | 6,4 | 1630,925 | |
0,75 кван | 1849 | 953,75 | 5 | 99,275 | 49,75 | 8,5 | 1508,25 | 165 | 7 | 9,45 | 2081 | 264,5 | 10,18 | 3210,35 |
Сравнение результатов статистического анализа для первого и второго кластеров показывает существенные различия в значениях. Показатели, характеризующие первый кластер, практически в два раза превышают соответствующие значения второго кластера. Также, анализируя составы кластеров, видно, что первая группа включается в себя наиболее развитые субъекты Приволжского федерального округа. Так, например, показатели, которые благоприятно сказываются на развитии образования в стране, примерно в 1,5 раза превосходят средние значения внутри ПФО в целом.
При сравнении значений, характеризующих второй кластер, и соответствующих значений Приволжского федерального округа в целом следует отметить, уровень безработицы достаточно высок и превышает среднее значение совокупности всех изучаемых субъектов. Значения показателей, описывающих число учебных заведений, число студентов и количество преподавателей, не превышают соответствующие средние значения по всему ПФО. При анализе средних показателей по образовавшимся кластерам зафиксировано превосходство первого кластера более чем в 2 раза. Инновационная активность как основной фактор готовности к обновлению основных элементов уступает первому кластеру и среднему значению Приволжского федерального округа. В 2012 году данный показатель в ведущем кластере на 1,5 % больше, в 2015 году ведущий регион показывает свое первенство по отношению ко всему второму кластеру, и даже в 2018 году показатель остается на низком уровне, разрыв составляет более 2 %.
В 2012 году инвестиции в сферу образования во втором кластере в среднем практически на 3000 млн рублей меньше, чем в кластере ведущих регионов, в котором данный показатель в 2,5 раза превышает аналогичный. К 2018 году ситуация остается стабильной и разрыв между кластерами находится на прежнем уровне, а следовательно, основной поток инвестиций направлен в регионы первого класса.
Следующий этап исследования – кластеризация субъектов Приволжского федерального округа на 3 группы. Аналогично, для определения принадлежности к какому-либо кластеру анализируется таблица конечных центров кластеров. Данные структурированы по всем анализируемым годам и представлены в таблице 10.
При данной кластеризации субъектов на группы также наблюдается изменение конечных центров в каждом из периодов. Это обуславливает перемещение некоторых субъектов между кластерами.
Разброс субъектов Приволжского федерального округа на 3 кластера по изучаемым периодам представлен в таблице 11.
По результатам анализа, которые представлены в таблице 11, при разбиении субъектов на кластеры замечена тенденция стабильности для всех структурных единиц ПФО, с течением времени субъекты не обладают тенденцией перехода из кластера в кластер. Каждый субъект сохраняет свое место в первоначальной группе. При кластеризации Республика Татарстан образовала отдельный самостоятельный кластер. Этот субъект имеет наивысшие значения по показателям: численности рабочей силы; числу учебных заведений; числу персональных компьютеров, используемых в учебных целях; числу выпускников и преподавателей высших учебных заведений, а также по уровню инвестиций в сферу образования для данного субъекта.
Таблица 10 – Конечные центры кластеров за все периоды
Table 10 – End centers of clusters for all periods
Обо-зна-чение | 2012 | 2015 | 2018 | ||||||
1 | 2 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | |
X1 | 3290 | 690 | 3822 | 4071 | 686 | 3869 | 3183 | 681 | 3899 |
X2 | 1817 | 366 | 2051 | 2017 | 359 | 2062 | 1714 | 331 | 2037 |
X4 | 100 | 99 | 100 | 96 | 99 | 100 | 99 | 96 | 100 |
X5 | 83 | 24 | 100 | 70 | 24 | 105 | 70 | 24 | 91 |
X6 | 11 | 2 | 13 | 14 | 2 | 16 | 13 | 2 | 17 |
X7 | 2688 | 732 | 3529 | 3769 | 670 | 4044 | 2453 | 514 | 2946 |
X8 | 149 | 158 | 150 | 125 | 164 | 192 | 152 | 124 | 260 |
X9 | 15 | 3 | 28 | 11 | 3 | 25 | 19 | 3 | 23 |
X10 | 36 | 5 | 43 | 34 | 4 | 43 | 21 | 3 | 33 |
X11 | 7763 | 1397 | 10060 | 6001 | 1004 | 8711 | 5317 | 932 | 7368 |
X12 | 184 | 187 | 193 | 155 | 183 | 161 | 243 | 269 | 255 |
X13 | 14 | 10 | 19 | 9 | 8 | 20 | 20 | 7 | 12 |
X14 | 3068 | 1192 | 8219 | 4008 | 630 | 14555 | 4246 | 602 | 10618 |
Таблица 11 – Принадлежность субъектов к кластерам
Table 11 – Belonging of subjects to clusters
№ субъекта | 2012 | 2015 | 2018 | |||
Кластер | Расстояние | Кластер | Расстояние | Кластер | Расстояние | |
1 | 1 | 2023,807797 | 1 | 1664,179762 | 1 | 1937,142142 |
2 | 2 | 0 | 2 | 1452,694807 | 2 | 1668,159563 |
3 | 2 | 1275,91379 | 2 | 633,2759692 | 2 | 691,8629403 |
4 | 3 | 0 | 3 | 0 | 3 | 0 |
5 | 2 | 2466,630293 | 2 | 786,5244453 | 2 | 651,2054807 |
6 | 2 | 1441,032269 | 2 | 471,2976269 | 2 | 185,5743197 |
7 | 1 | 3231,124882 | 1 | 1752,801609 | 1 | 1683,032822 |
8 | 2 | 1085,373668 | 2 | 415,2504703 | 2 | 415,6309398 |
9 | 1 | 0 | 1 | 1669,088518 | 1 | 422,443227 |
10 | 2 | 3005,475503 | 2 | 1431,583897 | 2 | 1400,329364 |
11 | 2 | 1641,18768 | 2 | 668,3677529 | 2 | 161,1748371 |
12 | 1 | 258,4298744 | 1 | 958,8336039 | 1 | 862,8298094 |
13 | 1 | 2099,927618 | 1 | 1794,149236 | 1 | 1098,43201 |
14 | 2 | 1680,066963 | 2 | 970,9025199 | 2 | 1677,386234 |
Анализ составов всех трех кластеров помогает глубже оценить степень развитости каждого кластера. Первый кластер образуют субъекты с достаточно высокими значениями показателей. Это регионы с относительно большой численностью населения, рабочей силы, а также с весомым числом учебных заведений, высокими уровнем их цифровизации, а именно с хорошим оснащением персональными компьютерами, которые используются в учебных целях, высоким уровнем инновационной активности организаций и с большой долей инвестиций в сферу образования. Второй кластер включает в себя субъекты с высоким уровнем безработицы и маленьким объемом инвестиций в сферу образования в этих регионах. В связи с невысоким уровнем инвестирования субъектам присуща низкая цифровизация процесса обучения. Первый кластер – Республика Татарстан. второй – Республика Башкортостан, Пермский край, Нижегородская область, Самарская область, Саратовская область. Третий кластер – Республика Марий Эл, Республика Мордовия, Удмуртская Республика, Чувашская Республика, Кировская область, Пензенская область, Оренбургская область, Ульяновская область. В таблице 12 представлены статистические характеристики субъектов ПФО при кластеризации методом k-средних на 3 кластера.
Таблица 12 – Статистические показатели при кластеризации на 3 для второй группы
Table 12 – Statistical indicators for clustering by 3 for the second group
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
2012 | 1 | 4061 | 2042 | 6,1 | 103,1 | 80 | 19,1 | 3999 | 121 | 13 | 33,9 | 7439 | 207 | 13,1 | 4343,5 |
7 | 2634 | 1358 | 6,3 | 98,1 | 70 | 10,7 | 2477 | 158 | 16 | 19,1 | 4703 | 262 | 14,1 | 2448,8 | |
9 | 3290 | 1817 | 5,4 | 100,7 | 83 | 11,7 | 2688 | 149 | 15 | 36,4 | 7763 | 184 | 14,7 | 3068,2 | |
12 | 3213 | 1748 | 3,4 | 100,3 | 82 | 11,2 | 2658 | 127 | 28 | 33,2 | 7575 | 209 | 6,3 | 3204,3 | |
13 | 2503 | 1282 | 5,4 | 99,2 | 42 | 9,9 | 2390 | 113 | 8 | 23,2 | 6061 | 218 | 7 | 2351,2 | |
Ср. зн. | 3140,2 | 1649,4 | 5,32 | 100,3 | 71,4 | 12,5 | 2842,4 | 133 | 16 | 29,16 | 6708,2 | 216 | 11,04 | 3083,2 | |
Ме | 3213 | 1748 | 5,4 | 100,3 | 80 | 11,2 | 2658 | 127 | 15 | 33,2 | 7439 | 209 | 13,1 | 3068,2 | |
D | 384468 | 102960 | 1,32 | 3,51 | 297 | 14 | 433437 | 364 | 54 | 56,98 | 1709427 | 818,5 | 16,45 | 635383,4 | |
0,25 кван | 2634 | 1358 | 5,4 | 99,2 | 70 | 10,7 | 2477 | 121 | 13 | 23,2 | 6061 | 207 | 7 | 2448,8 | |
0,75 кван | 3290 | 1817 | 6,1 | 100,7 | 82 | 11,7 | 2688 | 149 | 16 | 33,9 | 7575 | 218 | 14,1 | 3204,3 | |
2015 | 1 | 4071 | 2017 | 6,1 | 96,7 | 70 | 14,7 | 3769 | 125 | 11 | 34,7 | 6001 | 155 | 9,1 | 4008,2 |
7 | 2634 | 1305 | 6,3 | 98,8 | 70 | 8,6 | 2624 | 139 | 12 | 17,1 | 3951 | 180 | 10,5 | 2556,1 | |
9 | 3260 | 1764 | 4,3 | 96,5 | 72 | 11,1 | 2968 | 158 | 13 | 27,4 | 5870 | 136 | 13,5 | 4831 | |
12 | 3206 | 1758 | 3,4 | 99,9 | 68 | 11,1 | 2690 | 135 | 25 | 28,6 | 6338 | 159 | 5 | 3013,1 | |
13 | 2488 | 1257 | 4,7 | 97,4 | 30 | 9,1 | 2289 | 114 | 7 | 23,5 | 5019 | 149 | 6,3 | 1764,2 | |
Ср. зн. | 3131,80 | 1620,2 | 4,96 | 97,86 | 62 | 10,9 | 2868 | 134 | 13 | 26,26 | 5435,80 | 155,8 | 8,88 | 3234,52 | |
Ме | 3206 | 1758 | 4,7 | 97,4 | 70 | 11,1 | 2690 | 135 | 12 | 27,4 | 5870 | 155 | 9,1 | 3013,1 | |
D | 391580 | 107095 | 1,5 | 2,1 | 322 | 5,8 | 312065 | 270 | 45 | 42,4 | 925074 | 258,7 | 11,4 | 1454612 | |
0,25 кван | 2634 | 1305 | 4,3 | 96,7 | 68 | 9,1 | 2624 | 125 | 11 | 23,5 | 5019 | 149 | 6,3 | 2556,1 | |
0,75 кван | 3260 | 1764 | 6,1 | 98,8 | 70 | 11,1 | 2968 | 139 | 13 | 28,6 | 6001 | 159 | 10,5 | 4008,2 | |
2018 | 1 | 4051 | 1955 | 4,9 | 97,4 | 97 | 17,8 | 3089 | 121 | 10 | 23,9 | 5050 | 329 | 8,5 | 5842,4 |
7 | 2611 | 1265 | 5,4 | 99,2 | 73 | 11,7 | 2161 | 159 | 10 | 11,6 | 3254 | 290 | 24,7 | 3503 | |
9 | 3215 | 1760 | 4,2 | 98,5 | 77 | 12,6 | 2456 | 157 | 11 | 19,2 | 4753 | 222 | 9,5 | 4693,6 | |
12 | 3183 | 1714 | 3,7 | 99,8 | 70 | 13,3 | 2453 | 152 | 19 | 21,9 | 5317 | 243 | 20,7 | 4246,6 | |
13 | 2441 | 1197 | 5 | 97,2 | 53 | 10,2 | 1963 | 108 | 7 | 17,4 | 4095 | 266 | 4,3 | 3942,7 | |
Ср. зн. | 3100,2 | 1578,2 | 4,64 | 98,42 | 74 | 13,1 | 2424,4 | 139 | 11 | 18,8 | 4493,8 | 270 | 13,54 | 4445,66 | |
Ме | 3183 | 1714 | 4,9 | 98,5 | 73 | 12,6 | 2453 | 152 | 10 | 19,2 | 4753 | 266 | 9,5 | 4246,6 | |
D | 399479 | 109219 | 0,46 | 1,26 | 249 | 8,19 | 181444 | 544 | 20 | 22,39 | 687586 | 1732 | 75,73 | 798389,6 | |
0,25 кван | 2611 | 1265 | 4,2 | 97,4 | 70 | 11,7 | 2161 | 121 | 10 | 17,4 | 4095 | 243 | 8,5 | 3942,7 | |
0,75 кван | 3215 | 1760 | 5 | 99,2 | 77 | 13,3 | 2456 | 157 | 11 | 21,9 | 5050 | 290 | 20,7 | 4693,6 |
Аналогичные данные получены для третьей группы и представлены в таблице 13.
Таблица 13 – Статистические показатели при кластеризации на 3 для второй группы
Table 13 – Statistical indicators for clustering by 3 for the second group
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
2012 | 2 | 690 | 366 | 6,5 | 99,1 | 24 | 2,4 | 732 | 158 | 3 | 5,9 | 1397 | 187 | 10,6 | 1192,3 |
3 | 819 | 457 | 4,9 | 97,6 | 29 | 3 | 836 | 180 | 3 | 8,5 | 2170 | 175 | 13,1 | 2189,7 | |
5 | 1518 | 830 | 6 | 99,6 | 41 | 6,6 | 1356 | 161 | 8 | 15 | 2687 | 197 | 13 | 2961,5 | |
6 | 1244 | 655 | 5,9 | 99,3 | 27 | 4,2 | 1072 | 166 | 5 | 13,1 | 2608 | 160 | 20,9 | 1513,3 |
Продолжение таблицы 13
Год | № | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | |
| 8 | 1319 | 688 | 7,1 | 98,4 | 54 | 5,5 | 1167 | 173 | 7 | 11,4 | 2060 | 237 | 8,7 | 1407,8 | |
10 | 2016 | 1040 | 4,4 | 102,5 | 41 | 9,2 | 2075 | 120 | 8 | 15,2 | 3592 | 209 | 12,7 | 1635,8 | ||
11 | 1369 | 703 | 4,9 | 99,8 | 28 | 4,6 | 1662 | 136 | 5 | 10,3 | 2487 | 169 | 11,4 | 937,1 | ||
14 | 1274 | 680 | 5,6 | 100,6 | 34 | 5,3 | 1176 | 124 | 5 | 10,9 | 2625 | 137 | 6,3 | 2013 | ||
Ср. зн. | 1281,125 | 677,375 | 5,66 | 99,612 | 34,75 | 5,1 | 1259,5 | 152 | 5 | 11,29 | 2453,25 | 183,9 | 12,09 | 1731,313 | ||
Ме | 1296,5 | 684 | 5,75 | 99,45 | 31,5 | 4,95 | 1171,5 | 159 | 5 | 11,15 | 2547,5 | 181 | 12,05 | 1574,55 | ||
D | 167103,6 | 43083 | 0,81 | 2,18 | 100,50 | 4,57 | 192093 | 514 | 4 | 10,04 | 393787 | 957,6 | 18,22 | 412206 | ||
0,25 кван | 1137,75 | 605,5 | 4,9 | 98,925 | 27,75 | 3,9 | 1013 | 133 | 4 | 9,85 | 2142,5 | 166,8 | 10,13 | 1353,925 | ||
0,75 кван | 1406,25 | 734,75 | 6,13 | 100 | 41 | 5,775 | 1432,5 | 167 | 7 | 13,58 | 2640,5 | 200 | 13,03 | 2057,175 | ||
2015 | 2 | 686 | 359 | 5,3 | 99,3 | 24 | 2,2 | 670 | 164 | 3 | 4,4 | 1004 | 183 | 8,3 | 630,7 | |
3 | 807 | 446 | 4,2 | 97,8 | 29 | 3 | 978 | 170 | 3 | 7,3 | 1929 | 182 | 16,6 | 1616,5 | ||
5 | 1517 | 821 | 5 | 99,5 | 45 | 4,8 | 1345 | 113 | 7 | 12,1 | 2382 | 139 | 10,2 | 1901,3 | ||
6 | 1237 | 671 | 5 | 99,6 | 23 | 4,2 | 1126 | 143 | 5 | 10,8 | 1860 | 117 | 24 | 879,6 | ||
8 | 1297 | 679 | 5,3 | 99 | 48 | 4,3 | 1123 | 148 | 6 | 8,8 | 1553 | 130 | 9,8 | 1236,1 | ||
10 | 1995 | 1012 | 4,8 | 96,9 | 44 | 8,5 | 2124 | 124 | 5 | 14,7 | 2698 | 158 | 10,8 | 1418,6 | ||
11 | 1349 | 702 | 4,7 | 99,8 | 16 | 4,1 | 1203 | 128 | 4 | 11 | 2070 | 126 | 14,7 | 682,9 | ||
14 | 1258 | 650 | 4,9 | 98,4 | 33 | 3,9 | 1148 | 138 | 5 | 11 | 2061 | 124 | 5,2 | 2293,9 | ||
Ср. зн. | 1268,25 | 667,50 | 4,90 | 98,79 | 32,75 | 4,38 | 1214,63 | 141 | 4 | 10,01 | 1944,63 | 144,9 | 12,45 | 1332,45 | ||
Ме | 1277,5 | 675 | 4,95 | 99,15 | 31 | 4,15 | 1137 | 140 | 5 | 10,9 | 1995 | 134,5 | 10,5 | 1327,35 | ||
D | 164319,6 | 41159,7 | 0,1 | 1,0 | 139,4 | 3,5 | 173913 | 382 | 2 | 9,9 | 261954 | 689,8 | 34,3 | 352115,3 | ||
0,25 кван | 1129,5 | 599 | 4,77 | 98,25 | 23,75 | 3,675 | 1086,75 | 127 | 3 | 8,425 | 1783,25 | 125,5 | 9,425 | 830,425 | ||
0,75 кван | 1391 | 731,75 | 5,08 | 99,525 | 44,25 | 4,425 | 1238,5 | 152 | 5 | 11,27 | 2148 | 164 | 15,17 | 1687,7 | ||
2018 | 2 | 681 | 331 | 5 | 96,5 | 24 | 2,3 | 514 | 124 | 3 | 3,6 | 932 | 269 | 7,4 | 602 | |
3 | 795 | 421 | 4,2 | 98,1 | 28 | 3,3 | 715 | 197 | 3 | 6,2 | 1502 | 260 | 7,1 | 1528,9 | ||
5 | 1507 | 782 | 4,8 | 98,6 | 49 | 6,1 | 1032 | 121 | 7 | 9,9 | 1982 | 246 | 22,2 | 2332,4 | ||
6 | 1223 | 619 | 5 | 97,9 | 26 | 4,8 | 915 | 167 | 4 | 8,1 | 1416 | 195 | 6,7 | 2009 | ||
2018 | 8 | 1272 | 667 | 5,1 | 99,8 | 50 | 4,9 | 873 | 180 | 4 | 6,2 | 1276 | 260 | 6,4 | 2210,9 | |
10 | 1963 | 1011 | 4,4 | 99,3 | 45 | 9,3 | 1667 | 125 | 5 | 7,4 | 2114 | 256 | 11,1 | 1225,2 | ||
11 | 1318 | 685 | 4,4 | 99,7 | 25 | 4,6 | 890 | 134 | 5 | 7 | 1688 | 187 | 6,4 | 1937 | ||
14 | 1238 | 626 | 3,7 | 98,3 | 39 | 4,3 | 950 | 148 | 5 | 7,2 | 1659 | 222 | 5 | 3606,6 | ||
Ср. зн. | 1249,625 | 642,75 | 4,58 | 98,525 | 35,75 | 4,95 | 944,5 | 149 | 4 | 6,95 | 1571,13 | 236,9 | 9,038 | 1931,5 | ||
Ме | 1255 | 646,5 | 4,6 | 98,45 | 33,5 | 4,7 | 902,5 | 141 | 4 | 7,1 | 1580,5 | 251 | 6,9 | 1973 | ||
D | 158740 | 43511 | 0,24 | 1,19 | 126,21 | 4,37 | 110949 | 828 | 1 | 3,23 | 144190 | 1001 | 31,37 | 782756,9 | ||
0,25 кван | 1116 | 569,5 | 4,35 | 98,05 | 25,75 | 4,05 | 833,5 | 124 | 3 | 6,2 | 1381 | 215,2 | 6,4 | 1452,975 | ||
0,75 кван | 1365,25 | 709,25 | 5 | 99,4 | 46 | 5,2 | 970,5 | 170 | 5 | 7,575 | 1761,5 | 260 | 8,325 | 2241,275 | ||
Распределение субъектов между вторым и третьим кластерами претерпело изменение, однако статистические значения показателей второго кластера по-прежнему практически в 2 раза превосходят аналогичные показатели третьего класса. Средние значения показателей, которые оказывают благоприятное влияние на степень развитости сферы образования в анализируемых регионах, превосходят средние значения внутри Приволжского федерального округа в целом примерно в 1,5 раза.
Следует отметить уменьшение среднего значения уровня безработицы. Данный показатель должен сохранить тенденцию к снижению с целью повышения развитости региона. Среднее значение уровня безработицы в Республике Татарстан на 1 % меньше, чем в Приволжском федеральном округе. Быстрые темпы цифровизации регионов приводят к сокращению старых профессий, после переквалификации уровень безработицы по-прежнему сокращается. По статистике 2020 года, данный показатель нормализуется и сохраняется тенденция, как в 2012 году. Показатели, которые описывают степень развитости сферы образования в регионах, а именно, число учебных заведений, число студентов и преподавателей, число персональных компьютеров, которые используются в учебных целях, в среднем меньше, чем по всему Приволжскому федеральному округу в целом и по двум кластерам соответственно. Регионы, входящие в третью группу, характеризуются малой численностью населения и рабочей силы. Средние значения данных показателей в 2 раза меньше аналогичных показателей по ПФО, а также в 2,5 и 3 раза меньше значений первого и второго кластеров соответственно. Инновационная активность организаций в третьем кластере уступает показателю по всему ПФО в целом аналогично первичному анализу и итогам кластеризации на 2 класса. Однако в 2012 и 2015 годах складывается ситуация, когда третий кластер опережает по данному показателю второй, но к 2018 году второй кластер возвращает лидирующие позиции и превосходит третий кластер на 4 %.
Показатель инвестиции в образование характеризует субъекты Приволжского федерального округа. Среднее значение данного показателя характеризуется большим разрывом между кластерами. Наивысшая сумма инвестиций в сферу образования в 2,5 раза превышает аналогичный показатель между кластерами. В 2012 году инвестиции в сферу образования во втором кластере составляют 3083,2 млн рублей, следовательно, это практически в 2 раза выше, чем в третьем кластере. К 2018 году не удалось сократить разрыв между кластерами. Республика Татарстан по-прежнему сохраняет ведущие позиции, а второй кластер все также имеет большой разрыв с третьей группой. Изменение ситуации и перераспределение субъектов между кластерами определяется политикой государства.
Оценка качества критериев кластеризации [26] позволяет считать оптимальной кластеризацию на 3 кластера.
Таблица 14 – Распределение по кластерам по группе показателей масштаба развития
образования методом «ближнего и дальнего соседа»
Table 14 – Distribution by clusters by group of indicators of the scale of development of education by the method of «near and far neighbor»
Ближний | Субъект | Дальний сосед | Субъект |
Кластер | Республика Башкортостан | Кластер | Республика Башкортостан |
| Республика Марий Эл |
| Нижегородская область |
| Самарская область |
| Самарская область |
| Нижегородская область | Кластер | Удмуртская Республика |
Кластер | Удмуртская Республика |
| Оренбургская область |
| Чувашская Республика |
| Пензенская область |
| Пермский край |
| Ульяновская область |
| Кировская область | Кластер | Республика Марий Эл |
| Оренбургская область |
| Республика Мордовия |
| Пензенская область |
| Чувашская Республика |
| Саратовская область |
| Кировская область |
| Ульяновская область | Кластер | Саратовская область |
Кластер | Республика Мордовия |
| Пермский край |
Кластер | Республика Татарстан | Кластер | Республика Татарстан |
Таким образом, при проведении кластерного анализа было выполнено распределение всех структурных единиц Приволжского федерального округа на заданное число кластеров. В анализе была использована вся совокупность показателей сферы образования. Результаты исследования позволили сделать вывод о степени развитости сферы образования в субъектах ПФО. Для более детального анализа показателей необходимо изучение степени близости и рассеяния субъектов внутри определенной группы показателей. Для этого используется подход метода «ближнего соседа» с евклидовой метрикой простой и взвешенной, метод «дальнего соседа», позволяющие сформировать разные по плотности кластеры, а также дивизимный алгоритм кластеризации. Для расчета весовых коэффициентов использовался метод главных компонент, описанный ниже в работе.
Как видно из таблицы 14, с меньшей плотностью структуризация предполагает выделение пяти кластеров. Республика Татарстан всегда проявляет себя как самостоятельный кластер. Более половины субъектов ПФО формируют большой кластер. Можно ожидать, что в указанный временной период трудовой потенциал сферы образования был на одинаковом уровне. В этих регионах активно шли процедура объединения образовательных учреждений, появление новых направлений специализации. Методом «дальнего соседа» указанный крупный кластер разбивается на два кластера, что позволяет провести дифференциацию по группе масштаба проявления изучаемых показателей. Углубленная кластеризация применяется в исследовании при использовании показателей социально-эконо-
мической сферы. В таблице 15 представлены результаты классификация по группе показателей социально-экономической сферы по исходным данным за 2018 год.
Таблица 15 – Распределение по кластерам по группе показателей социально-экономической сферы методом «ближнего и дальнего соседа»
Table 15 – Distribution by clusters by a group of indicators of the socio-economic sphere using the «near and far neighbor» method
Ближний сосед | Субъект | Дальний сосед | Субъект |
Кластер | Республика Башкортостан | Кластер | Республика Башкортостан |
| Республика Татарстан |
| Республика Татарстан |
Кластер | Самарская область | Кластер | Пермский край |
| Нижегородская область |
| Саратовская область |
Кластер | Саратовская область |
| Оренбургская область |
| Пермский край | Кластер | Пензенская область |
Кластер | Республика Марий Эл |
| Ульяновская область |
| Республика Мордовия |
| Республика Марий Эл |
| Оренбургская область |
| Республика Мордовия |
Кластер | Пензенская область |
| Чувашская Республика |
| Кировская область |
| Кировская область |
| Ульяновская область |
| Самарская область |
| Удмуртская Республика |
| Нижегородская область |
| Чувашская Республика | Кластер | Удмуртская Республика |
Учитывая особую роль отдельных показателей для субъектов ПФО, далее в работе описывается кластеризация по взвешенной евклидовой метрике. По матрице факторного отображения, которая представлена ниже в работе, рассчитывался показатель общности для показателей данного блока. Суммарная общность далее используется для нормирования коэффициентов корреляции между латентными факторами и исходными показателями. В результате нормировки получены весовые коэффициенты для взвешенной евклидовой метрики. В таблице 16 представлен модифицированный исходный массив показателей социально-экономической сферы для 2018 года.
Для данных таблицы 16 рассчитывалась матрица расстояний, которая позволила провести кластеризацию методами «ближнего» и «дальнего соседа». Таблицы 17 и 18 представляют собой протокол пошаговой кластеризации. Первые два столбца показывают номера объектов, которые формируют первый кластер на основании минимального расстояния между ними в матрице расстояний. Далее происходит модификация матрицы расстояний: происходит сокращение размерности на единицу, изменяются расстояния от всех оставшихся объектов до сформированного первого кластера. В методе «ближнего соседа» фиксируется меньшее из двух возможных расстояний, в методе «дальнего соседа» сохраняется большее расстояние. Третий столбец таблицы 17 отражает минимальное расстояние, на котором происходят последующие шаги кластеризации. Четвертый столбец отображает новый сформированный кластер.
Таблица 16 – Исходный массив данных по группе социально-экономических показателей, модифицированных весом
Table 16 – Initial data array for a group of socio-economic indicators modified by weight
№ | Х1 | Х2 | Х3 | Х4 |
1 | 1829,432 | 899,8865 | 0,04655 | 7,62642 |
2 | 307,5396 | 152,3593 | 0,0475 | 7,55595 |
3 | 359,022 | 193,7863 | 0,0399 | 7,68123 |
4 | 1760,788 | 937,6311 | 0,03135 | 7,83 |
5 | 680,5612 | 359,9546 | 0,0456 | 7,72038 |
6 | 552,3068 | 284,9257 | 0,0475 | 7,66557 |
7 | 1179,128 | 582,2795 | 0,0513 | 7,76736 |
8 | 574,4352 | 307,0201 | 0,04845 | 7,81434 |
9 | 1451,894 | 810,128 | 0,0399 | 7,71255 |
10 | 886,4908 | 465,3633 | 0,0418 | 7,77519 |
11 | 595,2088 | 315,3055 | 0,0418 | 7,80651 |
12 | 1437,443 | 788,9542 | 0,03515 | 7,81434 |
13 | 1102,356 | 550,9791 | 0,0475 | 7,61076 |
14 | 559,0808 | 288,1478 | 0,03515 | 7,69689 |
Таблица 17 – Протокол пошаговой кластеризации методом «ближнего соседа»
Table 17 – Incremental «near neighbor» сlustering protocol
Объект | Объект | d(min) | Кластер |
6 | 14 | 7,5 | S(6,14) |
8 | 11 | 22,36 | S(8,11) |
S(6,14) | S(8,11) | 24,33 | S(6,8,11,14) |
9 | 12 | 25,64 | S(9,12) |
2 | 3 | 66,08 | S(2,3) |
1 | 4 | 78,34 | S(1,4) |
7 | 13 | 82,91 | S(7,13) |
5 | S(6,8,11,14) | 96,33 | S(5,6,8,11,14) |
S(2,3) | S(5,6,8,11,14) | 213,69 | S(2,3,5,6,8,11,14) |
10 | S(2,3,5,6,8,11,14) | 231,34 | S(2,3,5,6,8,10,11,14) |
S(7,13) | S(2,3,5,6,8,10,11,14) | 232,22 | S(2,3,5,6,7,8,10,11,13,14) |
S(9,12) | S(2,3,5,6,7,8,10,11,13,14) | 330,82 | S(2,3,5,6,7,8,9,10,11,12,13,14) |
S(1,4) | S(2,3,5,6,7,8,9,10,11,12,13,14) | 334,17 | S(1,2,3,4,5,6,7,8,9,10,11,12,13,14) |
Таблица 18 – Протокол пошаговой кластеризации методом «дальнего соседа»
Table 18 – Step by step clustering protocol using the «far neighbor» method
Объект | Объект | d(min) | Кластер |
6 | 14 | 7,5 | S(6,14) |
8 | 11 | 22,36 | S(8,11) |
9 | 12 | 25,64 | S(9,12) |
S(6,14) | S(8,11) | 52,57 | S(6,8,11,14) |
2 | 3 | 66,08 | S(2,3) |
1 | 4 | 78,34 | S(1,4) |
7 | 13 | 82,91 | S(7,13) |
5 | S(6,8,11,14) | 148,59 | S(5, 6, 8,11,14) |
10 | S(7,13) | 315,13 | S(7,10,13) |
S(1,4) | S(9,12) | 407,38 | S(1,4,9,12) |
S(2,3) | S(5, 6, 8,11,14) | 426,9 | S(2,3,5,6, 8,11,14) |
S(2,3,5,6, 8,11,14) | S(7,10,13) | 971,85 | S(2,3,5,7,8,10,11,13,14) |
S(1,4,9,12) | S(2,3,5,7,8,10,11,13,14) | 1695,57 | S(1,2,3,4,5,7,8,9,10,11,12,13,14) |
Достоинством агломеративных методов классификации является возможность ограничения шагов кластеризации, когда становится очевидной структура каждого кластера. Как видно, для весовой метрики формируются 2 кластера по методу «ближнего соседа» и 3 кластера по методу «дальнего соседа». Как видно из таблицы 18, с большей плотностью структуризация предполагает выделение пяти кластеров. Самый крупный кластер также составляет больше половины субъектов ПФО. По показателям социально-экономического блока субъекты данного кластера можно считать достаточно схожими. Республики Татарстан и Башкортостан в обоих случаях проявляют себя как отдельный кластер.
В работе применялся дивизимный метод кластеризации. Для группы показателей социально-экономической сферы (2018 год) рассматривается процедура кластеризации. Исходные данные имеют весовую нагрузку на показатели. На первом шаге разделяются Республика Башкортостан и Республика Марий Эл. Далее к ним по минимальному расстоянию присоединяются остальные субъекты. К Республике Башкортостан присоединяются Республика Татарстан, Пермский край, Нижегородская область, Самарская область, Саратовская область. Остальные субъекты присоединяются к Республике Марий Эл. Далее аналогичная процедура применялась к каждой ветке дерева. Корнем первой ветки является Республика Башкортостан. На следующем шаге расходятся Республика Башкортостан и Саратовская область. По минимальному расстоянию к Республике Башкортостан присоединяются Республика Татарстан, Нижегородская область, Самарская область. Пермский край присоединяется к Саратовской области. Следующий шаг соответствует расхождению Республики Башкортостан и Самарской области. К Республике Башкортостан присоединяется Республика Татарстан, к Самарской области – Нижегородская область. И далее эти парные кластеры также разделяются. Разделение первой ветви закончено. Рассмотрим дивизимный алгоритм для второй ветви дерева. На первом шаге разделяются Республика Марий Эл и Оренбургская область. К Республике Марий Эл по минимальному расстоянию присоединяются Республика Мордовия, Кировская область, Чувашская Республика и Ульяновская область. Оренбургская область, Пензенская область и Республика Удмуртия объединяются по минимальному расстоянию. Республика Марий Эл и Кировская область являются корнями новой ветки. Республика Мордовия присоединяется к Республике Марий Эл. Чувашская Республика и Ульяновская область присоединяются к Кировской области. Далее разделяются Кировская область и Чувашская Республика. И далее эта ветка заканчивается разделением Чувашской Республики и Ульяновской области. Последняя ветка характеризует разделение Оренбургской и Пензенской областей и далее происходит разделение Удмуртской Республики и Пензенской области. Таблица 19 содержит расстояния, на которых разделяются субъекты ПФО согласно дивизимному алгоритму кластеризации.
Таблица 19 – Численные значения расстояний, соответствующих дивизимному алгоритму кластеризации
Table 19 – Numerical values of distances corresponding to the divisive clustering algorithm
Левая ветвь | |||||||
1 и 2 | 1 и 13 | 1 и 12 | 1 и 4 | 9 и 12 |
| ||
1695,568 | 806,4589 | 407,3834 | 78,33636 | 25,63547 |
| ||
Правая ветвь | |||||||
2 и 10 | 2 и 8 | 2 и 3 | 10 и 11 | 11 и 5 | 6 и 8 | 6 и 14 | |
658,1459 | 308,4693 | 66,08063 | 372,2938 | 96,3254 | 31,2706 | 7,501342 | |
Из таблицы 19 видно, что диаметром исходного кластера, включающего все субъекты ПФО, является расстояние между Республикой Башкортостан и Республикой Марий Эл. Самыми близкими по изучаемой группе социально-экономических показателей являются следующие пары: Чувашская Республика и Ульяновская область, Нижегородская и Самарская области, Республика Марий Эл и Республика Мордовия. Графическое представление дивизимного метода кластеризации представлено на рисунке 1.
Таким образом, в работе представлены результаты кластеризации разными методами и с использованием модифицированных данных. Многомерные данные размерности 14 х 14 невозможно представить в виде графика на плоскости. В этой связи возможности факторного анализа очень широки и позволяют решить эту проблему. Следующим шагом исследования было сжатие массива данных с целью визуализации данных. Средствами факторного анализа многомерные данные были визуализированы. Факторный анализ имеет широкий спектр методов, включая Q и R техники, в исследовании используется метод главных компонент. Используя статистический пакет SPSS Statistics, получены диаграммы, таблицы, графики по факторному анализу, представленные в методе главных компонент. Используя пакет SPSS Statistics, выделены 2 латентных фактора, которые представлены в таблице 20. Кумулятивная величина дисперсии больше 75 %.
Рисунок 1 – Дерево. Результат дивизимного алгоритма кластеризации
Figure 1 – Tree. The result of divisive clustering algorithm
Таблица 20 – Полная объясненная дисперсия с отражением двух латентных факторов
Table 20 – Total explained variance reflecting two latent factors
Компонента | Начальные собственные значения | Суммы квадратов нагрузок извлечения | ||
Кумулятивный % | Итого | % Дисперсии | Кумулятивный % | |
1 | 61,976 | 8,677 | 61,976 | 61,976 |
2 | 75,268 | 1,861 | 13,293 | 75,268 |
Алгоритм метода главных компонент в SPSS Statistics задавался алгоритмом выведения собственных значений, превышающих 1, и, как видно из таблицы 15, главные компоненты имеют собственное значение 8,68 и 1,86. Первый латентный фактор объясняет дисперсию на 61,98 %, второй латентный фактор объясняет дисперсию на 13,29 %. В сумме получается 75,27 %. В работе задавался дополнительно режим варимаксного вращения для усиления факторных нагрузок. В таблице 21 представлены собственные значения и соответствующие дисперсии латентных факторов после варимаксного вращения.
Таблица 21 – Полная объясненная дисперсия после варимаксного вращения
Table 21 – Total explained variance after varimax rotation
Компонента | Суммы квадратов нагрузок вращения | ||
Итого | % Дисперсии | Кумулятивный % | |
1 | 8,082 | 57,730 | 57,730 |
2 | 2,455 | 17,538 | 75,268 |
На рисунке 2 представлена графическая зависимость собственных значений, выделенных методом главных компонент, и соответствующих им латентных факторов каждой компоненте.
Рисунок 2 – График нормализованного простого стресса
Figure 2 – Graph of normalized simple stress
Как видно из графика, излом приходится на 2-ю компоненту, что свидетельствует о том, что первые два собственных значения достаточны для выделения двух главных компонент.
В таблице 22 представлена матрица факторного отображения до и после варимаксного вращения по двум выделенным латентным факторам.
Таблица 22 – Матрица факторного отображения до и после варимаксного вращения
Table 22 – Factor mapping matrix before and after varimax rotation
До вращения | |||||||
Латентный фактор | X1 | X2 | X3 | X4 | X5 | X6 | X7 |
F1 | 0,99 | 0,992 | -0,249 | 0,587 | 0,93 | 0,937 | 0,968 |
F2 | -0,015 | 0,006 | 0,344 | -0,574 | 0,247 | -0,098 | -0,072 |
Латентный фактор | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
F1 | -0,442 | 0,865 | 0,97 | 0,971 | 0,316 | 0,209 | 0,809 |
F2 | 0,857 | 0,176 | 0,088 | 0,035 | 0,331 | 0,605 | 0,296 |
После вращения | |||||||
Латентный фактор | X1 | X2 | X3 | X4 | X5 | X6 | X7 |
F1 | 0,941 | 0,95 | -0,137 | 0,392 | 0,961 | 0,866 | 0,904 |
F2 | 0,307 | 0,287 | -0,402 | 0,722 | 0,038 | 0,37 | 0,355 |
Латентный фактор | X8 | X9 | X10 | X11 | X12 | X13 | X14 |
F1 | -0,169 | 0,879 | 0,952 | 0,938 | 0,4 | 0,378 | 0,86 |
F2 | -0,949 | 0,087 | 0,202 | 0,253 | -0,223 | -0,516 | -0,044 |
Из матрицы факторного отображения до вращения видно, что первый латентный фактор максимально коррелирует с показателями Х1, Х2, Х4, Х5, Х6, Х7, Х9, Х10, Х11, Х14. Второй латентный фактор – соответственно, с Х3, Х8, Х12, Х13. В результате варимаксного вращения происходит перераспределение множества показателей в теоретическом пространстве латентных факторов. Рисунок 3 демонстрирует локализацию исходных показателей в новом пространстве с учетом варимаксного вращения.
Рисунок 3 – График компонент в повернутом пространстве
Figure 3 – Plot components in rotated space
Для всех субъектов ПФО средствами факторного анализа рассчитаны новые теоретические координаты. В таблице 23 представлены численные значения латентных факторов субъектов Приволжского федерального округа.
Таблица 23 – Численные значения латентных факторов субъектов Приволжского
федерального округа
Table 23 – Numerical values of latent factors of the subjects of the Volga Federal District
№ субъекта | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
F1 | -0,13 | -0,14 | 0,22 | 0,17 | -0,22 | -0,07 | -0,13 |
F2 | 0,83 | 0,83 | -0,65 | 0,72 | 0,7 | 0,73 | 0,95 |
№ | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
F1 | -0,22 | -0,26 | -0,21 | -0,22 | -0,02 | -0,27 | -0,38 |
F2 | -0,08 | 0,86 | 0,87 | 0,88 | -0,48 | 1,71 | 1,28 |
График расположения субъектов Приволжского федерального округа в пространстве латентных факторов представлен на рисунке 4.
Из рисунка 4 видно, что Республика Татарстан – это лидирующий регион Приволжского федерального округа по всем показателям. Данный округ имеет достаточно большие значения латентных факторов. Однако значение второго латентного фактора ниже, чем во многих других регионах. Это связано с тем, что в данную группу входит показатель, характеризующий безработицу. В регионе зафиксировано хорошее развитие факторов, которые не учитывают информационные технологии. Информационные показатели также занимают ведущее положение. В Самарской области наблюдаются стабильные показатели по первому латентному фактору. Показатели, которые не связаны с информационными технологиями, оказываются на уровне ниже, чем в Республике Татарстан. Таким образом, в данном субъекте ПФО необходимо развивать сферу образования за счет увеличения инвестиций. Показатели, на которые оказывает влияние информатизация сферы, занимают среднее значение. Следовательно, внедряя новые технологии в сферу образования, необходимо реализовывать переквалификацию сотрудников сферы образования, сокращая показатель безработицы. Соблюдая баланс внутри латентного фактора, регион сможет претендовать на ведущие позиции в Приволжском федеральном округе.
Аналогичные расчеты проведены по показателям сферы образования за 2015 и 2018 год. Ниже представлены графики субъектов Приволжского федерального округа в пространстве латентных факторов за 2015 и 2018 год (рисунки 5 и 6).
Рисунок 4 – Субъекты в пространстве латентных факторов за 2012 год
Figure 4 – Subjects in the space of latent factors for 2012
Рисунок 5 – Субъекты в пространстве латентных факторов за 2015 год
Figure 5 – Subjects in the space of latent factors for 2015
Рисунок 6 – Субъекты в пространстве латентных факторов за 2018 год
Figure 6 – Subjects in the space of latent factors for 2018
Коэффициент информативности подтверждает достаточное количество выделенных латентных факторов. В таблице 24 представлены численные значения коэффициента информативности для изучаемых временных периодов.
Таблица 24 – Численные значения коэффициента информативности
Table 24 – Numerical values of the information content coefficient
Период | 2012 | 2015 | 2018 |
Коэффициент информативности | 0,753 | 0,729 | 0,785 |
Как видно из таблицы 24, коэффициент информативности превосходит 0,7, что свидетельствует об удовлетворительном качестве результатов факторного анализа. Компоненты матрицы факторного отображения позволили оценить весовые коэффициенты для применения кластерного анализа с учетом взвешенной евклидовой метрики. В частности, в таблице 25 представлены численные значения весовых коэффициентов до и после варимаксного вращения.
Таблица 25 – Численные значения весовых коэффициентов до и после варимаксного вращения
Table 25 – Numerical values of weighting coefficients before and after varimax rotation
Показатели | ||||||
X1 | X2 | X3 | X4 | X5 | X7 | X9 |
До варимаксного вращения | ||||||
0,413 | 0,415 | 0,026 | 0,145 | 0,248 | 0,268 | 0,214 |
После варимаксного вращения | ||||||
0,452 | 0,46 | 0,01 | 0,078 | 0,272 | 0,241 | 0,228 |
Показатели | ||||||
X11 | X6 | X10 | X12 | X8 | X13 | X14 |
До варимаксного вращения | ||||||
0,27 | 0,483 | 0,517 | 0,338 | 0,662 | 0,063 | 0,937 |
После варимаксного вращения | ||||||
0,259 | 0,453 | 0,547 | 0,849 | 0,152 | 0,162 | 0,838 |
Весовая кластеризация позволяет усиливать и ослабевать входящий в исследование показатель. Обычно весовые коэффициенты формируются после экспертного оценивания. В работе оценка весовых коэффициентов проводилась по матрице факторного отображения с учетом степени тесноты связи показателя и латентного фактора [24].
Заключение
В работе проанализированы средствами классификации без обучения и факторного анализа показатели сферы образования Приволжского федерального округа в условиях государственной политики по цифровизации. Результатом первичного анализа выбранных показателей сферы образования в РФ является достаточно высокий рейтинг Приволжского федерального округа в общей структуре субъектов РФ. В работе проведен анализ показателей агломеративными, дивизимными и итеративными методами кластеризации, произведена визуализация исходных показателей средствами факторного анализа. Также в работе проведена углубленная кластеризация по группам показателей масштаба уровня образования и социально-экономической сферы. Для группы социально-экономического блока применялась весовая евклидова метрика. Проведена структуризация ПФО по изучаемым показателям. Используя пакет SPSS Statistics, выделены 2 латентных фактора. Усиление факторных нагрузок осуществлялось варимаксным вращением. Первый латентный фактор включает группу показателей, слабо подверженных цифровой трансформации. А второй латентный фактор включает показатели, характеризующиеся влиянием цифровой трансформации. По результатам факторного анализа следует отметить, что Республика Татарстан, Республика Башкортостан, Самарская и Нижегородская области являются ведущими регионами Приволжского федерального округа с развитой сферой образования. Повышать размер инвестиций в сферу образования, увеличивать число ПК, используемых в учебных целях, бороться с безработицей необходимо в Пермском крае, Республике Марий Эл, Республике Мордовия, Удмуртской Республике, Чувашской Республике, Ульяновской, Пензенской, Кировской, Оренбургской и Саратовской областях
Таким образом, средствами многомерных статистических методов, а именно кластерного и факторного анализов, была изучена структуризация субъектов, осуществлена визуализация изучаемых показателей, а также выявлена отдельная связь между группами показателей. По результатам кластерного анализа было получено наилучшее разбиение структурных единиц Приволжского федерального округа на кластеры. Полученные результаты дополняют исследования, представленные в работах [27–29].
About the authors
Alla Yu. Trusova
Samara National Research University
Author for correspondence.
Email: a_yu_ssu@mail.ru
ORCID iD: 0000-0001-7679-9902
associate professor of the Department of Mathematics and Business Informatics
Russian Federation, 34, Moskovskoye shosse, Samara, 443086, Russian FederationAlla I. Ilina
Samara National Research University
Email: iai.62@mail.ru
ORCID iD: 0000-0002-7624-5771
senior lecturer of the Department of Mathematics and Business Informatics
Russian Federation, 34, Moskovskoye shosse, Samara, 443086, Russian FederationReferences
- Tarasov S.Yu., Agarkov A.P. The economic essence of territorial finance and its role in the regional economy and regional economy. In: Collection of scientific articles of MIA undergraduates. Moscow: Moskovskaya mezhdunarodnaya akademiya, 2021, vol. 2, pp. 82–86. Available at: https://www.elibrary.ru/item.asp?id=46491911. EDN: https://www.elibrary.ru/ghpdwn. (In Russ.)
- Rumyantsev N.M., Leonidova E.G. Asymmetry problems of structural shifts in regional economy. Economic and Social Changes: Facts, Trends, Forecast, 2020, vol. 13, no. 6, pp. 169–183. DOI: http://doi.org/10.15838/esc.2020.6.72.10.
- Andreev O., Phan the Cong, Ghandour Ahmad, Gurova T. Information technologies, e-commerce retail platforms and the impact on the regional economy. Razvitie talantov i peredovoe masterstvo, 2020, vol. 12, no. S2, pp. 4205–4216. (In Russ.)
- Shamsuddinov N.N. Improvement of the state regulation of innovative development of the regional economy. Theoretical & Applied Science, 2020, no. 2 (82), pp. 437–444. DOI: https://doi.org/10.15863/TAS.2020.02.82.71. EDN: https://www.elibrary.ru/hjojcm.
- Bulguchev M.Kh., Yusupova M.D., Merzho M.Sh., Kostoeva A.A. Transformation of the regional economy for private entrepreneurship. The European Proceedings of Social & Behavioral Sciences EPSBS. Groznyi, 2019, vol. 76, pp. 3497–3505. DOI: https://doi.org/10.15405/epsbs.2019.12.04.470. EDN: https://www.elibrary.ru/jmourl.
- Tumenova S.A., Uzdenova M.Kh., Sozaeva T.Kh. Global technology trends: regional economy in search of new growth model. In: European Proceedings of Social and Behavioral Sciences EpSBS. International Scientific Congress «Knowledge, Man and Civilization». Groznyi, October 22–25, 2020. Groznyi, 2020, pp. 2579–2586. DOI: http://dx.doi.org/10.15405/epsbs.2021.05.346.
- Dolbnya E.A., Kozlova E.N., Vasilyeva M.K., Lyukina A.Y. Digital Innovation as a Regional Economy Development Factor. IOP Conference Series: Earth and Environmental Science, 2021, vol. 666, issue 6., p. 062133. DOI: http://dx.doi.org/10.1088/1755-1315/666/6/062133.
- Nikaeva R.M., Dzhumaeva Ya.M., Mazhiev K.K. Priorities for the development of regional economy concerning medium-term socio-economic tasks. In: 4th International Conference on Social and Cultural Transformations in the Context of Modern Globalism (SCTCMG 2021). Groznyi, March 19–21, 2021. Groznyi, 2021, p. 2394–2400.
- Salimova G., Ableeva A., Nigmatullina G., Galimova A., Bakirova R. Assessment of innovative development of the regional economy by multiple analysis methods. E3S Web of Conferences, 2020, vol. 176, p. 050424. DOI: https://doi.org/10.1051/e3sconf %2F202017605024.
- Nikolaeva E.E. Competitiveness of the regional economy: the range of topical issues of theory and practice. Theoretical Economy, 2021, no. 4 (76), pp. 135–138. Available at: https://elibrary.ru/item.asp?id=46251224. EDN: https://elibrary.ru/hjptfs. (In Russ.)
- Vantsev R.Yu. Analysis of socio-economic development of Russia and the regions of the Volga Federal District. In: Actual problems of economic and legal development of Russia and the regions: collection of scientific papers of the interuniversity research and practical conference. Krasnoyarsk, 2019, pp. 381–387. Available at: https://elibrary.ru/item.asp?id=38095220. EDN: https://elibrary.ru/lvpnyq. (In Russ.)
- Butorina O.V., Tretyakova E.A. Аnalysis technique of information innovation and technological cycle at the level of regional economic systems. Vestnik Permskogo universiteta. Seria Ekonomika = Perm University Herald. Economy, 2019, vol. 14, no. 2, pp. 289–312. DOI: https://doi.org/10.17072/1994-9960-2019-2-289-312. EDN: https://elibrary.ru/blahom. (In Russ.)
- Zemskova E.S. On the possibilities of diagnostics of digital economy development in the region. In: Shemyakina N.V. (Ed.) Knowledge economy: theory, practice, development prospects: collection of materials of the International research and practical conference dedicated to the 50th anniversary of the Institute. Donetsk, 2020, pp. 461–474. Available at: https://elibrary.ru/item.asp?id=44192774. EDN: https://elibrary.ru/hubjor. (In Russ.)
- Sysoeva E.A. State and trends of development of the economy digitalization processes in the Volga Federal District. Bulletin of the Research Institute of the Humanities by the Government of the Republic of Mordovia, 2020, no. 3 (55), pp. 176–193. Available at: https://elibrary.ru/item.asp?id=44257723. EDN: https://elibrary.ru/wtethk. (In Russ.)
- Chaika L.V. Differentiation of the economic efficiency in the regions of Russia. Statistics and Economics, 2020, vol. 17, no. 1, pp. 54-68. DOI: https://doi.org/10.21686/2500-3925-2020-1-54-68. (In Russ.)
- Maksimets N.V., Bukatina E.G. Comparative characteristic economic growth the regions of the Volga Federal District. In: Bilaonova M.Yu. (Ed.) Historical process: origins, vicissitudes, prospects: interuniversity collection of articles. Yoshkar-Ola, 2019, pp. 106–115. Available at: https://elibrary.ru/item.asp?id=42489419&pff=1. EDN: https://elibrary.ru/psknxc. (In Russ.)
- Pilipenko V.A. Integral evaluation of competitiveness economy of the Samara region. In: Transformation of economic and legal system of Russia: problems and prospects: collection of scientific articles of the All-Russian research and practical student conference. Samara, 2021, pp. 98–102. URL: https://elibrary.ru/item.asp?id=45830260. EDN: https://elibrary.ru/slmnff. (In Russ.)
- Eremicheva O.Yu., Mashchenko M.O., Pankova A.V. On the development of the digital economy in the Volga Federal District. Eurasian Union of Scientists. Series: Economic and Legal Sciences, 2021, vol. 1, no. 7 (88), pp. 16–21. Available at: https://econ-law.euroasia-science.ru/index.php/Euroasia/article/view/733. (In Russ.)
- Vasilyeva I.A. Analysis of the conditions of socio-economic development of Russian regions. Journal of Innovative development of economy, 2020, no. 6 (60), pp. 121–132. Available at: https://elibrary.ru/item.asp?id=44680161. EDN: https://elibrary.ru/jvktvd. (In Russ.)
- Synkova T.V. Assessment of the competitiveness of regions on the example of the Volga Federal District. In: Modern scientific research in the field of economics: collection of scientific research results. Kirov, 2018, pp. 968–975. Available at: https://elibrary.ru/item.asp?id=35222850. EDN: https://elibrary.ru/ovkeaz.
- Khadjiyev A.Kh. Regularities and trends in the implementation of the digital educational process in the university. Aktual'nye nauchnye issledovaniya v sovremennom mire, 2021, no. 11–6 (79), pp. 43-48. Available at: https://elibrary.ru/item.asp?id=47402544. EDN: https://elibrary.ru/ozrlqw. (In Russ.)
- Atayan A.M., Guryeva T.N., Sharabayeva L.Yu. Digital transformation of higher education: challenges, opportunities, prospects and risks. Otechestvennaya i zarubezhnaya pedagogika, 2021, vol. 1, no. 2 (75), pp. 7–22. Available at: http://f.kemrsl.ru:8081/iap/Nandigram/psychpedt/geimifikaciya/Atoyan.pdf. (In Russ.)
- Dayinbegov D.M. Computer technologies of data analysis in econometrics. Moscow: INFRA-M – Vuzovskii uchebnik, 2008, 578 p. Available at: https://znanium.com/catalog/document?id=144944. (In Russ.)
- Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Multidimensional statistical methods: textbook. Moscow: Finansy i statistika, 2000, 352 p. Available at: https://institutiones.com/download/books/1781-mnogomernye-statisticheskie-metody-dubrov.html. (In Russ.)
- Soshnikova L.A., Tamashevich V.N., Uebe G., Schaeffer M. Multidimensional statistical analysis in economics: textbook for universities; Tamashevich V.N. (Ed.). Moscow: YuNITI-DANA, 1999, 598 p. Available at: https://elibrary.ru/item.asp?id=39142935. EDN: https://elibrary.ru/eofqgd. (In Russ.)
- Ayvazyan S.A. Applied statistics and fundamentals of econometrics. Moscow: Yuniti, 2014, 1024 p. Available at: https://institutiones.com/download/books/3045-prikladnaya-statistika-osnovy-ekonometriki.html. (In Russ.)
- Boush G.D., Kulikova O.M., Shelkov I.K. Agent modeling of cluster formation processes in regional economic systems. Economy of Regions, 2016, vol. 12, no. 1, pp. 64–77. DOI: https://doi.org/10.17059/2016-1-5. EDN: https://elibrary.ru/vqgxrb. (In Russ.)
- Trusova A.Yu., Litvinova A.Ju. Study of the field of education by means of econometric modeling. Vestnik Samarskogo universiteta. Ekonomika i upravlenie Vestnik of Samara University. Economics and Management, 2019, vol. 10, no. 3, pp. 71–78. Available at: https://elibrary.ru/item.asp?id=43137866. EDN: https://elibrary.ru/wadrne. (In Russ.)
- Lunyakova N.A., Lavrushin O.I., Lunyakov O.V. Clustering of the Federal Subjects of the Russian Federation by Deposit Risk Level. Economy of Regions, 2018, vol. 14, issue 3, pp. 1046–1060. DOI: http://doi.org/10.17059/2018-3-27.