здравствуйте, Юлия Валентиновна! Спасибо за проявленный к содержанию моих тезисов интерес, а также - за Ваш вопрос.
Отвечаю: 1) кластерный-анализ: Сам я его не выполнял. Я взял готовый результат из мощной работы за 2018г: ( Е.Ю.Меркулова et al https://doi.org/10.24891/ea.17.11.2066 - пункт 3 моей библиографии). Они брали совсем много показателей в 5-6 разных направлениях качества жизни населения.
В итоге они одним из иеарархических алгоритмов -- или в пакете Statistica фирмы StatSoft ( www.statistica.ru ) в пакете SPSS (всем известной фирмы IBM): www.spss.ru -- построили дендрограмму (в виде перевёрнутого дерева, с 82-85 "веточками-регионами" в её основании).
Там в самой левой её части находится тот подкластер (группа),состоящая из 13-ти регионов, (почти все они или из ЦФО или ПФО и еще там были Ленинградская и Волгоградская области.). Из них мною взяты 7 регионов, которые -- в графиках и таблице моей публикации.
2) промежутки времени:
Модель 1 (для всех 17ти областей ЦФО) строилась по данным Росстата за 2014-19 гг. Т.к . большая часть факторных объясняющих переменных имела лаги в 1-2 года, значит брались и некоторые региональные данные Росстата за 2012-13гг. А так как входила агрегированная переменная по дорожно-транспортной инфраструктуре, что бралась с лагом 2 года, то для нее были взяты еще и данные за 2010-2011..-2017г. В итоге, для построения модели были использованы данные с 2010 по 2019гг А потом (мы с соавторами работы DOI: 10.19181/lsprr.2022.18.4.3) сделали прогноз на 2020-21г (для него взяты данные за 2020-21гг (см. там Рис.1 на стр 460 и таблю4 на стр.461)
Модель 2 (см про неё подробнее прилож.. DOC-файл -здесь ещё объясняется как считалась переменная по инфраструктуре Он есть на http://econproblem.volnc.ru в секции 1 в моем докладе и выйдет в РИНЦ в 3-м квартале 2023 это [6] в моих источниках , в тезисах) Взяты 11 регионов ПФО за 2015-20гг (кроме двух республик и Ульяновской обл) и получилась несбалансированная панель из 74 наблюдений над 11 регионами ПФО.
Модель 3 (по ОПЖ) Для построения pool -модели регрессии по панельным данным , мною взяты все 14 регионов ПФО (на промежутке 2014-19гг ) И тогда 14*6= 84 наблюдения, (т.е. здесь была "сбалансированная панель"). Т.к. в 2020-21гг структура смертности резко изменилась из за пандемии, прогноз на этих 14ти регионах сделал назад, на 2013 год. А для некоторых потом сделал и на 2022 год. Эта модель у меня хорошо работала и для 8ми регионов ЦФО в отрезке 2014-2019г, для 5 регионов СЗФО, для 1-2 регионов ЮФО, для многих регионов СФО и УФО и даже для некоторых из ДФО. ( Буквально "на днях", на сайте https://ur.guu.ru выйдет моя публикация на эту тему 6-7 стр в Уорде. И она будет в РИНЦ через 1,5 месяца,а сборник будет иметь DOI )
Stepanov_(to_VolNC_19-v-23).doc