ИСПОЛЬЗОВАНИЕ МЕТОДА БУТСТРЕП ДЛЯ ВОССТАНОВЛЕНИЯ МАТРИЦЫ ПЕРЕХОДОВ

КАБАНОВА И.А.; СТАРОВЕРОВ О.В.

ЭКОНОМИКА И МАТЕМАТИЧЕСКИЕ МЕТОДЫ, 2007, том 43, № 1, с. 76-86

МАТЕМАТИЧЕСКИЙ АНАЛИЗ ЭКОНОМИЧЕСКИХ МОДЕЛЕЙ

ИСПОЛЬЗОВАНИЕ МЕТОДА БУТСТРЕП ДЛЯ ВОССТАНОВЛЕНИЯ

МАТРИЦЫ ПЕРЕХОДОВ*

(Москва)

Рассматривается метод восстановления матрицы переходов работников, находящихся в разных отраслевых группах. Прогнозирование производится при отсутствии данных о переходах работников между группами. Имеются лишь наблюдения над структурой занятого в этих группах населения для некоторого числа последовательных моментов времени. Приводится числовой пример, основанный на реальных данных, для проверки возможности прогнозирования.

ВВЕДЕНИЕ

Изучение занятости в народном хозяйстве и прогнозирование ее межотраслевых связей и структуры по сферам деятельности - одна из основных задач экономики труда. Решение задачи занятости позволит эффективнее использовать рабочую силу, перераспределять ограниченные инвестиционные средства и повысить качество жизни населения, производительность труда, конкурентоспособность отраслей на мировом рынке, достичь заданных Президентом России темпов экономического роста России.

Рынок труда в России находится в постоянном движении - с одной стороны, структурная перестройка, вызванная радикальными экономическими реформами начала 1990-х годов, до сих пор так и не завершилась, а с другой стороны, растут требования к скорости и глубине реакции рынка труда на современные условия мирового экономического устройства: быстро меняющиеся технологии и нестабильность политической ситуации в мире.

Статистические ведомства многих стран, в том числе и России, способствуют изучению занятости, регулярно предоставляют сведения о численности работников по сферам деятельности. Обычное прогнозирование структуры занятых в этом случае строится на основе либо экономе-трических моделей, либо временных рядов следующим образом. Численности занятых в группах, сформированных из работников, занятых в разных отраслях народного хозяйства, образуют временные ряды, число которых равно числу рассматриваемых отраслей, и каждый ряд прогнозируется независимо от других временных рядов. Правда, в эконометрические модели добавляются еще эндогенные переменные. Одна из последних работ, встретившаяся авторам, была статья (Фиткулина, 2001). В этом же сборнике в докладе (Ликман, 2001) представлена работа, где временные ряды используются не для оценки числа занятых и безработных, а для числа прогнозирования родившихся и умерших.

Назовем основные проблемы, возникающие при таком методе прогнозирования:

- в переходный период число наблюдений бывает настолько малым, что возможно только линейное прогнозирование;

- часто сумма прогнозов численностей всех групп может быть не равна численности всего населения; для устранения этого несоответствия приходится использовать дополнительные гипотезы и допущения, что снижает достоверность получаемых результатов;

- невозможно понять связи между группами и их изменение во времени. Такой метод прогнозирования не отражает механизма взаимосвязи сфер деятельности человека.

Так появляется стремление к прогнозированию на основе проверенных моделей движения населения и трудовых ресурсов, которые учитывают связи между группами. Ведь именно взаимосвязь, т.е. межгрупповые потоки, позволяет не только лучше прогнозировать структуру, но и реально влиять на нее в нужном направлении, когда это бывает необходимо.

* Работа выполнена при финансовой поддержке Российского гуманитарного научного фонда (проект 98-02-02006).

О. В. Староверов

Следовательно, возникает задача выбора модели движения населения и трудовых ресурсов, которая отражает потоки между отраслевыми группами и обеспечена статистическими наблюдениями, позволяющими оценить все параметры модели.

Таким образом, проблема оценки взаимосвязей на основе данных о занятости по сферам народного хозяйства - одна из главных проблем статистики движения населения. К сожалению, занятость в отраслевом разрезе показывает лишь итог межотраслевых связей, а не сами эти связи, которые как раз необходимы. В результате недостатка информации, вытекающего из доступных для исследования наблюдений, сами связи не измеряются, и для их оценки приходится прибегать к подходящим, но не слишком сильным предположениям.

Цель настоящей работы - исследовать метод оценки параметров модели, учитывающей связи работников, занятых в разных сферах деятельности. Для этого нужно, в соответствии с постановкой задачи о взаимосвязи (Ли, Джадж, Зельнер, 1977), восстановить матрицу переходов по итоговым (макро) данным (численности или структуре занятых).

Следует отметить, что данные о взаимосвязях предоставляют органы статистики. Так, например, известно число переходов между регионами России (всего их 10, а вместе с Калининградской областью - 11). Но получение даже таких микроданных требует определенных затрат, и совершенно не ясно, не дешевле ли по макроданным восстановить микроданные, чем получать их статистическим путем. Поэтому вопрос об оценке переходных вероятностей в моделях движения людей по макроданным также не лишен смысла.

Наиболее исследованными являются марковские модели движения людей. Их использование в прогнозах более привлекательно как с содержательной точки зрения (они позволяют учитывать взаимосвязи между отраслями занятости (Бартоломью 1985; Староверов 1997)), так и со статистической (информация о переходах иногда дается статистическими органами). Отсюда возникает вторая задача: по восстановленным взаимосвязям составить прогноз структуры занятости и проверить его качество.

МОДЕЛЬ

Одной из самых простых, но вполне оправданных с практической и теоретической точек зрения является модель движения трудовых ресурсов, учитывающая направления переходов работников (т.е. связи между группами), и итог этих связей - численности или структуры групп населения. Марковские модели достаточно хорошо изучены теоретически и уже успешно зарекомендовали себя на практике (Бартоломью 1985; Староверов 1997). В этих моделях в качестве направлений перемещений (связи) рассматриваются вероятности перехода рц отдельного работника из группы I в группу Ц за время h, а итогом перемещения служат вероятности оказаться в любой из групп в момент t = Ш.

Пусть - наблюдаемый, поэтому случайный, вектор-столбец, каждая компонента vi(t) которого отражает число занятых в отрасли i и так же является случайной величиной. Обозначим математическое ожидание VI;) через х(;), тогда модель подвижности трудовых ресурсов, использующая марковские цепи (процессы), будет иметь вид:

х(; + И) = Ртх(;), (1)

ёх(;)/Л = Лтх(;), (2)

где (1) формула для модели с дискретным временем; И - единица времени Рт - переходная матрица, состоящая из рц > 0 и ^ .р^ = 1; (2) - формула для модели с непрерывным временем; Л -матрица интенсивностей переходов и ее элементы Хц > 0 при i Ф Ц и = 0. Матрицы Р и Л связаны соотношением Р = I + ЛИ, которое позволяет переходить от модели с дискретным временем при И —- 0 к модели с непрерывным временем и наоборот. Такие модели движения трудовых ресурсов обычно называются марковскими.

Предположения первой группы, приводящие к марковским моделям (моделям с межгрупповыми связями), описаны в (Староверов 1997), но одно предположение хотелось бы здесь рассмотреть. При малых интервалах времени И матрица вероятностей переходов, задающая средние потоки между группами, близка к единичной матрице I, поэтому матрица Л имеет неотрицательными лишь недиагональные элементы. Пусть марковская модель однородна в течение некоторого периода времени, т.е. матрица переходов Р не изменяется на протяжении всего периода И. Ниже будет показано, почему это предположение является одним из основных. Для Рос-

сии, особенно с учетом переходного характера ее экономики, однородность может оправдываться в течение 1 года (самое большее - в течение 2- или 3-летнего периода).

ОЦЕНКА ПАРАМЕТРОВ

В марковской модели с конечным числом групп (к) (в нашем случае - сфер деятельности или отраслей экономики) число параметров связей (межгрупповых или межотраслевых), т.е. интен-сивностей переходов или переходных вероятностей, будет равным к(к - 1) на каждом временном шаге h. Поэтому для определения этих к(к - 1) параметров не хватает 2к наблюдений х(г + И) и х(г) из модели (1). Нужно иметь, по крайней мере, к - 1 к-мерных наблюдений в области занятости.

Федеральная служба государственной статистики собирает сведения о численности занятых по отраслям раз в месяц. Однако далее предлагается оценивать параметры модели, учитывающей связи работников, на основе регулярно публикуемых годовых данных и сравнить их с имеющимися у Госкомстата России данными, а затем на основании полученных данных - построить прогноз ситуации на рынке труда. Возможно, такой подход окажется дешевле, и не придется ежемесячно собирать сведения. К тому же для целей прогнозирования подобный подход является более корректным, так как мы априори видим тренд, и нет необходимости проводить анализ "выбросов", которые появляются естественным образом, когда используются ежемесячные данные.

Подойдем более внимательно к вопросу о необходимых статистических данных, учитывая метод оценки параметров марковской модели. Действительно, пусть Р(Л) - искомая матрица переходных вероятностей (интенсивностей), которую нужно знать, так как именно в ней отражаются все взаимосвязи. Пусть s(t) - вектор (структура) занятых по их сферам деятельности, т.е. s(t) = = х(г)/М(г), где М(г) = е7х(г); е - единичный вектор-столбец, следовательно, М(г) - суммарное число занятых. Поскольку при неизменной1 (или мало меняющейся) во времени суммарной численности М(г) векторы s(t), служащие оценкой своих математических ожиданий р(г), близки к ним (т.е. к р(г)), то для р(г) из модели (1) справедливы равенства р(г + 1) = Р7р(г). Подставляя в последнее равенство известные s вместо неизвестных р, получим в соответствии с методом моментов для нескольких I систему уравнений:

Р7[«(г), s(t + И), s(t + И)] = № + И), s(t + 2И), s[t + (I + 1)И]}, (3)

из которой следует оценить элементы матрицы Р, что возможно лишь при I > к.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

научная статья по теме ИСПОЛЬЗОВАНИЕ МЕТОДА БУТСТРЕП ДЛЯ ВОССТАНОВЛЕНИЯ МАТРИЦЫ ПЕРЕХОДОВ Экономика и экономические науки

Текст научной статьи на тему «ИСПОЛЬЗОВАНИЕ МЕТОДА БУТСТРЕП ДЛЯ ВОССТАНОВЛЕНИЯ МАТРИЦЫ ПЕРЕХОДОВ»