научная статья по теме Компьютерная технология классификации банков банковского сектора России Экономика и экономические науки

Текст научной статьи на тему «Компьютерная технология классификации банков банковского сектора России»

со s

с; <

i <

.о i

Компьютерная технология классификации банков банковского сектора России

Computer Technology for Bank Classification in the Russian Banking Sector

УДК 336.7:004

Ш

О ^

О ш т

ш

I-<

Банников Валерий Аркадьевич

доцент Московской школы экономики Московского государственного университета им. М. В. Ломоносова, кандидат физико-математических наук, доцент 119991, Москва, Ленинские горы, д. 1, стр. 61

Bannikov Valeriy Arkad'evich

Moscow State University's Moscow School of Economics

Leninskie gory 1/6, Moscow, Russian Federation, 119991

Цель. Описать компьютерную технологию классификации банков России с целью последующего ее использования для разработки финансовой стратегии развития на основе ранжирования банков, их классификации и на основе построения сценариев развития для краткосрочного и среднесрочного прогнозирования.

Материалы и методы. В статье представлена компьютерная технология классификации участников банковского сектора России с применением эконометрического пакета программ Stata методом кластерного анализа ^-средних. Анализ проведен с использованием выборки по 11 показателям деятельности 740 российских банков в 2008-2013 гг.

Результаты. В соответствии с разработанным автором алгоритмом на основе показателя «размер банка» проведена классификация банков России и выделены 10 групп наблюдений, или кластеров. Для определения числа кластеров использовался CH-индекс кластеризации. Из каждого кластера для исследования функционирования выбраны сходные по величине в кластере банко-годы, а затем с целью изучения динамики рыночной конъюнктуры банков и динамики их переходов в кластерах проведены сравнения переходов из одного кластера в другой по годам.

По результатам кластеризации построена обучающая выборка, предназначенная для дальнейшего применения дискриминантного анализа с целью оценки прогностических вероятностей принадлежности новых банко-годов каждому из 10 кластеров и построения сценариев развития для финансовой стратегии банковского сектора России.

Ключевые слова: метод главных компонент, кластерный анализ, компактность кластеров, метод ^-средних, CH-индекс кластеризации, методы кластеризации, дискриминантный анализ, обучающая выборка

Aim. This study describes computer technology for bank classification in Russia, aiming at its subsequent use for developing financial strategies based on the ranking of banks, and presents a bank classification system based on constructing scenarios for short-term and medium-term forecasting.

Materials and methods. This study employs the k-means method of cluster analysis and an econometric software package (Stata) to present a computer technology for bank classification in Russia. A sample of 11 indicators of the 740 Russian banks in 2008-2013 was employed to conduct the analysis.

Results. Based on an algorithm developed by the author according to the "size of bank" indicator, banks were classified and subdivided into 10 groups or clus-

ters. CH-clustering index was employed to determine the number of clusters.

From each cluster, bank years that were comparable in volume for the given cluster were selected to examine the functioning of banks. Then, transitions were compared year-by-year to examine the dynamics of banks' market situation and their transition from one cluster to another.

According to the results of the clustering, a learning set was designed for further applications of discriminant analysis to assess the probability for future bank years to belong to one of the 10 clusters and to develop scenarios for creating a financial strategy for the Russian banking sector.

Keywords: method of principal components, cluster analysis, compact clusters, fc-means method, CH-clus-tering index, clustering techniques, discriminant analysis, learning set

1. Введение

В исследовании финансовой стратегии того или иного сектора экономики в настоящее время все шире применяются компьютерные технологии эконометрики и математические методы. При написании данной статьи использовались компьютерные технологии с применением эконометрического пакета программ Stata, задействованного в обучении студентов магистратуры по программам I и II курсов в Московской школе экономики МГУ.

В нашем исследовании была проанализирована выборка данных о деятельности 740 российских банков в 2008-2013 гг. Все финансовые показатели имеют одни и те же единицы измерения (тыс. руб. в сопоставимых ценах 2007 г.), рассчитанные с помощью дефлятора, используя значения базового индекса инфляции Росстата. Совокупность 11 исходных показателей выбрана на основе баланса банка.

Ниже приводится список финансово-экономических показателей (переменных) деятельности банков, которые были выбраны нами в качестве исходных показателей для свертки информации методом главных компонент и применения кластерного анализа.

Код переменной

1. assets — активы банка, всего.

2. corp_credit — портфель кредитов банка корпоративным клиентам, включая просроченную задолженность.

3. ret_credit — портфель кредитов банка физическим лицам, включая просроченную задолженность.

4. corp_deposit — объем депозитов корпоративных клиентов банка.

5. ret_deposit — объем депозитов физических лиц.

6. provis_income — доходы банка от восстановления резервов.

7. nperc_income — чистые процентные доходы банка.

8. сошт1з_п1псоше — чистые комиссионные доходы банка.

9. о"ЬЬег_п1псоше — чистые прочие доходы банка.

10. орег_ехрепзеэ — операционные расходы банка.

11. регс_ехрепзеэ — процентные расходы банка.

В результате применения компьютерной технологии свертки информации методом главных компонент в первом приближении была вычислена первая главная компонента, условно названная «размер банка», которая объясняет 97,18% информации, содержащейся в совокупности всех 11 исходных показателей, что является оценкой свертки информации высокого качества.

В настоящей статье описана компьютерная технология кластерного анализа в первом приближении классификации банков России (разделение на кластеры (группы) банков) на основе первой главной компоненты. Первая главная компонента представляет собой обобщенный показатель, синтезирующий разносторонние особенности функционирования банковского сектора, которые измеряются совокупностью выбранных исходных показателей. Она была использована для ранжирования банков.

Применяемый метод классификации (кластерный анализ) предназначен для определения «естественных» кластеров наблюдений. В нашем случае наблюдение представляется «банко-годом» — результатами функционирования банка в соответствующем году. Мы идентифицируем число кластеров и их состав в виде «подобных (похожих) по размеру» банко-годов.

Процесс разбиения множества наблюдений на кластеры, т. е. процесс кластеризации, реализуется таким образом, чтобы значения первой главной компоненты по наблюдениям внутри кластеров были максимально близкими (свойство компактности кластеров), а значения первой главной компоненты по наблюдениям в разных кластерах имели бы максимальные различия (свойство отделяемости кластеров друг от друга).

Сначала в выбранном диапазоне изменения числа кластеров мы реализуем алгоритм кластерного анализа последовательным применением метода ^-средних с вычислением значений СН-индекса кластеризации. Затем по правилу остановки на основе максимального значения СН-индекса определим оптимальное «естественное» число кластеров и выберем для него полученное в процессе кластеризации решение. Далее мы представим характеристики полученных кластеров в порядке убывания значений первой главной компоненты, «размера банков», по годам с 2008-го по 2013 г. Из каждого кластера выберем для сравнения несколько «типичных по размеру» банко-годов с целью изучения рыночной конъюнктуры «типичных по размеру» в кластерах банко-годов. Для получения некоторого визуального представления о «размере банка» в динамике для нескольких банков построим объединенные графики значений для первой главной компоненты и для пяти выбранных наиболее важных переменных по 6 годам.

2. Кластерный анализ

Кластерный анализ относится к методам классификации без обучения. Методы кластерного анализа предназначены для определения «естественных» кластеров (групп) наблюдений. Кластеризация — это процесс разбиения множества наблюдений в многомерном пространстве переменных на кластеры таким образом,

чтобы значения переменных по наблюдениям внутри ™ одного и того же кластера были максимально близ- ^ кими (свойство компактности кластеров), а значения ^ переменных по наблюдениям в разных кластерах име- >х ли бы максимальные различия (свойство разделения ^ (отделимости) кластеров) [1, р. 708]. 2

В кластерном анализе отсутствует понятие «р-зна- £ чения», присутствующее во многих областях экономе- ^ трики, в моделировании и прогнозировании. Поэтому ш он рассматривается как исследовательская методика ^ анализа данных. Методы кластеризации в значитель- < ной степени предназначены для генерирования гипо- о тез, а не их тестирования. ^

Существует большое количество различных ме- ш тодов кластерного анализа. Первым основным по- о нятием в кластерном анализе является расстояние ^ между наблюдениями, вторым — расстояние между о кластерами наблюдений. о

В большинстве методов кластерного анализа для ^ определения сходства или различия между наблюде- ^ ниями применяются разнообразные меры расстояния. 2 Многие из применяемых в кластерном анализе мер не ^ удовлетворяют определению функции метрического 2 расстояния, и поэтому вместо расстояния употребляются общие термины «мера различия» и «мера сходства».

Существует бесконечное количество мер сходства и мер различия. В нашем случае классификации банков мы будем применять только функции расстояния й(х¡, х¡) между наблюдениями х1 и хОпределение функции расстояния (метрики) см., н апример, у Б. Дю-рана и П. Оделла [2].

В кластерном анализе могут быть минимальные, максимальные и средние расстояния между кластерами наблюдений (или расстояния ближнего, дальнего и среднего соседа соответственно [3]). Они вычисляются путем перебора всех возможных

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком