Прохорова В.В.,
кандидат економічних наук, доцент
Харківський
національний економічний університет
Шакіна М.Ю.,
студентка Харківського торговельно–економічного інституту КНТЕУ
Кластерний
аналіз підприємств за рівнем фінансової стійкості
Кластерний аналіз – це
сукупність методів, що дозволяють класифікувати багатомірні спостереження,
кожне з яких описується набором вихідних змінних Х1, Х2.....Хn.
Метою кластерного аналізу є утворення груп схожих між собою об'єктів, які
прийнято називати кластерами. Слово кластер англійського походження (cluster),
переводиться воно як згусток, пучок, група. Родинні поняття, використовувані в
літературі – клас, таксон, згущення.
Методи кластерного аналізу
дозволяють вирішувати наступні завдання:
·
проведення
класифікації об'єктів з урахуванням ознак, що відображають сутність, природу
об'єктів. Рішення такого завдання, як правило, приводить до поглиблення знань
про сукупність класифікованих об'єктів;
·
перевірка висунутих
припущень про наявність
деякої структури в досліджуваній сукупності об'єктів, тобто пошук існуючої структури;
·
побудова
нових класифікацій для маловивчених явищ, коли необхідно встановити наявність
зв'язків усередині сукупності й намагатися привнести в неї структуру.
Існують наступні групи методів
кластерного аналізу:
1) ієрархічні методи;
2) ітеративні методи;
3) факторні методи;
4) методи згущень;
5) методи, що використовують
теорію графів.
До найпоширенішим в економіці відносять ієрархічні й
ітеративні.
Для проведення класифікації
необхідно ввести поняття подібності об'єктів за спостережуваними змінними. У
кожний кластер (клас, таксон) повинні потрапити об'єкти, що мають подібні
характеристики.
Якщо алгоритм кластеризації
заснований на вимірі подібності між змінними, то в якості міри подібності
можуть бути використані:
·
відстань;
·
лінійні
коефіцієнти кореляції;
·
коефіцієнти
рангової кореляції;
·
коефіцієнти
контингенції й т.д.
Залежно від типів вихідних змінних вибирається один з
видів показників, що характеризують близькість між ними.
Вибір відстані між об'єктами є
вузловим моментом дослідження, від нього багато в чому залежить остаточний
варіант розбивки об'єктів на класи при даному алгоритмі розбивки.
У кластерном
аналізі для кількісної оцінки подібності вводиться поняття метрики. Подібність
або розходження між класифікованими об'єктами встановлюється залежно від
метричної відстані між ними. Якщо кожний об'єкт описується k ознаками, то він
може бути представлений як точка в k-мірному просторі, і подібність із іншими
об'єктами буде визначатися як відповідна відстань. У кластерному аналізі
використаються різні міри відстані між об'єктами:
1) Евклідова
відстань: (3.12)
2) взважена
Евклідова відстань: (3.13)
3) відстань city-block: (3.14)
4) відстань Московського: (3.15)
5) відстань
Махаланобіса: (3.16)
де dij— відстань між i-м и j-м
об’єктами;
xik, xjk — значення k-й змінної відповідно у i-го та j-го
об’єктів;
Xi,Xj— вектори значень змінних у i-го та j-го об’єктів;
S*— загальна коваріаційна матриця;
wk — вага, що приписується k-й змінній.
Алгоритм ієрархічного агломеративного
кластерного аналізу можна представити у
вигляді послідовності процедур:
1) нормуються вихідні дані;
2) розраховується матриця
відстаней або матриця мір подібності;
3) перебуває пара
найближчих кластерів, по обраному
алгоритмі поєднуються ці два кластери. Новому кластеру привласнюється менший з
номерів поєднуваних кластерів;
4) процедури 2, 3 і 4
повторюються доти, поки всі об'єкти не будуть об'єднані в один кластер або до
досягнення заданого "порогу" подібності.
До ітеративних методів
угруповання відноситься метод k-середніх зручний для обробки великих
статистичних сукупностей. Обчислювальні процедури більшості ітеративних методів
класифікації зводяться до виконання наступних кроків:
1. Вибір числа кластерів, на
які повинна бути розбита сукупність, завдання первісної розбивки об'єктів і
визначення центрів ваги кластерів.
2. Відповідно до обраних мір подібності визначення нового
складу кожного кластера.
3. Після повного перегляду всіх
об'єктів і розподілу їх по кластерах здійснюється перерахування центрів ваги
кластерів.
4. Процедури 2 і 3 повторюються
доти , поки наступна ітерація не дасть такий же склад кластерів, що й
попередня.