Наш аналіз показує, що для ймовірнісних розподілів зі скінченною опорою стабільність кластеризації k-середніх залежить виключно від кількості оптимальних рішень основної проблеми оптимізації для розподілу даних.
Зокрема, стабільність K-означає кластеризацію залежить вiд кiлькостi функцiй h ∈ HK з мiнiмальним математичним сподіванням Eh. Зауважте, що кількість мінімізаторів залежить лише від P і K, а не від даних. Оскільки Z замкнуте, кількість мінімізаторів принаймні одна.
Міри стабільності оцінити стабільність результату кластеризації, порівнюючи його з кластерами, отриманими шляхом видалення одного стовпця за раз. Ці показники включають середню частку неперекриття (APN), середню відстань (AD), середню відстань між середніми (ADM) і показник добротності (FOM).
Після представлення процесу алгоритму K-середніх ми пояснюємо чотири його недоліки: чутливість до початкових умов, труднощі у визначенні. , нездатність обробляти категоричні дані та ефективність великих наборів даних і даних великої розмірності.
Ми аналізуємо стабільність кластеризації в статистичній системі. Передбачається, що набір даних S складається з n точок даних X1,…,Xn, які були намальовані незалежно від деякого невідомого базового розподілу P у деякому просторі X. Кінцева мета полягає в тому, щоб скористайтеся цими зразковими точками, щоб побудувати хороший розділ основного простору X.
Розрахунок константи стійкості (log K). Константа стійкості (log K) становить константа рівноваги для утворення комплексу в розчині. Це міра сили взаємодії між реагентами, які об’єднуються, утворюючи комплекс.
Коефіцієнт стабільності Роллетта є одним із способів отримати інформацію про те, чи виникнуть у вас проблеми чи ні. Коефіцієнт K, який перевищує одиницю, говорить про те, що ваш підсилювач безумовно стабільний. Якщо K менше 1, у вас можуть бути проблеми.