Numerical Cruncher



Clustering


Algoritmo de las K Medias



El algoritmo de las K medias (o K-Means, J.B. MacQueen, 1967) es probablemente el algoritmo de agrupamiento más conocido. Es un método de agrupamiento heurístico con número de clases conocido (K). El algoritmo está basado en la minimización de la distancia interna (la suma de las distancias de los patrones asignados a un agrupamiento al centroide de dicho agrupamiento). De hecho, este algoritmo minimiza la suma de las distancias al cuadrado de cada patrón al centroide de su agrupamiento.

El algoritmo es sencillo y eficiente. Además, procesa los patrones secuencialmente (por lo que requiere un almacenamiento mínimo). Sin embargo, está sesgado por el orden de presentación de los patrones (los primeros patrones determinan la configuración inicial de los agrupamientos) y su comportamiento depende enormemente del parámetro K.


ALGORITMO DE LAS K MEDIAS


Seleccionar arbitrariamente una configuración inicial de los clusters

Repetir

Hasta que no cambien los centros de los clusters