« Algoritmo A* « || Inicio || » Mapas semánticos: cla… »

Clustering por K-medias

Última modificación: 5 de Septiembre de 2015, y ha tenido 4270 vistas

Etiquetas utilizadas: || ||

El algoritmo de las K-medias (presentado por MacQueen en 1967) es uno de los algoritmos de aprendizaje no supervisado más simples para resolver el problema de la clusterización. El procedimiento aproxima por etapas sucesivas un cierto número (prefijado) de clusters haciendo uso de los centroides de los puntos que deben representar.

El algoritmo se compone de los siguientes pasos::

  1. Sitúa \(K\) puntos en el espacio en el que "viven" los objetos que se quieren clasificar. Estos puntos representan los centroides iniciales de los grupos.
  2. Asigna cada objeto al grupo que tiene el centroide más cercano.
  3. Tras haber asignado todos los objetos, recalcula las posiciones de los \(K\) centroides.
  4. Repite los pasos 2 y 3 hasta que los centroides se mantengan estables. Esto produce una clasificación de los objetos en grupos que permite dar una métrica entre ellos.

Aunque se puede probar que este algoritmo siempre termina, no siempre la distribución que se alcanza es la más óptima, ya que es muy sensible a las condiciones iniciales.

Puedes obtener más información en el yutzu asociado:

« Algoritmo A* « || Inicio || » Mapas semánticos: cla… »