K-Means Golf agrupado

8

Agrupación de K-medias ( Wikipedia )

La tarea aquí es bastante simple: realizar una única iteración de un algoritmo de agrupación k-means en una matriz binaria. Esta es esencialmente la tarea de configuración para el algoritmo principal de k-means, sentí que la configuración podría ser más fácil y atraer a los idiomas de golf para que también lo intenten. La matriz que le pasamos tendrá el siguiente formato:

 0 0 0 0 0 0 0 0 1
 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 1
 0 0 1 0 0 0 0 0 0
 0 0 0 0 0 1 0 0 1
 0 0 0 0 0 0 0 0 0
 0 1 0 0 0 0 0 0 0
 0 1 0 0 0 1 0 0 0
 0 1 0 0 0 0 0 0 1
 0 0 0 0 0 0 0 0 0

1 representa un punto, mientras que 0 representa una falta de puntos. Su trabajo será generar aleatoriamente k-1centroides y realizar el agrupamiento inicial de los datos alrededor de los centroides que ha generado. kse define como min(grid#Width, grid#Height)-1. El etiquetado de cada centroide debe ir desde 2hasta k. Por ejemplo, en estos escenarios podría generar los siguientes centroides:

Centroid 2 was generated at: (1.0, 4.0)
Centroid 3 was generated at: (1.0, 5.0)
Centroid 4 was generated at: (5.0, 1.0)
Centroid 5 was generated at: (3.0, 3.0)
Centroid 6 was generated at: (0.0, 2.0)
Centroid 7 was generated at: (6.0, 6.0)
Centroid 8 was generated at: (2.0, 6.0)

Después de generar los centroides, debe recorrer todos y cada uno de los puntos marcados con a 1, ya que podemos tratar los marcados con 0un espacio vacío. Para cada centroide, debe decidir qué centroide es el más cercano al punto en cuestión. Aquí están las distancias para el ejemplo:

(0,8) distance from centroid 2 is 4.123105625617661
(0,8) distance from centroid 3 is 3.1622776601683795
(0,8) distance from centroid 4 is 8.602325267042627
(0,8) distance from centroid 5 is 5.830951894845301
(0,8) distance from centroid 6 is 6.0
(0,8) distance from centroid 7 is 6.324555320336759
(0,8) distance from centroid 8 is 2.8284271247461903
(1,1) distance from centroid 2 is 3.0
(1,1) distance from centroid 3 is 4.0
(1,1) distance from centroid 4 is 4.0
(1,1) distance from centroid 5 is 2.8284271247461903
(1,1) distance from centroid 6 is 1.4142135623730951
(1,1) distance from centroid 7 is 7.0710678118654755
(1,1) distance from centroid 8 is 5.0990195135927845
(2,8) distance from centroid 2 is 4.123105625617661
(2,8) distance from centroid 3 is 3.1622776601683795
(2,8) distance from centroid 4 is 7.615773105863909
(2,8) distance from centroid 5 is 5.0990195135927845
(2,8) distance from centroid 6 is 6.324555320336759
(2,8) distance from centroid 7 is 4.47213595499958
(2,8) distance from centroid 8 is 2.0
(3,2) distance from centroid 2 is 2.8284271247461903
(3,2) distance from centroid 3 is 3.605551275463989
(3,2) distance from centroid 4 is 2.23606797749979
(3,2) distance from centroid 5 is 1.0
(3,2) distance from centroid 6 is 3.0
(3,2) distance from centroid 7 is 5.0
(3,2) distance from centroid 8 is 4.123105625617661
(4,5) distance from centroid 2 is 3.1622776601683795
(4,5) distance from centroid 3 is 3.0
(4,5) distance from centroid 4 is 4.123105625617661
(4,5) distance from centroid 5 is 2.23606797749979
(4,5) distance from centroid 6 is 5.0
(4,5) distance from centroid 7 is 2.23606797749979
(4,5) distance from centroid 8 is 2.23606797749979
(4,8) distance from centroid 2 is 5.0
(4,8) distance from centroid 3 is 4.242640687119285
(4,8) distance from centroid 4 is 7.0710678118654755
(4,8) distance from centroid 5 is 5.0990195135927845
(4,8) distance from centroid 6 is 7.211102550927978
(4,8) distance from centroid 7 is 2.8284271247461903
(4,8) distance from centroid 8 is 2.8284271247461903
(6,1) distance from centroid 2 is 5.830951894845301
(6,1) distance from centroid 3 is 6.4031242374328485
(6,1) distance from centroid 4 is 1.0
(6,1) distance from centroid 5 is 3.605551275463989
(6,1) distance from centroid 6 is 6.082762530298219
(6,1) distance from centroid 7 is 5.0
(6,1) distance from centroid 8 is 6.4031242374328485
(7,1) distance from centroid 2 is 6.708203932499369
(7,1) distance from centroid 3 is 7.211102550927978
(7,1) distance from centroid 4 is 2.0
(7,1) distance from centroid 5 is 4.47213595499958
(7,1) distance from centroid 6 is 7.0710678118654755
(7,1) distance from centroid 7 is 5.0990195135927845
(7,1) distance from centroid 8 is 7.0710678118654755
(7,5) distance from centroid 2 is 6.082762530298219
(7,5) distance from centroid 3 is 6.0
(7,5) distance from centroid 4 is 4.47213595499958
(7,5) distance from centroid 5 is 4.47213595499958
(7,5) distance from centroid 6 is 7.615773105863909
(7,5) distance from centroid 7 is 1.4142135623730951
(7,5) distance from centroid 8 is 5.0990195135927845
(8,1) distance from centroid 2 is 7.615773105863909
(8,1) distance from centroid 3 is 8.06225774829855
(8,1) distance from centroid 4 is 3.0
(8,1) distance from centroid 5 is 5.385164807134504
(8,1) distance from centroid 6 is 8.06225774829855
(8,1) distance from centroid 7 is 5.385164807134504
(8,1) distance from centroid 8 is 7.810249675906654
(8,8) distance from centroid 2 is 8.06225774829855
(8,8) distance from centroid 3 is 7.615773105863909
(8,8) distance from centroid 4 is 7.615773105863909
(8,8) distance from centroid 5 is 7.0710678118654755
(8,8) distance from centroid 6 is 10.0
(8,8) distance from centroid 7 is 2.8284271247461903
(8,8) distance from centroid 8 is 6.324555320336759

El resultado final del algoritmo de agrupamiento es que no debe haber 1s restantes en la matriz, solo números de centroide. Es por eso que era importante etiquetar los centroides 2-k+1, lo que nos permite reemplazarlos de la siguiente manera:

 0 0 0 0 0 0 0 0 8
 0 6 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 8
 0 0 5 0 0 0 0 0 0
 0 0 0 0 0 5 0 0 7
 0 0 0 0 0 0 0 0 0
 0 4 0 0 0 0 0 0 0
 0 4 0 0 0 7 0 0 0
 0 4 0 0 0 0 0 0 7
 0 0 0 0 0 0 0 0 0

Este es el diseño de agrupación inicial para 7 centroides en la cuadrícula proporcionada, dados los centroides generados aleatoriamente. Su trabajo es generar la versión en clúster de la cuadrícula de entrada binaria.

Reglas

  • Los k-1centroides deben generarse aleatoriamente y deben estar en cualquier lugar desde (0,0)hasta (grid#Width, grid#Height).
    • El valor de kes min(grid#Width, grid#Height)-1.
    • Los centroides generados DEBEN estar numerados de 2a k.
  • El formato de entrada DEBE ser una cuadrícula de 0s y 1s, donde 0s representan espacios vacíos y 1s representan puntos.
    • Una cuadrícula es una cadena que usa 1 carácter por celda y \ncomo delimitadores de fila o una matriz 2D.
    • No se garantiza que la cuadrícula aprobada sea cuadrada, pero se garantiza que no estará vacía.
  • La salida final puede usar matrices o una cadena delimitada.
  • El código más corto gana, este es el .
Urna de pulpo mágico
fuente
1
Relacionados .
millas

Respuestas:

1

Mathematica 109 Bytes

Si entiendo la pregunta correctamente, algo como esto debería funcionar. "KMeans" es uno de los métodos integrados para FindClusters y ClusteringComponents.

SparseArray[Thread[(p=Position[#,1])->1+ClusteringComponents[p,Min[d=Dimensions@#]-1,1,Method->"KMeans"]],d]&

Uso: %@in//MatrixFormpara obtener visualización, ines una matriz de enteros.

Kelly Lowder
fuente