Estadísticas y Big Data

9
¿Cómo llevar a cabo múltiples pruebas de chi-cuadrado post-hoc en una mesa de 2 X 3?

Mi conjunto de datos está compuesto por la mortalidad total o la supervivencia de un organismo en tres tipos de sitios, costero, medio canal y en alta mar. Los números en la tabla a continuación representan el número de sitios. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20...

9
Agrupación de espacio eficiente

La mayoría de los algoritmos de agrupación que he visto comienzan con la creación de una distancia de cada uno entre cada punto, lo que se vuelve problemático en conjuntos de datos más grandes. ¿Hay alguno que no lo haga? ¿O lo hace en algún tipo de enfoque parcial / aproximado / escalonado? ¿Qué...

9
Ciclismo en algoritmo k-means

Según wiki, el criterio de convergencia más utilizado es "la asignación no ha cambiado". Me preguntaba si el ciclismo puede ocurrir si usamos ese criterio de convergencia. Me agradaría si alguien señalara una referencia a un artículo que dé un ejemplo de ciclismo o pruebe que esto es...

9
Técnicas de categorización / segmentación

Primero, permítanme decir que estoy un poco fuera de mi alcance aquí, así que si esta pregunta necesita ser reformulada o cerrada como un duplicado, háganmelo saber. Puede ser simplemente que no tengo el vocabulario adecuado para expresar mi pregunta. Estoy trabajando en una tarea de procesamiento...