Preguntas etiquetadas con missing-data

15
¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?

Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de...

15
La precisión de la máquina de aumento de gradiente disminuye a medida que aumenta el número de iteraciones

Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <-

14
¿Puedo reconstruir una distribución normal a partir del tamaño de la muestra y los valores mínimo y máximo? Puedo usar el punto medio para representar la media

Sé que esto podría ser un poco complicado, estadísticamente, pero este es mi problema. Tengo muchos datos de rango, es decir, el tamaño mínimo, máximo y de muestra de una variable. Para algunos de estos datos también tengo una media, pero no muchos. Quiero comparar estos rangos entre sí para...

12
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?

Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <-...

12
80% de datos faltantes en una sola variable

Hay una variable en mis datos que tiene el 80% de los datos faltantes. Faltan los datos debido a la inexistencia (es decir, cuánto préstamo bancario debe la empresa). Me encontré con un artículo que decía que el método de ajuste variable ficticio es la solución para este problema. ¿Significa que...

12
Técnicas para manejar datos incompletos / faltantes

Mi pregunta está dirigida a técnicas para tratar datos incompletos durante el clasificador / entrenamiento modelo / ajuste. Por ejemplo, en un conjunto de datos con unos cientos de filas, cada fila tiene cinco dimensiones y una etiqueta de clase como último elemento, la mayoría de los puntos de...

11
R / mgcv: ¿Por qué los productos tensoriales te () y ti () producen superficies diferentes?

El mgcvpaquete Rtiene dos funciones para ajustar las interacciones del producto tensorial: te()y ti(). Entiendo la división básica del trabajo entre los dos (ajustar una interacción no lineal versus descomponer esta interacción en efectos principales y una interacción). Lo que no entiendo es por...

11
¿Cómo manejar datos inexistentes (que no faltan)?

Nunca he encontrado ningún buen texto o ejemplos sobre cómo manejar datos 'inexistentes' para entradas a cualquier tipo de clasificador. He leído mucho sobre datos faltantes, pero qué se puede hacer sobre los datos que no pueden existir o no existen en relación con las entradas multivariadas....