Estadísticas y Big Data

21
¿Por qué el nombre "kernel" en estadísticas y ML?

Esto se ha preguntado en otros sitios de SE en el contexto de sistemas operativos y álgebra lineal, pero la misma pregunta me molesta con respecto a los métodos de kernel utilizados en estadísticas y aprendizaje automático. A menudo se dice que los núcleos, por ejemplo, en la estimación de...

20
¿Cuáles son los valores correctos para precisión y recuperación en casos extremos?

La precisión se define como: p = true positives / (true positives + false positives) ¿Es cierto que, como true positivesy false positivesenfoque 0, la precisión se aproxima a 1? La misma pregunta para recordar: r = true positives / (true positives + false negatives) Actualmente estoy...

20
¿Es correcto mi meteorólogo?

Una pregunta que me molestó por algún tiempo, que no sé cómo abordar: Todos los días, mi meteorólogo da un porcentaje de probabilidad de lluvia (supongamos que se calcula a 9000 dígitos y nunca ha repetido un número). Cada día posterior, llueve o no llueve. Tengo años de datos: posibilidad de...

20
Cómo combinar intervalos de confianza para un componente de varianza de un modelo de efectos mixtos cuando se usa la imputación múltiple

La lógica de la imputación múltiple (MI) es imputar los valores faltantes no una vez sino varias (típicamente M = 5) veces, lo que resulta en M conjuntos de datos completados. Los M conjuntos de datos completados se analizan luego con métodos de datos completos sobre los cuales se combinan las...

20
Buen recurso para entender ANOVA y ANCOVA?

Estoy realizando experimentos para un artículo y estoy buscando un libro / sitio web interesante para comprender correctamente cómo funcionan ANOVA y ANCOVA. Tengo buenos conocimientos matemáticos, así que no necesariamente necesito una explicación vulgar. También me gustaría saber cómo determinar...

20
Ajuste para covariables en el análisis de curva ROC

Esta pregunta trata sobre la estimación de puntajes de corte en un cuestionario de detección multidimensional para predecir un punto final binario, en presencia de escalas correlacionadas. Me preguntaron sobre el interés de controlar las puntuaciones secundarias asociadas al diseñar puntajes de...