Estadísticas y Big Data

15
Funciones de influencia y OLS

Estoy tratando de entender cómo funcionan las funciones de influencia. ¿Podría alguien explicar en el contexto de una regresión OLS simple yyo= α + β⋅ xyo+ εyoyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} donde quiero la función de influencia para...

15
Aplicando regresión logística con baja tasa de eventos

Tengo un conjunto de datos en el que la tasa de eventos es muy baja (40,000 de ). Estoy aplicando regresión logística en esto. He tenido una discusión con alguien donde se descubrió que la regresión logística no daría una buena matriz de confusión en datos de tan baja tasa de eventos. Pero debido...

15
Cómo calcular la varianza de una partición de variables

Estoy ejecutando un experimento en el que estoy reuniendo muestras (independientes) en paralelo, calculo la varianza de cada grupo de muestras y ahora quiero combinar todo para encontrar la varianza total de todas las muestras. Me está costando encontrar una derivación para esto, ya que no estoy...

15
Selección de penalización óptima para lazo

¿Hay resultados analíticos o documentos experimentales con respecto a la elección óptima del coeficiente del término de penalización ℓ1ℓ1\ell_1 ? Por óptimo , me refiero a un parámetro que maximiza la probabilidad de seleccionar el mejor modelo, o que minimiza la pérdida esperada. Pregunto porque a...

15
Cómo NO usar estadísticas

Esta es una especie de pregunta abierta pero quiero ser claro. Dada una población suficiente, es posible que pueda aprender algo (esta es la parte abierta) pero, sea lo que sea que aprenda sobre su población, ¿cuándo es aplicable a un miembro de la población? Por lo que entiendo de las...

15
¿Cómo funciona la normalización cuantil?

En los estudios de expresión génica que utilizan microarrays, los datos de intensidad deben normalizarse para poder comparar las intensidades entre individuos, entre genes. Conceptualmente y algorítmicamente, ¿cómo funciona la "normalización de cuantiles" y cómo se lo explicaría a un no...

15
CDF elevado a un poder?

Si FZFZF_Z es un CDF, parece que FZ(z)αFZ(z)αF_Z(z)^\alpha ( α > 0α>0 0\alpha \gt 0 ) también es un CDF. P: ¿Es este un resultado estándar? P: ¿Hay una buena manera de encontrar una función ggg con X≡g(Z)X≡g(Z)X \equiv g(Z) st FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alpha , donde...