Estadísticas y Big Data

15
Métricas para evaluar algoritmos de clasificación

Estoy interesado en ver varias métricas diferentes para los algoritmos de clasificación: hay algunas que figuran en la página de Wikipedia de Learning to Rank, que incluyen: • Precisión media promedio (MAP); • DCG y NDCG; • Precisión @ n, NDCG @ n, donde "@n" indica que las métricas se evalúan...

15
Comprender la descomposición QR

Tengo un ejemplo trabajado (en R), que estoy tratando de entender más. Estoy usando Limma para crear un modelo lineal y estoy tratando de entender lo que sucede paso a paso en los cálculos de cambio de pliegue. Principalmente estoy tratando de averiguar qué sucede para calcular los coeficientes....

15
Kernel SVM: quiero una comprensión intuitiva de la asignación a un espacio de características de dimensiones superiores, y cómo esto hace posible la separación lineal

Estoy tratando de entender la intuición detrás de los SVM del kernel. Ahora, entiendo cómo funciona el SVM lineal, mediante el cual se toma una línea de decisión que divide los datos lo mejor que puede. También entiendo el principio detrás de la transferencia de datos a un espacio de dimensiones...

15
¿A qué nivel es una prueba

ANTECEDENTES: Salte con seguridad: está aquí como referencia y para legitimar la pregunta. La apertura de este documento dice: "Famosa prueba de contingencia chi-cuadrado de Karl Pearson se deriva de otra estadística, llamada la estadística z, basado en la distribución Normal. Las versiones más...

15
¿Puede un modelo para datos no negativos con aglomeración en ceros (Tweedie GLM, GLM inflado a cero, etc.) predecir ceros exactos?

Una distribución Tweedie puede modelar datos asimétricos con una masa de punto en cero cuando el parámetro ppagp (exponente en la relación media-varianza) está entre 1 y 2. Del mismo modo, un modelo inflado a cero (ya sea continuo o discreto) puede tener una gran cantidad de ceros. Tengo...

15
¿Cuándo dejar de refinar un modelo?

He estado estudiando estadísticas de muchos libros durante los últimos 3 años, y gracias a este sitio aprendí mucho. Sin embargo, una pregunta fundamental sigue sin respuesta para mí. Puede tener una respuesta muy simple o muy difícil, pero sé con certeza que requiere una comprensión profunda de...

15
El pdf de

Supongamos que X1,X2,...,XnX1,X2,...,XnX_1, X_2,...,X_n se iid de N(μ,σ2)N(μ,σ2)N(\mu,\sigma^2) con desconocido μ∈Rμ∈R\mu \in \mathcal Ry σ2>0σ2>0\sigma^2>0 Deje Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S},S es la desviación estándar aquí. Se puede demostrar que ZZZ tiene el pdf de...

15
Problema de parámetro incidental

Siempre lucho por obtener la verdadera esencia del problema de los parámetros incidentales. Leí en varias ocasiones que los estimadores de efectos fijos de los modelos de datos de panel no lineales pueden estar severamente sesgados debido al problema de parámetro incidental "bien conocido". Cuando...