Estadísticas y Big Data

15
¿Cómo evalúo la desviación estándar?

He recopilado respuestas de 85 personas sobre su capacidad para realizar ciertas tareas. Las respuestas están en una escala Likert de cinco puntos: 5 = Muy bueno, 4 = Bueno, 3 = Promedio, 2 = Malo, 1 = Muy pobre, La puntuación media es 2.8 y la desviación estándar es 0.54. Entiendo lo que...

15
Curso intensivo en estimación media robusta

Tengo un montón (alrededor de 1000) de estimaciones y se supone que todas son estimaciones de elasticidad a largo plazo. Un poco más de la mitad de estos se estima utilizando el método A y el resto utilizando un método B. En algún lugar leí algo como "Creo que el método B estima algo muy diferente...

15
Notación de estimadores (tilde vs. hat)

1. ¿Existe alguna convención de nomenclatura con respecto al sombrero y el símbolo de tilde en las estadísticas? He encontrado β está describiendo un estimador de β ( Wikipedia ) Pero también encontré ~ β está describiendo un estimador de β ( Wolfram ). ¿Hay alguna diferencia en el significado? En...

15
¿Cómo obtener un R cuadrado para un ajuste loess?

¿Cómo calcular la estadística R-cuadrado ( ) en R para y / o salida de función? Por ejemplo para estos datos:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lptiene dos matrices fitpara modelo y...

15
Cómo expandir el marco de datos en R

Bloqueado . Esta pregunta y sus respuestas están bloqueadas porque la pregunta está fuera de tema pero tiene un significado histórico. Actualmente no acepta nuevas respuestas o interacciones. Estoy teniendo el siguiente problema mientras hago un análisis con R. Tengo un...

15
¿Cómo elegir entre las diferentes fórmulas de

Tengo en mente las fórmulas R-cuadrado ajustadas propuestas por: Ezekiel (1930), que creo que es el que se usa actualmente en SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin y Pratt (1958)...

15
Series temporales y detección de anomalías

Me gustaría configurar un algoritmo para detectar una anomalía en series de tiempo, y planeo usar el agrupamiento para eso. ¿Por qué debería usar una matriz de distancia para la agrupación y no los datos de series temporales sin procesar? Para la detección de la anomalía, utilizaré la...

15
¿Cuándo se debe considerar usar GMM?

Una de las cosas que hace que la econometría sea única es el uso de la técnica del Método Generalizado de Momentos. ¿Qué tipos de problemas hacen que GMM sea más apropiado que otras técnicas de estimación? ¿Qué le da el uso de GMM en términos de eficiencia o sesgo reducido o estimación de...

15
Ventajas de las curvas ROC

¿Cuáles son las ventajas de las curvas ROC? Por ejemplo, estoy clasificando algunas imágenes que es un problema de clasificación binaria. Extraje alrededor de 500 características y apliqué un algoritmo de selección de características para seleccionar un conjunto de características, luego apliqué...