Estadísticas y Big Data

13
Comprender los criterios de AIC y Schwarz

Estoy ejecutando un modelo logístico. El conjunto de datos del modelo real tiene más de 100 variables, pero elijo un conjunto de datos de prueba en el que hay alrededor de 25 variables. Antes de eso también hice un conjunto de datos que tenía 8-9 variables. Me dicen que los valores AIC y SC se...

13
Interpretación / uso de la densidad del grano

Esta puede ser una pregunta ingenua, pero aquí va. Si tengo un conjunto de datos empíricos y le ajusto una densidad de kernel, y luego obtengo un nuevo valor único que posiblemente provenga del mismo proceso que generó el conjunto de datos original, ¿puedo asignar una probabilidad de que este nuevo...

13
Cálculo de la mediana de medianas

Hago un montón de informes inmobiliarios y el precio medio a menudo se informa, particularmente por la NAR (Asociación Nacional de Agentes Inmobiliarios). Lo mejor que puedo decir es que solo obtienen las medianas de los precios inmobiliarios de cada área. Mi pregunta es, ¿cómo debe calcularse la...

13
LARS vs descenso coordinado para el lazo

¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra...

13
Regresión logística y muestreo paso a paso

Estoy ajustando una regresión logística paso a paso en un conjunto de datos en SPSS. En el procedimiento, estoy ajustando mi modelo a un subconjunto aleatorio que es de aprox. 60% de la muestra total, lo que equivale a unos 330 casos. Lo que me parece interesante es que cada vez que vuelvo a...

13
¿Las razones de probabilidad y la comparación del modelo bayesiano proporcionan alternativas superiores y suficientes para las pruebas de hipótesis nulas?

En respuesta a un creciente cuerpo de estadísticos e investigadores que critican la utilidad de las pruebas de hipótesis nulas (NHT) para la ciencia como un esfuerzo acumulativo, la Fuerza de Tarea de la Asociación Americana de Psicología sobre Inferencia Estadística evitó una prohibición total de...