Entiendo que significa que el modelo es malo para predecir puntos de datos individuales, pero ha establecido una tendencia firme (por ejemplo, y sube cuando x
Entiendo que significa que el modelo es malo para predecir puntos de datos individuales, pero ha establecido una tendencia firme (por ejemplo, y sube cuando x
Estoy tratando de obtener una comprensión intuitiva y sentir la diferencia y la diferencia práctica entre el término consistente y asintóticamente imparcial. Conozco sus definiciones matemáticas / estadísticas, pero estoy buscando algo intuitivo. Para mí, mirando sus definiciones individuales, casi...
Parece haber mucha confusión en la comparación de usar glmnetdentro caretpara buscar una lambda óptima y usar cv.glmnetpara hacer la misma tarea. Se plantearon muchas preguntas, por ejemplo: Modelo de clasificación train.glmnet vs. cv.glmnet? ¿Cuál es la forma correcta de usar glmnet con...
Entonces, sabemos que la búsqueda aleatoria funciona mejor que la búsqueda de cuadrícula, pero un enfoque más reciente es la optimización bayesiana (usando procesos gaussianos). Busqué una comparación entre los dos y no encontré nada. Sé que en el cs231n de Stanford solo mencionan la búsqueda...
Algunas pruebas estadísticas son robustas y otras no. ¿Qué significa exactamente la robustez? Sorprendentemente, no pude encontrar esa pregunta en este sitio. Además, a veces, la solidez y la potencia de una prueba se discuten juntas. E intuitivamente, no pude diferenciar entre los dos conceptos....
Digamos que tenemos los puntos de datos de entrada (predictor) y de salida (respuesta) A, B, C, D, E y queremos ajustar una línea a través de los puntos. Este es un problema simple para ilustrar la pregunta, pero también puede extenderse a dimensiones más altas. Planteamiento del problema El...
Voy a usar la divergencia de KL en mi código de Python y obtuve este tutorial . En ese tutorial, implementar la divergencia de KL es bastante simple. kl = (model * np.log(model/actual)).sum() Según tengo entendido, la distribución de probabilidad de modely actualdebería ser <= 1. Mi...
Supongamos que tengo participantes, cada uno de los cuales da una respuesta 20 veces, 10 en una condición y 10 en otra. Encajo un modelo lineal de efectos mixtos que compara en cada condición. Aquí hay un ejemplo reproducible que simula esta situación usando el paquete en :S
La pregunta es sencilla: ¿es apropiado usar la regresión lineal cuando Y es acotado y discreto (por ejemplo, el puntaje de la prueba 1 ~ 100, alguna clasificación predefinida 1 ~ 17)? En este caso, ¿"no es bueno" usar regresión lineal, o es totalmente incorrecto
Siguiendo las preguntas recientes que tuvimos aquí . Esperaba saber si alguien se había encontrado o podía compartir el código R para realizar un análisis de potencia personalizado basado en la simulación de un modelo lineal. Más tarde, obviamente, me gustaría extenderlo a modelos más complejos,...
Digamos que tengo una población de 50 millones de cosas únicas, y tomo 10 millones de muestras (con reemplazo) ... El primer gráfico que adjunto muestra cuántas veces pruebo la misma "cosa", lo cual es relativamente raro. La población es mayor que mi muestra. Sin embargo, si mi población es de...
He leído y visto muchas parcelas de coordenadas paralelas. ¿Alguien puede responder el siguiente conjunto de preguntas: ¿Qué son las gráficas de coordenadas paralelas (PCP) en palabras simples, para que un laico pueda entender? Una explicación matemática con cierta intuición si es posible ¿Cuándo...
El teorema de Gauss-Markov nos dice que el estimador OLS es el mejor estimador lineal imparcial para el modelo de regresión lineal. Pero supongamos que no me importa la linealidad y la imparcialidad. Entonces, ¿hay algún otro estimador (posible no lineal / sesgado) para el modelo de regresión...
¿Cómo saber si las correlaciones en diferentes rezagos obtenidos de la correlación cruzada (función ccf) de dos series de tiempo son significativas.
Tengo una regresión multivariada, que incluye interacciones. Por ejemplo, para obtener la estimación del efecto del tratamiento para el quintil más pobre, necesito agregar los coeficientes del regresor del tratamiento al coeficiente de la variable de interacción (que interactúa con el tratamiento y...
Me gustaría automatizar la elección del quemado para una cadena MCMC, por ejemplo, eliminando las primeras n filas según un diagnóstico de convergencia. ¿En qué medida se puede automatizar este paso de forma segura? Incluso si aún verifico dos veces la autocorrelación, el seguimiento de mcmc y...
¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra...
Hice esta pregunta ayer en StackOverflow, y obtuve una respuesta, pero acordamos que parece un poco hack y que puede haber una mejor manera de verlo. La pregunta: me gustaría calcular los errores estándar de Newey-West (HAC) para un vector (en este caso, un vector de devoluciones de acciones). La...
Me gustaría obtener los coeficientes para el problema LASSO ||Y−Xβ||+λ||β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. El problema es que las funciones glmnet y lars dan respuestas diferentes. Para la función glmnet pido los coeficientes de en lugar de solo λ , pero aún obtengo...
Estoy experimentando con la clasificación de datos en grupos. Soy bastante nuevo en este tema e intento comprender el resultado de algunos de los análisis. Usando ejemplos de Quick-R , Rse sugieren varios paquetes. He intentado usar dos de estos paquetes ( fpcusando la kmeansfunción y mclust). Un...