¿Cuál es la diferencia entre el modelo Logit y Probit ? Aquí estoy más interesado en saber cuándo usar la regresión logística y cuándo usar Probit. Si hay alguna literatura que lo defina usando R , eso también sería
Se refiere a cualquier modelo donde una variable aleatoria está relacionada con una o más variables aleatorias por una función que es lineal en un número finito de parámetros.
¿Cuál es la diferencia entre el modelo Logit y Probit ? Aquí estoy más interesado en saber cuándo usar la regresión logística y cuándo usar Probit. Si hay alguna literatura que lo defina usando R , eso también sería
Estoy ejecutando modelos de regresión lineal y me pregunto cuáles son las condiciones para eliminar el término de intercepción. Al comparar los resultados de dos regresiones diferentes donde una tiene la intersección y la otra no, noto que el de la función sin la intersección es mucho mayor. ¿Hay...
En un modelo lineal simple con una sola variable explicativa, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Encuentro que eliminar el término de intercepción mejora mucho el ajuste (el valor de va de 0.3 a 0.9). Sin embargo, el término de intercepción parece ser...
El coeficiente de correlación de Pearson de xey es el mismo, ya sea que calcule pearson (x, y) o pearson (y, x). Esto sugiere que hacer una regresión lineal de y dado x o x dado y debería ser lo mismo, pero no creo que ese sea el caso. ¿Alguien puede arrojar luz cuando la relación no es simétrica...
En general, ¿qué significa decir que la fracción de la varianza en un análisis como PCA se explica por el primer componente principal? ¿Alguien puede explicar esto intuitivamente pero también dar una definición matemática precisa de lo que significa "varianza explicada" en términos de análisis de...
¿Qué gráficos de diagnóstico (y quizás pruebas formales) encuentra más informativos para las regresiones en las que el resultado es una variable de conteo? Estoy especialmente interesado en los modelos binomiales de Poisson y negativos, así como en sus homólogos inflados a cero y obstáculos de...
La distribución gamma puede adoptar una gama bastante amplia de formas, y dado el vínculo entre la media y la varianza a través de sus dos parámetros, parece adecuada para tratar la heterocedasticidad en datos no negativos, de una manera que los OLS transformados logarítmicamente pueden No lo haga...
Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...
Tengo un conjunto de datos con alrededor de 30 variables independientes y me gustaría construir un modelo lineal generalizado (GLM) para explorar la relación entre ellos y la variable dependiente. Soy consciente de que el método que me enseñaron para esta situación, la regresión gradual, ahora se...
He notado que el intervalo de confianza para los valores pronosticados en una regresión lineal tiende a ser estrecho alrededor de la media del predictor y engordar alrededor de los valores mínimos y máximos del predictor. Esto se puede ver en las gráficas de estas 4 regresiones...
¿Cuál es la diferencia entre los términos 'función de enlace' y 'función de enlace canónico'? Además, ¿hay alguna ventaja (teórica) de usar uno sobre el otro? Por ejemplo, una variable de respuesta binaria se puede modelar usando muchas funciones de enlace como logit , probit , etc. Pero, logit...
¿Cómo puedo interpretar los efectos principales (coeficientes para el factor codificado ficticio) en una regresión de Poisson? Supongamos el siguiente ejemplo: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2,...
Al responder a esta pregunta, John Christie sugirió que el ajuste de los modelos de regresión logística debería evaluarse evaluando los residuos. Estoy familiarizado con la forma de interpretar los residuos en OLS, están en la misma escala que el DV y muy claramente la diferencia entre y e y...
A menudo se recomienda sacar la raíz cuadrada cuando tiene datos de conteo. (Para algunos ejemplos en CV, vea la respuesta de @ HarveyMotulsky aquí , o la respuesta de @ whuber aquí .) Por otro lado, cuando se ajusta un modelo lineal generalizado con una variable de respuesta distribuida como...
Hay varios hilos en este sitio para recomendaciones de libros sobre estadísticas introductorias y aprendizaje automático, pero estoy buscando un texto sobre estadísticas avanzadas que incluya, en orden de prioridad: máxima probabilidad, modelos lineales generalizados, análisis de componentes...
Estoy tratando de entender la filosofía detrás del uso de un modelo lineal generalizado (GLM) frente a un modelo lineal (LM). He creado un conjunto de datos de ejemplo a continuación donde: log(y)=x+εlog(y)=x+ε\log(y) = x + \varepsilon El ejemplo no tiene el error como una función de la...
Estoy tratando con datos lineales con valores atípicos, algunos de los cuales están a más de 5 desviaciones estándar de la línea de regresión estimada. Estoy buscando una técnica de regresión lineal que reduzca la influencia de estos puntos. Hasta ahora, lo que hice fue estimar la línea de...
Digamos que tengo un objeto de clase glm(correspondiente a un modelo de regresión logística) y me gustaría convertir las probabilidades predichas dadas predict.glmusando el argumento type="response"en respuestas binarias, es decir, o . ¿Cuál es la forma más rápida y canónica de hacer esto en R?Y =...
¿Cómo son todas las versiones del mismo método estadístico
¿Cómo interpretar la desviación nula y residual en GLM en R? Como, decimos que AIC más pequeño es mejor. ¿Hay alguna interpretación similar y rápida para las desviaciones también? Desviación nula: 1146.1 en 1077 grados de libertad Desviación residual: 4589.4 en 1099 grados de libertad AIC:...