¿Cuál es la diferencia entre el modelo Logit y Probit ? Aquí estoy más interesado en saber cuándo usar la regresión logística y cuándo usar Probit. Si hay alguna literatura que lo defina usando R , eso también sería
Una generalización de la regresión lineal que permite relaciones no lineales a través de una "función de enlace" y que la varianza de la respuesta dependa del valor predicho. (No debe confundirse con el "modelo lineal general" que extiende el modelo lineal ordinario a la estructura de covarianza general y la respuesta multivariada).
¿Cuál es la diferencia entre el modelo Logit y Probit ? Aquí estoy más interesado en saber cuándo usar la regresión logística y cuándo usar Probit. Si hay alguna literatura que lo defina usando R , eso también sería
¿Qué gráficos de diagnóstico (y quizás pruebas formales) encuentra más informativos para las regresiones en las que el resultado es una variable de conteo? Estoy especialmente interesado en los modelos binomiales de Poisson y negativos, así como en sus homólogos inflados a cero y obstáculos de...
La distribución gamma puede adoptar una gama bastante amplia de formas, y dado el vínculo entre la media y la varianza a través de sus dos parámetros, parece adecuada para tratar la heterocedasticidad en datos no negativos, de una manera que los OLS transformados logarítmicamente pueden No lo haga...
Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...
Tengo un conjunto de datos con alrededor de 30 variables independientes y me gustaría construir un modelo lineal generalizado (GLM) para explorar la relación entre ellos y la variable dependiente. Soy consciente de que el método que me enseñaron para esta situación, la regresión gradual, ahora se...
¿Cuál es la diferencia entre los términos 'función de enlace' y 'función de enlace canónico'? Además, ¿hay alguna ventaja (teórica) de usar uno sobre el otro? Por ejemplo, una variable de respuesta binaria se puede modelar usando muchas funciones de enlace como logit , probit , etc. Pero, logit...
¿Cómo puedo interpretar los efectos principales (coeficientes para el factor codificado ficticio) en una regresión de Poisson? Supongamos el siguiente ejemplo: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2,...
Al responder a esta pregunta, John Christie sugirió que el ajuste de los modelos de regresión logística debería evaluarse evaluando los residuos. Estoy familiarizado con la forma de interpretar los residuos en OLS, están en la misma escala que el DV y muy claramente la diferencia entre y e y...
A menudo se recomienda sacar la raíz cuadrada cuando tiene datos de conteo. (Para algunos ejemplos en CV, vea la respuesta de @ HarveyMotulsky aquí , o la respuesta de @ whuber aquí .) Por otro lado, cuando se ajusta un modelo lineal generalizado con una variable de respuesta distribuida como...
Hay varios hilos en este sitio para recomendaciones de libros sobre estadísticas introductorias y aprendizaje automático, pero estoy buscando un texto sobre estadísticas avanzadas que incluya, en orden de prioridad: máxima probabilidad, modelos lineales generalizados, análisis de componentes...
Estoy tratando de entender la filosofía detrás del uso de un modelo lineal generalizado (GLM) frente a un modelo lineal (LM). He creado un conjunto de datos de ejemplo a continuación donde: log(y)=x+εlog(y)=x+ε\log(y) = x + \varepsilon El ejemplo no tiene el error como una función de la...
Digamos que tengo un objeto de clase glm(correspondiente a un modelo de regresión logística) y me gustaría convertir las probabilidades predichas dadas predict.glmusando el argumento type="response"en respuestas binarias, es decir, o . ¿Cuál es la forma más rápida y canónica de hacer esto en R?Y =...
¿Cómo son todas las versiones del mismo método estadístico
¿Cómo interpretar la desviación nula y residual en GLM en R? Como, decimos que AIC más pequeño es mejor. ¿Hay alguna interpretación similar y rápida para las desviaciones también? Desviación nula: 1146.1 en 1077 grados de libertad Desviación residual: 4589.4 en 1099 grados de libertad AIC:...
En este documento titulado "ELEGIR ENTRE MODELOS LINEALES GENERALIZADOS APLICADOS A DATOS MÉDICOS" los autores escriben: En un modelo lineal generalizado, la media se transforma, mediante la función de enlace, en lugar de transformar la respuesta misma. Los dos métodos de transformación pueden...
Me pregunto si hace una diferencia en la interpretación si solo el dependiente, tanto el dependiente como el independiente, o solo las variables independientes se transforman logarítmicamente. Considere el caso de log(DV) = Intercept + B1*IV + Error Puedo interpretar el IV como el porcentaje...
Específicamente, quiero saber si hay una diferencia entre lm(y ~ x1 + x2)y glm(y ~ x1 + x2, family=gaussian). Creo que este caso particular de glm es igual a lm. ¿Me
Sé que me falta algo en mi comprensión de la regresión logística, y realmente agradecería cualquier ayuda. Hasta donde yo entiendo, la regresión logística supone que la probabilidad de un resultado '1' dadas las entradas, es una combinación lineal de las entradas, pasadas a través de una función...
Estoy pensando en construir un modelo que prediga una relación , donde y y . Entonces, la relación estaría entre y .a ≤ b a > 0 b > 0 0 1a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 Podría usar la regresión lineal, aunque naturalmente no se limita a 0..1. No tengo ninguna...
Esta pregunta es en respuesta a una respuesta dada por @Greg Snow con respecto a una pregunta que hice sobre el análisis de potencia con regresión logística y SAS Proc GLMPOWER. Si estoy diseñando un experimento y analizaré los resultados en una regresión logística factorial, ¿cómo puedo usar la...