Sé que esta es probablemente una pregunta básica ... Pero parece que no encuentro la respuesta. Estoy adaptando un GLM con una familia de Poisson, y luego intenté echar un vistazo a las predicciones, sin embargo, el desplazamiento parece tenerse en
Sé que esta es probablemente una pregunta básica ... Pero parece que no encuentro la respuesta. Estoy adaptando un GLM con una familia de Poisson, y luego intenté echar un vistazo a las predicciones, sin embargo, el desplazamiento parece tenerse en
Con datos continuos, una regresión lineal Y=β1+β2X2+uY=β1+β2X2+uY=\beta_1+\beta_2X_2+u supone que el término de error se distribuye N (0, σ2σ2\sigma^2 ) 1) ¿Asumimos que Var (Y | x) es igualmente ~ N (0, σ2σ2\sigma^2 )? 2) ¿Cuál es esta distribución de errores en regresión logística? Cuando los...
Tengo una pregunta sobre la interpretación de los coeficientes de una interacción entre variable continua y categórica. Aquí está mi modelo: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|)...
Estaba leyendo este libro Reconocimiento de patrones y aprendizaje automático de Bishop. Tuve una confusión relacionada con una derivación del sistema dinámico lineal. En SUD asumimos que las variables latentes son continuas. Si Z denota las variables latentes y X denota las variables...
Obtengo coeficientes enormes durante la regresión logística, vea coeficientes con krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance...
En la página 232 de "Un compañero de R para la regresión aplicada", Fox y Weisberg observan Solo la familia gaussiana tiene una varianza constante, y en todos los demás GLM la varianza condicional de y en depende de μ ( x )XX\bf{x}μ ( x )μ(X)\mu(x) Anteriormente, observaron que la varianza...
En la Econometría introductoria de Wooldridge hay una cita: El argumento que justifica la distribución normal de los errores por lo general es algo como esto: porque es la suma de muchos factores diferentes que afectan no observadas , podemos invocar el teorema del límite central a la...
Por defecto, cuando usamos una glmfunción en R, usa el método de mínimos cuadrados reponderados iterativamente (IWLS) para encontrar la estimación de máxima verosimilitud de los parámetros. Ahora tengo dos preguntas. ¿Las estimaciones de IWLS garantizan el máximo global de la función de...
Tengo estos datos: set.seed(1) predictor <- rnorm(20) set.seed(1) counts <- c(sample(1:1000, 20)) df <- data.frame(counts, predictor) Corrí una regresión de Poisson poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson") Y una regresión binomial...
Estoy buscando el algoritmo de regresión lineal que sea más adecuado para datos cuya variable independiente (x) tiene un error de medición constante y la variable dependiente (y) tiene un error dependiente de la señal. La imagen de arriba ilustra mi
Tengo un conjunto de datos de alrededor de 5000 características. Para esos datos, utilicé por primera vez la prueba Chi Square para la selección de funciones; después de eso, obtuve alrededor de 1500 variables que mostraron una relación significativa con la variable de respuesta. Ahora necesito...
En 'Los elementos del aprendizaje estadístico', la expresión para la descomposición de la variación de sesgo del modelo lineal se da como donde es la función objetivo real, es la varianza del error aleatorio en el modelo y es el estimador lineal de .f ( x 0 ) σ 2 ε y = f ( x ) +...
En regresión lineal, he encontrado un resultado encantador que si encajamos en el modelo E[Y]=β1X1+β2X2+c,mi[Y]=β1X1+β2X2+C,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, entonces, si estandarizamos y centramos los datos , X 1 y X 2
Tengo datos del siguiente diseño experimental: mis observaciones son recuentos del número de éxitos ( K) del número correspondiente de ensayos ( N), medidos para dos grupos, cada uno compuesto de Iindividuos, de Ttratamientos, donde en cada combinación de factores hay Rréplicas . Por lo tanto, en...
Estoy estudiando la diferencia entre la regularización en la regresión RKHS y la regresión lineal, pero me resulta difícil comprender la diferencia crucial entre los dos. (xi,yi)(xi,yi)(x_i,y_i)f(⋅)f(⋅)f(\cdot)f(x)≈u(x)=∑i=1mαiK(x,xi),f(x)≈u(x)=∑i=1mαiK(x,xi),\begin{equation}f(x)\approx...
Estoy tratando de ayudar a un estudiante de un colega. El estudiante observó y contó el comportamiento de las aves (número de llamadas) en una configuración experimental. No se pudo determinar el número de llamadas atribuibles a un ave observada específica durante cada experimento, pero fue posible...
Estoy simulando ensayos de Bernoulli con un entre grupos y luego el modelo correspondiente con el paquete:logitθ ∼ N( logitθ0 0,12)logitθ∼norte(logitθ0 0,12)\text{logit}\, \theta \sim {\cal N}(\text{logit}\, \theta_0, 1^2)lme4 library(lme4) library(data.table) I <- 30 # number of groups J <-...
El siguiente modelo logístico multinivel con una variable explicativa en el nivel 1 (nivel individual) y una variable explicativa en el nivel 2 (nivel grupal): π 0 j = γ 00 + γ 01 z j + u 0 j … ( 2 ) π 1 j = γ 10 + γ 11 z j + u 1 j … ( 3
Preguntas: ¿Se utilizan modelos lineales inadecuados en la práctica o se describe algún tipo de curiosidad de vez en cuando en revistas científicas? Si es así, ¿en qué áreas se utilizan? ¿Hay otros ejemplos de tales modelos? Finalmente, ¿serían correctos los errores estándar, los valores , R 2,...
En mi campo, la forma habitual de graficar datos emparejados es como una serie de segmentos de línea delgada y delgada, superpuestos con la mediana y el IC de la mediana para los dos grupos: Sin embargo, este tipo de gráfico se vuelve mucho más difícil de leer a medida que aumenta el número de...