¿Alguien sabe cómo resolver si los puntos 7, 16 y 29 son puntos influyentes o no? Leí en alguna parte que debido a que la distancia de Cook es inferior a 1, no lo son. Estoy bien?
Las medidas de diagnóstico (como los residuos o algunas estadísticas resumidas calculadas a partir de los residuos) se utilizan para evaluar algún aspecto de la calidad del ajuste del modelo a los datos.
¿Alguien sabe cómo resolver si los puntos 7, 16 y 29 son puntos influyentes o no? Leí en alguna parte que debido a que la distancia de Cook es inferior a 1, no lo son. Estoy bien?
Estoy buscando pautas sobre cómo interpretar gráficos residuales de modelos glm. Especialmente poisson, binomio negativo, modelos binomiales. ¿Qué podemos esperar de estas parcelas cuando los modelos son "correctos"? (por ejemplo, esperamos que la varianza crezca a medida que aumenta el valor...
Quería hacer una demostración de clase donde comparo un intervalo t con un intervalo de arranque y calculo la probabilidad de cobertura de ambos. Quería que los datos provengan de una distribución sesgada, así que elegí generar los datos como exp(rnorm(10, 0, 2)) + 1, una muestra de tamaño 10 de un...
Supongamos que voy a hacer una regresión logística univariada en varias variables independientes, como esta: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Hice una comparación de modelo (prueba de razón de probabilidad)...
Siguiendo mi pregunta para OLS , me pregunto: ¿qué gráficos de diagnóstico existen para la regresión cuantil? (¿y hay R implementación de ellos?) Una búsqueda rápida en Google ya apareció con el diagrama de gusanos (del que nunca había oído hablar antes), y me encantaría saber de más métodos que...
Un experimento de detección de señal generalmente presenta al observador (o sistema de diagnóstico) con una señal o sin señal, y se le pide al observador que informe si cree que el elemento presentado es una señal o no señal. Tales experimentos producen datos que llenan una matriz de 2x2: La...
Estoy ejecutando una muestra de Metropolis (C ++) y quiero usar las muestras anteriores para estimar la tasa de convergencia. Un diagnóstico fácil de implementar que encontré es el diagnóstico de Geweke , que calcula la diferencia entre las dos medias de muestra divididas por su error estándar...
He ajustado mi modelo y estoy tratando de entender si es bueno. He calculado las métricas recomendadas para evaluarlo ( / AUC / precisión / error de predicción / etc.) pero no sé cómo interpretarlas. En resumen, ¿cómo puedo saber si mi modelo es bueno en función de la métrica? ¿Es un de 0.6 (por...
He visto fórmulas en Wikipedia. que relacionan la distancia y el apalancamiento de Mahalanobis: La distancia de Mahalanobis está estrechamente relacionada con la estadística de apalancamiento, , pero tiene una escala diferente:hhhD2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N})....
Soy consciente de la prueba Ramsey Reset que puede detectar dependencias no lineales. Sin embargo, si solo arroja uno de los coeficientes de regresión (meramente dependencias lineales), puede obtener un sesgo, dependiendo de las correlaciones. Obviamente, esto no es detectado por la prueba de...
Estoy observando patrones extraños en residuos para mis datos: [EDITAR] Aquí están los gráficos de regresión parcial para las dos variables: [EDIT2] Se agregó la trama PP La distribución parece estar funcionando bien (ver más abajo) pero no tengo idea de dónde podría provenir esta línea...
En la regresión lineal simple, a menudo se quiere verificar si se cumplen ciertos supuestos para poder hacer inferencia (por ejemplo, los residuos se distribuyen normalmente). ¿Es razonable verificar los supuestos comprobando si los valores ajustados se distribuyen normalmente?...
Comencé a cavar un poco en la función plot.lm , esta función da seis gráficos para lm, son: una gráfica de residuos contra valores ajustados una gráfica de ubicación de escala de sqrt (| residuales |) contra valores ajustados un gráfico QQ normal, un gráfico de distancias de Cook versus etiquetas...
Tengo datos de demanda de media hora, que es una serie de tiempo de múltiples estaciones. He utilizado tbatsen el forecastpaquete en R, y dieron resultados como este: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) ¿Significa que la serie no es necesariamente para usar la...
¿Existen supuestos particulares con respecto a los errores para la regresión logística, como la variación constante de los términos de error y la normalidad de los residuos? También típicamente cuando tiene puntos que tienen una distancia de Cook mayor a 4 / n, ¿los elimina? Si los elimina, ¿cómo...
Antes de hacer esta pregunta, busqué en nuestro sitio y encontré muchas preguntas similares (como aquí , aquí y aquí ). Pero creo que esas preguntas relacionadas no fueron bien respondidas o discutidas, por lo que me gustaría plantear esta pregunta nuevamente. Siento que debería haber una gran...
La enseñanza estándar dice que la sensibilidad y la especificidad son propiedades de la prueba y son independientes de la prevalencia. ¿Pero no es esto solo una suposición? Los principios de la medicina interna de Harrison 19ª ed dice Durante mucho tiempo se ha afirmado que la sensibilidad y la...
Cuando llevo a cabo la regresión lineal múltiple de OLS, en lugar de graficar los residuos contra valores ajustados, grafo los residuales Studentizados (internos) contra valores ajustados (lo mismo para las covariables). Estos residuos se definen
Estoy tratando de replicar lo que la función dfbetas()hace en R . dfbeta() no es un problema ... Aquí hay un conjunto de vectores: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Si ajusto dos modelos de regresión de la siguiente manera: fit1 <-...
En primer lugar, permítanme decir que tuve un curso de estadísticas en la escuela de ingeniería hace 38 años. Así que estoy volando a ciegas aquí. Tengo los resultados de lo que son esencialmente 18 pruebas de diagnóstico separadas para una enfermedad. Cada prueba es binaria: sí / no, sin umbral...