Aquí está mi contexto para esta pregunta: por lo que puedo decir, no podemos ejecutar una regresión de mínimos cuadrados ordinarios en R cuando usamos datos ponderados y el survey
paquete. Aquí, tenemos que usar svyglm()
, que en su lugar ejecuta un modelo lineal generalizado (¿qué puede ser lo mismo? Estoy confuso aquí en términos de lo que es diferente).
En OLS y a través de la lm()
función, calcula un valor R cuadrado, cuya interpretación sí entiendo. Sin embargo, svyglm()
no parece calcular esto y, en cambio, me da una desviación, que mi breve viaje por Internet me dice que es una medida de bondad de ajuste que se interpreta de manera diferente que un R cuadrado.
Así que supongo que esencialmente tengo dos preguntas sobre las que esperaba obtener alguna dirección:
- ¿Por qué no podemos ejecutar OLS en el
survey
paquete, mientras parece que esto es posible con datos ponderados en Stata? - ¿Cuál es la diferencia en la interpretación entre la desviación de un modelo lineal generalizado y un valor r cuadrado?
Respuestas:
svyglm
le dará un modelo lineal si lo usa,family = gaussian()
que parece ser el predeterminado de la viñeta de la encuesta (en la versión 3.32-1). Vea el ejemplo donde encuentran elregmodel
.Parece que el paquete solo se asegura de usar los pesos correctos cuando llama
glm
. Por lo tanto, si su resultado es continuo y asume que normalmente está distribuido en iid, entonces debe usarlofamily = gaussian()
. El resultado es un modelo lineal ponderado. Esta respuestaal afirmar que efectivamente puedes hacer eso con el
survey
paquete. En cuanto a la siguiente preguntaHay una fórmula sencilla para obtener elR2 con
family = gaussian()
como algunas personas han mencionado en los comentarios. Agregar pesas tampoco cambia nada como lo muestro a continuaciónLa desviación es solo la suma de los errores cuadrados cuando se usa
family = gaussian()
.Advertencias
Supongo que quieres un modelo lineal de tu pregunta. Además, nunca he usado el
survey
paquete, pero lo escaneé rápidamente e hice suposiciones sobre lo que hace, lo que afirmo en mi respuesta.fuente