¿Alguien podría ofrecer algunos consejos sobre cómo usar el weights
argumento en la lm
función de R ? Digamos, por ejemplo, que estaba tratando de ajustar un modelo en los datos de tráfico, y tenía varios cientos de filas, cada una de las cuales representaba una ciudad (con una población diferente). Si desea que el modelo ajuste la influencia relativa de cada observación en función del tamaño de la población, ¿podría simplemente especificar weights=[the column containing the city's population]
? ¿Es ese el tipo de vector que puede entrar weights
? ¿O necesitaría usar una función / paquete / enfoque de R completamente diferente?
Curioso por escuchar cómo las personas abordan este tema, no lo vi cubierto en ninguno de los tutoriales de modelado lineal que vi por ahí. ¡Gracias!
fuente
lm
resumen si están escalados frente a no ...lm
resumen? ¿Los coeficientes o los errores estándar?Lo que sugieres debería funcionar. Vea si esto tiene sentido:
La segunda línea produce la misma intersección y pendiente que la tercera línea (distinta del resultado de la primera línea), al dar una observación relativamente el doble del peso de cada una de las otras dos observaciones, similar al impacto de duplicar la tercera observación.
fuente
summary
salida es diferente para la segunda y tercera línea, especialmente para el valor p del coeficiente, me pregunto si esto sucederá si las 2 declaraciones se refieren al mismo conjunto de datos.