Quiero realizar un análisis ANCOVA de datos relativos a la densidad de epífitas de plantas. Al principio, me gustaría saber si hay alguna diferencia en la densidad de la planta entre dos pendientes, una N y una S, pero tengo otros datos como la altitud, la apertura del dosel y la altura de la planta huésped. Sé que mi covariable tendría que ser las dos pendientes (N y S). Construí este modelo que se ejecuta en R y aunque no tengo idea si funciona bien. También me gustaría saber cuál es la diferencia si uso el símbolo +
o *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Respuestas:
La herramienta básica para esto es
lm
; tenga en cuenta queaov
es un contenedor paralm
.En particular, si tiene alguna variable de agrupación (factor),sol , y una covariable continua X , el modelo
y ~ x + g
se ajustaría a un modelo ANCOVA de efectos principales, mientras quey ~ x * g
se ajustaría a un modelo que incluye la interacción con la covariable.aov
tomará las mismas fórmulas.Presta especial atención a
Note
la ayuda enaov
.En cuanto a
+
frente*
, russellpierce más o menos lo cubre, pero recomiendo nos fijamos en?lm
y?formula
, y muy especialmente la sección 11.1 del manual Introducción a R que viene con R (o se puede encontrar en línea si no se ha descubierto la manera para encontrarlo en su computadora; más fácilmente, esto implica encontrar el menú desplegable "Ayuda" en R o RStudio).fuente
anova
(pronto verá si los da en el orden incorrecto porque algunos SS serán negativos si lo hace )Recomiendo obtener y leer Discovering Statistics usando R by Field. Tiene una buena sección sobre ANCOVA.
Para ejecutar ANCOVA en R, cargue los siguientes paquetes:
Si está utilizando
lm
oaov
(yo usoaov
) asegúrese de establecer los contrastes utilizando la función "contrastes" antes de hacer cualquieraaov
olm
. R usa contrastes no ortogonales por defecto que pueden estropear todo en un ANCOVA. Si desea establecer contrastes ortogonales, use:luego ejecuta tu modelo como
Para ver el uso del modelo:
Asegúrese de usar mayúscula "A"
Anova
aquí y noanova
. Esto dará resultados con el tipo III SS.summary.lm(model.1)
dará otro resumen e incluye el R-sq. salida.Si desea probar la homogeneidad de las pendientes de regresión, también puede incluir un término de interacción para IV y covariable. Eso sería:
Si el término de interacción es significativo, entonces no tiene homogeneidad.
fuente
Aquí hay una documentación complementaria http://goo.gl/yxUZ1R del procedimiento sugerido por @Butorovich. Además, mi observación es que cuando la covariable es binaria, el uso de resumen (lm.object) daría la misma estimación IV que la generada por Anova (lm.object, type = "III").
fuente
ASK QUESTION
en la parte superior y pregúntelo allí. Entonces podemos ayudarlo adecuadamente.Utilizamos el análisis de regresión para crear modelos que describen el efecto de la variación en las variables predictoras sobre la variable de respuesta. A veces, si tenemos una variable categórica con valores como Sí / No o Masculino / Femenino, etc., el análisis de regresión simple da múltiples resultados para cada valor de la variable categórica. En tal escenario, podemos estudiar el efecto de la variable categórica usándola junto con la variable predictora y comparando las líneas de regresión para cada nivel de la variable categórica. Tal análisis se denomina Análisis de Covarianza también llamado ANCOVA.
Ejemplo
Considere el
R
conjunto de datos incorporadomtcars
. En él observamos que el campoam
representa el tipo de transmisión (automática o manual). Es una variable categórica con valores 0 y 1. El valor de millas por galón (mpg
) de un automóvil también puede depender de él además del valor de la potencia en caballos (hp
). Estudiamos el efecto del valor deam
en la regresión entrempg
yhp
. Se realiza utilizando laaov()
función seguida de laanova()
función para comparar las regresiones múltiples.La entrada de datos
Crear una trama de datos que contiene los campos
mpg
,hp
yam
del conjunto de datosmtcars
. Aquí tomamosmpg
como variable de respuesta,hp
como variable predictiva yam
como variable categórica.Cuando ejecutamos el código anterior, produce el siguiente resultado:
Análisis ANCOVA
Creamos un modelo de regresión tomando
hp
como variable predictiva ympg
como variable de respuesta teniendo en cuenta la interacción entream
yhp
.Modelo con interacción entre variable categórica y variable predictiva
Crear modelo de regresión1
Cuando ejecutamos el código anterior, produce el siguiente resultado:
Este resultado muestra que tanto la potencia del caballo como el tipo de transmisión tienen un efecto significativo en millas por galón, ya que el valor p en ambos casos es menor a 0.05. Pero la interacción entre estas dos variables no es significativa ya que el valor p es más de 0.05.
Modelo sin interacción entre variable categórica y variable predictiva
Crea el modelo de regresión2
Cuando ejecutamos el código anterior, produce el siguiente resultado:
Este resultado muestra que tanto la potencia del caballo como el tipo de transmisión tienen un efecto significativo en millas por galón, ya que el valor p en ambos casos es menor a 0.05.
Comparación de dos modelos
Ahora podemos comparar los dos modelos para concluir si la interacción de las variables es realmente insignificante. Para esto usamos la
anova()
función.Como el valor p es mayor que 0.05, concluimos que la interacción entre la potencia del caballo y el tipo de transmisión no es significativa. Por lo tanto, el kilometraje por galón dependerá de manera similar de la potencia del automóvil en el modo de transmisión automática y manual.
fuente