Tengo una tabla de contingencia de tres niveles, con datos de conteo para varias especies, la planta huésped de la cual fueron recolectadas y si esa recolección ocurrió en un día lluvioso (¡esto realmente importa!). Usando R, los datos falsos podrían ser algo como esto:
count <- rpois(8, 10)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
, , rain = 0
species
host a b
c 12 15
d 10 13
, , rain = 1
species
host a b
c 11 12
d 12 7
Ahora, quiero saber dos cosas: ¿Están las especies asociadas con las plantas hospederas? ¿La lluvia o no afecta esta asociación? Solía loglm()
de MASS
para esto:
# Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)
# Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)
Esto está un poco fuera de mi nivel de comodidad, y quería comprobar que había configurado correctamente los modelos y que esta era la mejor manera de abordar estas preguntas.
fuente
El comando R sería:
fuente
Inicialmente sugerí probar una de las técnicas de ordenación restringida del
vegan
paquete, pero pensándolo bien, dudo que esto sea útil, ya que en realidad tienes 2 tablas de contingencia. Espero que la segunda parte de este ejemplo [PDF: Demostración R - Análisis categórico] sea útil.fuente