ANOVA con observaciones no independientes

11

Perdón por los antecedentes detallados de esta pregunta:

Ocasionalmente, en las investigaciones del comportamiento animal, un experimentador está interesado en la cantidad de tiempo que un sujeto pasa en diferentes zonas predefinidas en un aparato de prueba. A menudo he visto este tipo de datos analizados usando ANOVA; sin embargo, nunca he estado completamente convencido de la validez de tales análisis, dado que ANOVA asume que las observaciones son independientes, y en realidad nunca son independientes en estos análisis (¡ya que pasar más tiempo en una zona significa que se gasta menos en otras zonas! )

Por ejemplo,

DR Smith, CD Striplin, AM Geller, RB Mailman, J. Drago, CP Lawler, M. Gallagher, Evaluación del comportamiento de ratones que carecen de receptores de dopamina D1A , Neurociencia, Volumen 86, Número 1, 21 de mayo de 1998, Páginas 135-146

En el artículo anterior, reducen los grados de libertad en 1 para compensar la no independencia. Sin embargo, no estoy seguro de cómo tal manipulación en realidad puede mejorar esta violación de los supuestos de ANOVA.

¿Quizás un procedimiento de chi cuadrado podría ser más apropiado? ¿Qué haría para analizar datos como este (preferencia por zonas, según el tiempo que pase en zonas)?

¡Gracias!

Mike Wong
fuente

Respuestas:

3

(Advertencia: Emptor: no soy un experto en esta área)

Si solo desea hablar sobre las diferencias en el tiempo dedicado por ubicación, entonces debe enviar los datos de "tiempo por ubicación" como recuentos en un modelo mixto multinomial (consulte el paquete MCMCglmm para R), utilizando el sujeto como un efecto aleatorio. el truco.

Si desea hablar sobre las diferencias en la preferencia de ubicación a lo largo del tiempo, entonces puede dividir el tiempo a intervalos razonables (¿tal vez a la resolución de su dispositivo de sincronización?), Clasifique cada intervalo de acuerdo con la ubicación del mouse en ese momento (por ejemplo, si 3 ubicaciones, cada intervalo se etiqueta como 1, 2 o 3), y nuevamente use un modelo de efectos mixtos multinomiales con el sujeto como un efecto aleatorio, pero esta vez agregue el intervalo como un efecto fijo (aunque posiblemente solo después del intervalo de factorización, que reduce la potencia pero debería ayudar) capturar no linealidades a través del tiempo).

Mike Lawrence
fuente
5

Miguel,

Estoy de acuerdo en que un ANOVA basado en el tiempo total probablemente no sea el enfoque correcto aquí. Además, no estoy convencido de que Chi Sqaure resuelva su problema. Chi cuadrado respetará la idea de que no puede estar en dos ubicaciones al mismo tiempo, pero no aborda el problema de que es probable que existan dependencias entre el tiempo N y el tiempo N + 1. Con respecto a este segundo problema, veo algunas analogías entre su situación y lo que la gente encuentra con los datos de seguimiento de ojos y mouse. Un modelo multinomial de algún tipo puede servir bien a sus propósitos. Desafortunadamente, los detalles de ese tipo de modelo están más allá de mi experiencia. Estoy seguro de que algún libro de estadísticas en alguna parte tiene una buena introducción sobre ese tema, pero fuera de mi cabeza te señalaría:

  • Barr DJ (2008) Analizando datos de seguimiento visual del 'mundo visual' usando regresión logística multinivel. Journal of Memory and Language, Número especial: Análisis de datos emergentes (59) pp 457-474
  • https://r-forge.r-project.org/projects/gmpm/ es un enfoque no paramétrico para el mismo problema desarrollado por el Dr. Barr

En todo caso, ambas fuentes deberían estar más que completas porque analizan cómo analizar el curso temporal de la posición.

russellpierce
fuente
4

Busque modelos con errores espacialmente correlacionados (y covariables espacialmente correlacionados). Una breve introducción, con referencias a GeoDa , está disponible aquí . Hay muchos textos; los buenos son Noel Cressie , Robert Haining y Fotheringham et al. (el último enlace va a un resumen, no a un sitio de libros). Recientemente ha surgido algún código R, pero no estoy familiarizado con él.

whuber
fuente
3

Voy a sugerir una respuesta que es muy diferente a la de un ANOVA tradicional. Sea T el tiempo total disponible para que un animal pase en todas las zonas. Podría definir T como la cantidad total de tiempo de vigilia o algo así. Suponga que tiene J zonas. Entonces, por definición, tienes:

Suma T_j = T

Podrías normalizar lo anterior dividiendo lhs y rhs entre T y obtendrás

Suma P_j = 1

donde P_j es la proporción de tiempo que un animal pasa en la zona j.

Ahora la pregunta que tiene es si P_j es significativamente diferente de 1 / J para todo j.

Se podría suponer que P_j sigue una distribución de dirichlet y estimar dos modelos.

Modelo nulo

Establezca los parámetros de la distribución de modo que P_j = 1 / J. (Establecer los parámetros de la distribución en 1 servirá).

Modelo alternativo

Establezca los parámetros de la distribución para que sean una función de las covariables específicas de la zona. Luego podría estimar los parámetros del modelo.

Elegiría el modelo alternativo si supera el modelo nulo en algunos criterios (p. Ej., Razón de probabilidad).


fuente