ANOVA de efectos fijos (o su equivalente de regresión lineal) proporciona una poderosa familia de métodos para analizar estos datos. Para ilustrar, aquí hay un conjunto de datos consistente con las gráficas de HC promedio por noche (una gráfica por color):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA de count
contra day
y color
produce esta tabla:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
El model
valor p de 0.0000 muestra que el ajuste es altamente significativo. El day
valor p de 0.0000 también es muy significativo: puede detectar cambios diarios. Sin embargo, el color
valor p (semestre) de 0.2001 no debe considerarse significativo: no puede detectar una diferencia sistemática entre los tres semestres, incluso después de controlar la variación diaria.
La prueba HSD de Tukey ("diferencia significativa honesta") identifica los siguientes cambios significativos (entre otros) en las medias del día a día (independientemente del semestre) en el nivel 0.05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Esto confirma lo que el ojo puede ver en los gráficos.
Debido a que los gráficos saltan bastante, no hay forma de detectar las correlaciones diarias (correlación en serie), que es el punto central del análisis de series de tiempo. En otras palabras, no se moleste con las técnicas de series de tiempo: no hay suficientes datos aquí para que puedan proporcionar una mayor comprensión.
Uno siempre debe preguntarse cuánto creer los resultados de cualquier análisis estadístico. Varios diagnósticos de heteroscedasticidad (como la prueba de Breusch-Pagan ) no muestran nada desfavorable. Los residuos no se ven muy normales, se agrupan en algunos grupos, por lo que todos los valores p deben tomarse con un grano de sal. Sin embargo, parecen proporcionar una guía razonable y ayudan a cuantificar el sentido de los datos que podemos obtener al mirar los gráficos.
Puede realizar un análisis paralelo en los mínimos diarios o en los máximos diarios. Asegúrese de comenzar con un diagrama similar como guía y de verificar el resultado estadístico.
Sarah, toma tus 36 números (12 valores por ciclo; 3 ciclos) y construye un modelo de regresión con 11 indicadores que reflejen el posible efecto de la semana del semestre y luego identifica cualquier Serie de Intervención necesaria (Pulsos, Cambios de Nivel) necesarios para representar el la media de los residuos es 0.0 en todas partes o al menos no es estadísticamente significativamente diferente de 0.0. Por ejemplo, si identifica un cambio de nivel en el período 13, esto podría sugerir una diferencia estadísticamente significativa entre la media del primer semestre, es decir, los primeros 12 valores) frente a la media de los últimos dos semestres (últimos 24 valores). Es posible que pueda hacer inferencia o probar la hipótesis de ninguna semana del efecto del semestre. Un buen paquete de series de tiempo podría serle útil a este respecto. Si no es así, es posible que necesite encontrar a alguien que brinde ayuda en este campo analítico.
fuente