Me gustaría comparar dos modelos de regresión lineal que representan las tasas de degradación de un ARNm a lo largo del tiempo en dos condiciones diferentes. Los datos para cada modelo recopilados de forma independiente.
Aquí está el conjunto de datos.
Registro de tiempo (horas) (Tratamiento A) registro (tratamiento B) 0 2.02 1.97 0 2.04 2.06 0 1.93 1.96 2 2.02 1.91 2 2.00 1.95 2 2.07 1.82 4 1.96 1.97 4 2.02 1.99 4 2.02 1.99 6 1.94 1.90 6 1.94 1.97 6 1.86 1.88 8 1.93 1.97 8 2.12 1.99 8 2.06 1.93 12 1.71 1.70 12 1.96 1.73 12 1.71 1.76 24 1,70 1,46 24 1.83 1.41 24 1.62 1.42
Estos son mis modelos:
Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Llamada: lm (fórmula = Exp1 $ Tiempo ~ Exp1 $ (Tratamiento A)) Derechos residuales de autor: Mínimo 1Q Mediano 3Q Máx. -6.8950 -1.2322 0.2862 1.2494 5.2494 Coeficientes: Estd Estd. Error t valor Pr (> | t |) (Intercepción) 74.68 6.27 11.91 2.94e-10 *** Exp1 $ (Tratamiento A) -36.14 3.38 -10.69 1.77e-09 *** --- Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1 Error estándar residual: 2.97 en 19 grados de libertad Múltiple R cuadrado: 0.8575, R cuadrado ajustado: 0.85 Estadística F: 114.3 en 1 y 19 DF, valor p: 1.772e-09 Llamada: lm (fórmula = Exp1 $ Tiempo ~ Exp1 $ (Tratamiento B)) Derechos residuales de autor: Mínimo 1Q Mediano 3Q Máx. -7.861 -3.278 -1.444 3.222 11.972 Coeficientes: Estd Estd. Error t valor Pr (> | t |) (Intercepción) 88.281 16.114 5.478 2.76e-05 *** Exp1 $ (Tratamiento B) -41.668 8.343 -4.994 8.05e-05 *** --- Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1 Error estándar residual: 5.173 en 19 grados de libertad Múltiple R cuadrado: 0.5676, R cuadrado ajustado: 0.5449 Estadística F: 24.94 en 1 y 19 DF, valor p: 8.052e-05
Para comparar estos dos modelos, utilicé el siguiente código.
anova(Exp1.A.lm,Exp1.B.lm)
Tabla de análisis de varianza Modelo 1: Exp1 $ Tiempo ~ Exp1 $ Exp1 $ (Tratamiento A) Modelo 2: Exp1 $ Tiempo ~ Exp1 $ Exp1 $ (Tratamiento B) Res.Df RSS Df Suma de Sq F Pr (> F) 1 19 167.60 2 19 508,48 0 -340,88
Mi pregunta es por qué el análisis ANOVA no muestra una estadística F y un p.val. Mis disculpas si esta es una pregunta ingenua.
Basado en diferentes pendientes, la tasa de degradación es diferente en estos dos modelos, pero me gustaría saber cuán estadísticamente significativa es esta diferencia. Espero que esto tenga sentido.
Respuestas:
Si configura los datos en una columna larga con A y B como una nueva columna, puede ejecutar su modelo de regresión como un GLM con una variable de tiempo continuo y una variable de "experimento" nominal (A, B). La salida del ANOVA le dará la importancia de la diferencia entre los parámetros. "interceptar" es la intercepción común y el factor "experimento" reflejará las diferencias entre las intercepciones (en realidad significa en general) entre los experimentos. El factor "Tiempo" será la pendiente común, y la interacción es la diferencia entre los experimentos con respecto a la pendiente.
Tengo que admitir que hago trampa (?) Y ejecuto los modelos por separado primero para obtener los dos conjuntos de parámetros y sus errores y luego ejecuto el modelo combinado para adquirir las diferencias entre los tratamientos (en su caso A y B) ...
fuente
El análisis ANOVA no muestra una estadística F y un valor p, ya que ambos modelos tienen los mismos grados residuales de libertad (es decir, 19) y si toma la diferencia, ¡sería cero! Debe haber al menos un grado de libertad después de tomar la diferencia para realizar la prueba F.
fuente