Tiene razón al decir que en los modelos de efectos lineales mixtos estándar, se supone que los efectos aleatorios se distribuyen normalmente. Por lo tanto, si este supuesto se cumple (al menos aproximadamente), podemos usar lo que sabemos sobre las distribuciones normales para ayudar a describir la distribución de los efectos aleatorios, como el 95% de los efectos aleatorios deben estar dentro de dos desviaciones estándar de 0 (ya que aleatorio los efectos se centran alrededor de 0).
Dicho esto, es importante verificar estos supuestos, ¡y no siempre es tan fácil! Si tiene una gran cantidad de datos sobre cada grupo, puede hacer algo como un análisis estratificado y trazar los intervalos de confianza para cada grupo. Esto aún puede ser un poco difícil; supongamos que tiene un valor atípico extremo, es decir, un intervalo de confianza ajustado a varias desviaciones estándar de 0. ¿Es esto porque este efecto aleatorio es realmente enorme y estamos muy seguros de esto? ¿O es porque no tenemos muchos datos sobre este efecto aleatorio y hemos subestimado la varianza debido al pequeño tamaño de la muestra?
En cuanto a la diferencia entre la regresión lineal simple y los modelos de efectos mixtos, la respuesta es que el modelo de efectos mixtos es considerablemente más complicado. Se supone que todos los efectos aleatorios se han generado a partir de la misma distribución (normalmente normal). Como tal, la estimación de un efecto aleatorio en realidad se dirige hacia 0 (recuerde que los efectos aleatorios se centran en 0) en comparación si acaba de ajustar un modelo de regresión lineal simple con todos los efectos fijos.
Además, otra diferencia es que los efectos aleatorios tienen una media de 0, lo que permite la plena identificación del modelo: si intentara ajustar el efecto principal Y todos los efectos aleatorios en un modelo lineal simple, su modelo no sería identificable. Esto se debe a que sumar 1 al efecto principal y restar 1 de los efectos "aleatorios" (citas utilizadas porque los ajustaría como efectos fijos) conduciría a los mismos valores pronosticados. Sin embargo, este problema no es tan importante: uno podría simplemente excluir el efecto principal del modelo, y luego, si estuviéramos interesados en examinar el efecto principal, simplemente tomaríamos el promedio de todos los efectos "aleatorios". Sin embargo, como se señaló anteriormente, los efectos "aleatorios" estimados serían mucho más ruidosos que si hubieran sido ajustados por un modelo de efectos mixtos: en la información de ese grupo, en lugar de tomar prestada la información proporcionada sobre la distribución de los efectos del grupo.