Como una suposición de regresión lineal, la normalidad de la distribución del error a veces se "extiende" o interpreta erróneamente como la necesidad de normalidad de y o x.
¿Es posible construir un escenario / conjunto de datos donde X e Y no sean normales pero el término de error lo sea y, por lo tanto, las estimaciones de regresión lineal obtenidas sean válidas?
Respuestas:
Ampliando el comentario de Hong Oois con una imagen. Aquí hay una imagen de un conjunto de datos donde ninguno de los marginales está normalmente distribuido pero los residuales aún lo están, por lo que los supuestos de regresión lineal siguen siendo válidos:
La imagen fue generada por el siguiente código R:
fuente