Soy un estudiante de doctorado en psicología experimental y me esfuerzo por mejorar mis habilidades y conocimientos sobre cómo analizar mis datos.
Hasta mi quinto año en psicología, pensé que los modelos de regresión (por ejemplo, ANOVA) suponen lo siguiente:
- normalidad de los datos
- homogeneidad de varianza para los datos, etc.
Mis cursos de pregrado me llevan a creer que las suposiciones se referían a los datos. Sin embargo, en mi quinto año, algunos de mis instructores subrayaron el hecho de que los supuestos se refieren al error (estimado por los residuos) y no a los datos sin procesar.
Recientemente estuve hablando sobre la pregunta de los supuestos con algunos de mis colegas que también admitieron que descubrieron la importancia de verificar los supuestos sobre el residuo solo en sus últimos años de universidad.
Si entiendo bien, los modelos de regresión hacen suposiciones sobre el error. Por lo tanto, tiene sentido verificar los supuestos sobre los residuos. Si es así, ¿por qué algunas personas verifican los supuestos sobre los datos sin procesar? ¿Es porque dicho procedimiento de verificación se aproxima a lo que obtendríamos al verificar el residual?
Me interesaría mucho en una discusión sobre este tema con algunas personas que tienen un conocimiento más preciso que mis colegas y yo. Les agradezco de antemano sus respuestas.
fuente
Encuentro inútil la diferenciación entre los residuos y los datos sin procesar, ya que ambos se refieren más a su muestra real y no a la distribución de la población subyacente. Es mejor pensar que algunos requisitos son "requisitos dentro del grupo" y otros "entre supuestos grupales".
Por ejemplo, la homogeneidad de la varianza es una "suposición entre grupos", ya que dice que la varianza dentro del grupo es la misma para todos los grupos.
La normalidad es una suposición "dentro del grupo" que requiere que dentro de cada grupo y se distribuya normalmente.
Tenga en cuenta que tener normalidad en toda su materia prima generalmente significa que no tiene ningún efecto: observe la distribución de género sin diferenciar entre mujeres y hombres. No se distribuirá normalmente, debido al fuerte efecto de género. Pero dentro de cada género se mantiene bastante bien.
fuente