Tengo 4 grupos que estoy comparando con un criterio. En uno de mis grupos, todos los participantes respondieron lo mismo en cada ítem, es decir, no hay variación.
¿Cómo trato eso en mi ANOVA?
Además, ¿qué hago con eso en la prueba que estoy ejecutando comparándolo con un criterio ya que no obtendré ningún término de error? Si incluyo a un participante que no estoy seguro de incluir en mi estudiante, la variación no es totalmente uniforme con 1 observación diferente de 37, pero cuando la ejecuto, no es significativa porque la variación es demasiado pequeña.
Entiendo que no hay nada que pueda hacer computacionalmente. Me pregunto cómo se maneja conceptualmente.
Aquí hay algunas observaciones para agregar a las respuestas existentes. Creo que es importante pensar conceptualmente por qué estás obteniendo un grupo con variación cero.
Efectos de piso y techo
En mi experiencia en psicología, este ejemplo aparece con mayor frecuencia cuando hay un piso o techo en una escala, y tienes algunos grupos que se encuentran en el medio de la escala y otros que caen en el extremo. Por ejemplo, si su variable dependiente es la proporción de ítems correctos de cinco preguntas, entonces puede encontrar que su grupo "inteligente" se vuelve 100% correcto o que su "grupo clínico" obtiene 0% correcto.
En este caso:
Grupo muy pequeño
Otro caso en el que no puede obtener variación del grupo es donde tiene un grupo con un tamaño de muestra realmente pequeño (por ejemplo,n < 5 ), generalmente en combinación con una variable dependiente que es bastante discreta.
En este caso, puede estar más inclinado a poner la falta de variación al azar y proceder con una prueba t estándar.
fuente
Hace un par de años, me habría suscrito completamente a la respuesta de @Michael Chernick.
Sin embargo, me di cuenta recientemente de que algunas implementaciones de la prueba t son extremadamente robustas para la desigualdad de las variaciones. En particular, en R la función
t.test
tiene un parámetro predeterminadovar.equal=FALSE
, lo que significa que no se basa simplemente en una estimación agrupada de la varianza. En cambio, utiliza los grados de libertad aproximados de Welch-Satterthwaite , que compensa las variaciones desiguales.Veamos un ejemplo.
Puede ver que R afirma realizar la prueba t de Welch y no la prueba t de Student . Aquí se afirma que el grado de libertad es 99, a pesar de que cada muestra tiene un tamaño de 100, por lo que aquí la función esencialmente prueba la primera muestra contra el valor fijo 0.
Puede verificar usted mismo que esta implementación proporciona valores p correctos ( es decir, uniformes) para dos muestras con variaciones muy diferentes.
Ahora, esto fue para una prueba t de dos muestras. Mi propia experiencia con ANOVA es que es mucho más sensible a la desigualdad de las variaciones. En ese caso, estoy totalmente de acuerdo con @Michael Chernick.
fuente
Bajo ciertas circunstancias, puede ser posible calcular un límite superior sobre cuál podría ser la varianza para la población, y luego usar esa varianza en algo como una prueba t con varianzas desiguales.
Por ejemplo, si preguntó a 10 estudiantes elegidos al azar en una escuela de 100 estudiantes cuál es su día favorito en marzo y todos respondieron el 15, sabrá que la mayor variación que podría tener para la población estudiantil es la variación de 10 valores de 15, 45 valores de 1 y 45 valores de 31, que es 204.6364.
Una variación mayor debería dificultar la detección de una diferencia, de modo que una prueba t que use este límite superior en la variación sería conservadora para detectar una diferencia. Eso significa que estaría seguro de una diferencia significativa resultante de una prueba t usando el límite superior de la varianza, pero si no encuentra una diferencia significativa, no sabría mucho, porque una diferencia significativa aún sería consistente con Algunas de las variaciones más pequeñas que son posibles.
Por supuesto, puede que no haya muchas situaciones en las que realmente puedas resolver esto, pero podría ser posible.
fuente