¿Debo incluir un argumento para solicitar sumas de cuadrados de tipo III en ezANOVA?

16

Desarrollé el paquete ez para R como un medio para ayudar a la gente a hacer la transición de paquetes de estadísticas como SPSS a R. Esto se logra (con suerte) simplificando la especificación de varios sabores de ANOVA y proporcionando una salida similar a SPSS (incluidos los tamaños de los efectos y la suposición pruebas), entre otras características. La ezANOVA()función sirve principalmente para envolver car::Anova(), pero la versión actual de ezANOVA()implementa solo sumas de cuadrados de tipo II, mientras que car::Anova()permite la especificación de sumas de cuadrados de tipo II o -III. Como posiblemente debería haber esperado, varios usuarios han solicitado que proporcione un argumento enezANOVA()que permite al usuario solicitar tipo II o tipo III. He sido reticente a hacerlo y describo mi razonamiento a continuación, pero agradecería la opinión de la comunidad sobre mi o cualquier otro razonamiento que tenga relación con el tema.

Razones para no incluir un argumento "SS_type" en ezANOVA():

  1. La diferencia entre los cuadrados de suma de tipo I, II y III solo surge cuando los datos están desequilibrados, en cuyo caso diría que se obtiene más beneficio de mejorar el desequilibrio mediante una recopilación de datos adicional que jugar con el cálculo ANOVA.
  2. La diferencia entre los tipos II y III se aplica a los efectos de orden inferior que están calificados por los efectos de orden superior, en cuyo caso considero que los efectos de orden inferior no son científicamente interesantes. (Pero vea a continuación la posible complicación del argumento)
  3. Para esas raras circunstancias en las que (1) y (2) no se aplican (cuando la recopilación de datos adicional es imposible y el investigador tiene un interés científico válido en un efecto principal calificado que actualmente no puedo imaginar), se puede modificar con relativa facilidad la ezANOVA()fuente o se emplea car::Anova()para lograr pruebas de tipo III De esta manera, veo el esfuerzo / comprensión adicional requerido para obtener pruebas de tipo III como un medio por el cual puedo asegurarme de que solo aquellos que realmente saben lo que están haciendo sigan ese camino.

Ahora, el solicitante de tipo III más reciente señaló que el argumento (2) se ve socavado por la consideración de circunstancias donde los efectos de orden superior existentes pero "no significativos" pueden sesgar el cálculo de sumas de cuadrados para efectos de orden inferior. En tales casos, es imaginable que un investigador observe el efecto de orden superior y, al ver que es "no significativo", recurra a la interpretación de los efectos de orden inferior que, sin el conocimiento del investigador, se han visto comprometidos. Mi reacción inicial es que esto no es un problema con sumas de cuadrados, sino con valores p y la tradición de la prueba de hipótesis nulas. Sospecho que una medida de evidencia más explícita, como la razón de probabilidad, podría ser más probable que produzca una imagen menos ambigua de los modelos compatibles con los datos. Sin embargo, no tengo

Mike Lawrence
fuente
2
En breve sí. Simplemente para permitir la coherencia con otros paquetes (incluso si el resultado fue "incorrecto" de alguna manera, en cuyo caso un masaje de advertencia estaría bien). ¡Y gracias por tu increíble paquete!
Tal Galili
Cuando escribí "paquetes" me refería a otros paquetes estadísticos (como SPSS y SAS). Me alegra que otros hayan llevado el punto más lejos a casa que yo. :)
Tal Galili
2
Como muchos ya saben, el paquete ez actual (versión 3) ha actualizado ezANOVA, que tiene argumentos para SS Type y devuelve el modelo aov.
jiggysoo

Respuestas:

9

Solo para amplificar: creo que soy el solicitante más reciente.

En comentarios específicos sobre los puntos de Mike:

  1. Es claramente cierto que la diferencia I / II / III solo se aplica con predictores correlacionados (de los cuales los diseños desequilibrados son el ejemplo más común, ciertamente en ANOVA factorial), pero esto me parece un argumento que descarta el análisis de la situación desequilibrada (y, por lo tanto, cualquier debate de Tipo I / II / III). Puede ser imperfecto, pero así es como suceden las cosas (y en muchos contextos los costos de una mayor recopilación de datos superan el problema estadístico, a pesar de las advertencias).

  2. Esto es completamente justo y representa la carne de la mayoría de los argumentos de "II versus III, favoreciendo II" que he encontrado. El mejor resumen que he encontrado es Langsrud (2003) "ANOVA para datos desequilibrados: use sumas de cuadrados de Tipo II en lugar de Tipo III", Estadísticas y Computación 13: 163-167 (Tengo un PDF si el original es difícil de encontrar ) Él argumenta (tomando el caso de dos factores como el ejemplo básico) que si hay una interacción, hay una interacción, por lo que la consideración de los efectos principales generalmente no tiene sentido (un punto obviamente claro), y si no hay interacción, el análisis de Tipo II de Los efectos principales son más potentes que el Tipo III (sin duda), por lo que siempre debe ir con el Tipo II. He visto otros argumentos (por ejemplo, Venables,

  3. Y estoy de acuerdo con esto: si tiene una interacción pero también tiene alguna pregunta sobre el efecto principal, entonces es probable que esté en territorio de bricolaje.

Está claro que hay quienes solo quieren el Tipo III porque SPSS lo hace, o alguna otra referencia a la Autoridad Superior estadística. No estoy totalmente en contra de este punto de vista, si se trata de una elección de muchas personas que se apegan a SPSS (que tengo algunas cosas en contra, a saber, el tiempo, el dinero y las condiciones de caducidad de la licencia) y las SS Tipo III, o muchas personas cambiando a R y Tipo III SS. Sin embargo, este argumento es claramente cojo estadísticamente.

Sin embargo, el argumento que encontré más sustancial a favor del Tipo III es el que Myers & Well (2003, "Diseño de investigación y análisis estadístico", págs. 323, 626-629) y Maxwell & Delaney (2004, hicieron independientemente). Diseño de experimentos y análisis de datos: una perspectiva de comparación de modelo ", págs. 324-328, 332-335). Eso es lo siguiente:

  • si hay una interacción, todos los métodos dan el mismo resultado para la suma de cuadrados de interacción
  • Tipo II asume que no hay interacción para su prueba de efectos principales; tipo III no
  • Algunos (por ejemplo, Langsrud) argumentan que si la interacción no es significativa, entonces está justificado suponer que no hay una y observar los efectos principales (más potentes) de Tipo II
  • Pero si la prueba de la interacción tiene poca potencia, pero hay una interacción, la interacción puede resultar "no significativa" y aún así conducir a una violación de los supuestos de la prueba de efectos principales de Tipo II, lo que sesga esas pruebas para que sean demasiado liberales. .
  • Myers & Well citan a Appelbaum / Cramer como los principales defensores del enfoque de Tipo II, y continúan [p323]: "... Se podrían utilizar criterios más conservadores para la no importancia de la interacción, como exigir que la interacción no sea significativa en el nivel .25, pero no hay una comprensión suficiente de las consecuencias de incluso este enfoque. Como regla general, las sumas de cuadrados Tipo II no deben calcularse a menos que haya una razón a priori fuerte para asumir que no hay efectos de interacción, y una interacción claramente no significativa suma de cuadrados." Citan [p629] En general, Lee y Hornick 1981 como una demostración de que las interacciones que no se acercan a la importancia pueden sesgar las pruebas de los efectos principales. Maxwell y Delaney [p334] abogan por el enfoque de Tipo II si la interacción de la población es cero, por poder, y el enfoque Tipo III si no lo es [para la interpretabilidad de los medios derivados de este enfoque]. También abogan por usar el Tipo III en la situación de la vida real (cuando está haciendo inferencias sobre la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema! haciendo inferencias acerca de la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema! haciendo inferencias acerca de la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema!

Entonces, mi interpretación (¡y no soy un experto!) Es que hay mucha autoridad estadística superior en ambos lados del argumento; que los argumentos habituales presentados no se refieren a la situación habitual que daría lugar a problemas (esa situación es la común de interpretar los efectos principales con una interacción no significativa); y que hay razones justas para preocuparse por el enfoque de Tipo II en esa situación (y todo se reduce a una cuestión de sobre-liberalismo de poder versus potencial).

Para mí, eso es suficiente para desear la opción Tipo III en ezANOVA, así como el Tipo II, porque (por mi dinero) es una interfaz excelente para los sistemas ANOVA de R. R es, desde mi punto de vista, fácil de usar para los novatos, y el paquete "ez", con ezANOVA y las funciones de trazado de efectos bastante encantadoras, hace que R sea accesible para un público de investigación más general. Algunos de mis pensamientos en progreso (y un truco desagradable para ezANOVA) están en http://www.psychol.cam.ac.uk/statistics/R/anova.html .

¡Estaría interesado en escuchar los pensamientos de todos!

Cardenal Rudolf
fuente
Ah, no me había dado cuenta de que la distinción de tipo II / III surge cada vez que los predictores están correlacionados, de los cuales un diseño desequilibrado es solo un ejemplo. Esto ciertamente socava aún más mi primer argumento de "solo recolectar más datos".
Mike Lawrence el
2
Estoy bastante convencido por su argumento de que R obtendrá más conversiones de SPSS si se les proporcionan medios fáciles de lograr análisis familiares, incluso si estos análisis requieren una consideración más matizada de la que se aplica normalmente. Luego, una vez que los tenemos enganchados a R, podemos intentar convencerlos de que el enfoque familiar no siempre es necesariamente el enfoque apropiado. Creo que aún pondré el valor predeterminado como tipo = 2 con una gran advertencia en la documentación de que este valor predeterminado puede arrojar resultados que difieren de SPSS y los enlaces hacen documentación sobre la distinción de tipo II / III.
Mike Lawrence
Otras variaciones en los predictores correlacionados son generalmente con predictores continuos, pero sí, ese es el problema general. // ¡Eso suena genial para mi! Algunas veces estos cambios son lentos; El uso de correcciones de esfericidad (en lugar de ignorar el problema) es uno que creo que se ha avanzado en la neurociencia. Hubo momentos en que cualquier mención de él (especialmente si informaba el df corregido, no entero) hizo que los árbitros pensaran que estaba ladrando.
Rudolf Cardenal
Me gustaría agregar que los argumentos del Tipo III se refieren a pruebas de hipótesis conservadoras o liberales, pero no al significado de los componentes. Un efecto principal en el Tipo III simplemente no es sensible porque incluye la interacción con los efectos principales que faltan. Independientemente de los problemas de prueba conservadores o liberales, la coherencia del modelo básico requiere el Tipo II porque tiene sentido un efecto principal del Tipo II. Dicho esto, ezANOVA debería tener el Tipo III por otras razones.
John
7

Advertencia: una respuesta puramente no estadística. Prefiero trabajar con una función (o al menos un paquete) cuando hago el mismo tipo de análisis (por ejemplo, ANOVA). Hasta ahora, lo uso constantemente, Anova()ya que prefiero su sintaxis para especificar modelos con medidas repetidas, en comparación con aov(), y pierdo poco (SS tipo I) con medidas no repetidas. ezANOVA()es bueno para el beneficio adicional de los tamaños de efecto. Pero lo que no me gusta especialmente es tener que lidiar con 3 funciones diferentes para hacer esencialmente el mismo tipo de análisis, solo porque una de ellas implementa la característica X (pero no Y), y la otra Y (pero no X).

Para ANOVA, puedo elegir entre oneway(), lm(), aov(), Anova(), ezANOVA(), y probablemente otros. Al enseñar R, ya es difícil explicar las diferentes opciones, cómo se relacionan entre sí ( aov()es una envoltura para lm()) y qué función hace qué:

  • oneway()solo para diseños de factor único pero con opción var.equal=FALSE. No existe tal opción en aov()y otras, pero esas funciones también para diseños multifactoriales.
  • sintaxis para medidas repetidas un poco complicada aov(), mejor enAnova()
  • SS conveniente tipo I solo en aov(), no enAnova()
  • SS conveniente tipo II y III solo en Anova(), no enaov()
  • El tamaño conveniente del efecto mide en ezANOVA(), no en otros

Sería genial tener que enseñar una sola función con una sintaxis coherente que lo haga todo. Sin el conveniente SS tipo III, ezANOVA()no puede ser esa función para mí porque sé que se les pedirá a los estudiantes que los usen en algún momento ("simplemente verifique estos resultados que John Doe obtuvo con SPSS"). Creo que es mejor tener la opción de elegir uno mismo sin tener que aprender otra sintaxis para especificar modelos. La actitud de "Sé lo que es mejor para ti" puede tener sus méritos, pero puede ser sobreprotectora.

lince
fuente
1
Para agregar un requisito adicional: sería totalmente increíble si la función también pudiera ejecutar todo tipo de contrastes desde este ANOVA, por ejemplo, usando el multcomppaquete (que, hasta donde recuerdo, requiere aovobjetos). De lo contrario, estoy de acuerdo totalmente y normalmente uso ezpara mi trabajo diario, porque es muy fácil ...
Henrik
1
agregar un argumento de "método" (con valores posibles como "oneway", "aov" y "Anova", y con un argumento "..." para pasar var.eq = FALSE a oneway y escribir = 2 a Anova) es una idea intrigante, y ciertamente parece que sería lo suficientemente fácil de incorporar. Gracias por la sugerencia.
Mike Lawrence
@Henrik: Tengo que ser honesto porque mi comprensión de los contrastes es muy limitada y nunca los uso en mi investigación, por lo que no he priorizado la incorporación de contrastes en ez.
Mike Lawrence el
@Mike Si puede agregar el argumento del método y su función podría devolver un aovelemento que sería genial. Hasta ahora, generalmente soy demasiado flojo para hacer mi propio aovelemento y usarlo en su ezANOVAlugar con t.tests ...
Henrik
@ Mike, no me había atrevido a sugerir algo así, ya que es tu trabajo lo que estás haciendo. ¡Gracias por eso! El ezpaquete tiene un gran potencial: en psicología, ya se recomienda con bastante frecuencia (véase el libro alemán "R für Einsteiger" de Luhmann). Hacerlo aún más flexible sin duda sería apreciado.
caracal
2

Al mundo R no le gusta mucho el Tipo 3 SS.

Una de las referencias generalmente citadas es "Exegeses on Linear Models" de Bill Venables (2000) .

Espero no equivocarlo, pero creo que su argumento principal es que las SS Tipo 3 violan el principio de marginalidad de los modelos lineales y, por lo tanto, no son razonables.

Henrik
fuente
0

Este ha sido un debate revelador sobre el tema del tipo II / III para mí. Gracias por el esfuerzo de todos en proporcionar la discusión. Llegué a la idea de promover el tipo II de manera consistente sobre el tipo III, pero tenía un débil conocimiento del argumento: solo me basé en el consejo del libro de regresión de John Fox que recomendaba que las pruebas de tipo III rara vez interpretable (bueno, creo que dijo eso ...).

De todos modos, ezANOVA es realmente útil para permitir el acceso a la funcionalidad R que de otro modo sería imposible para los estudiantes universitarios que enseño en psicología. Proporciono módulos R en línea, uno con ezANOVA para demostrar diseños ANOVA mixtos (aunque parece que la versión previa 3 puede haber tenido errores para esto ... ¡doh!)

Pruébalo aquí:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

después de que se carga el módulo (~ 10s), encuentre el botón de cálculo (a mitad de la página) y ejecutará ezANOVA y las tablas y diagramas asociados.

Ian


fuente
Cuando dice que ez tenía errores para diseños ANOVA mixtos, ¿está basando esto en mi reciente anuncio de la versión 3.0 en el que noto que había un error en el código ezMixed ()? Si es así, creo que malinterpretaste esa nota. ezMixed () no está relacionado con ezANOVA (). ezMixed () sirve para ayudar a evaluar la influencia de los efectos fijos en un contexto de modelado de efectos mixtos.
Mike Lawrence
Hola Mike, tienes razón, fue tu nota en ezMixed (). Leí y malinterpreté esto para ezANOVA ().