¿Son los ecologistas los únicos que no sabían que el arcoseno es una estupidez?

8

Los datos de proporción, proporción y porcentaje son muy comunes en ecología (p. Ej.,% De flores polinizadas, relación sexo masculino: hembra,% de mortalidad en respuesta a un tratamiento,% de hojas comidas por un herbívoro). Recientemente, algunos estadísticos aplicados publicaron un artículo en la revista Ecology titulado " El arcoseno es estúpido: el análisis de proporciones en ecología ". Señalaron que la transformación del arcoseno ha sido promovida por textos de larga duración como el "Análisis bioestadístico" de Zar y la "Biometría" de Sokal y Rohlf (ambos en su tercer o cuarto eds.), Pero esta técnica ha quedado anticuada por modelos lineales generalizados y una mejor informática :

La transformación de raíz cuadrada de arcoseno ha sido durante mucho tiempo un procedimiento estándar al analizar datos proporcionales en ecología, con aplicaciones en conjuntos de datos que contienen variables de respuesta binomiales y no binomiales. Aquí, sostenemos que la transformación de arcoseno no debe usarse en ninguna circunstancia. Para los datos binomiales, la regresión logística tiene una mayor capacidad de interpretación y mayor poder que los análisis de datos transformados. [...] Para datos no binomiales, la transformación de arcoseno no es deseable por razones de interpretación y porque puede producir predicciones sin sentido. La transformación logit se propone como un enfoque alternativo para abordar estos problemas.

Me preguntaba qué tan comunes son los datos de proporción en otros campos (¿psicología, medicina?) ¿El arcoseno todavía se usa comúnmente en otros campos o los ecólogos son excepcionales en su uso de esta (u otra) técnica pasada de moda o menos que óptima? ¿Ha habido documentos en otros campos que resalten la necesidad de utilizar técnicas más avanzadas?

N Brouwer
fuente

Respuestas:

7

Se lo enseño a estudiantes de salud pública por dos razones:

  • uno de mis colegas lo enseña (en el curso de introducción) como receta mágica, les muestro el método Delta y cómo se deriva;

  • Creo que el método Delta y las transformaciones estabilizadoras de la varianza no son tontas y pueden ser útiles. El intervalo de confianza calculado usando la transformación arcsin con corrección de continuidad no es perfecto pero se comporta razonablemente bien, y para muestras pequeñas es mucho mejor que el procedimiento de Wald, que todavía se usa ampliamente.

Como John para psicología y neurociencia, creo que a muchas personas en epidemiología ni siquiera les importa, solo usan modelos lineales de manera sencilla.

¹ Pires, Amado, 2008. Estimadores de intervalos para una proporción binomial.

Elvis
fuente
1
¿Sabes cómo se compara eso con el CI Agresti-Coull? (Agresti, A. y Coull, BA (1998). Aproximado es mejor que "exacto" para la estimación de intervalos de proporciones binomiales. The American Statistician , 52 (2): 119-126.)
Alexis
5

Puedo decir por experiencia que la psicología y la neurociencia a menudo ni siquiera hacen el esfuerzo de transformar los valores porcentuales para normalizarlos. El análisis modal es un ANOVA o prueba t del% correcto o% error.

Juan
fuente
5

La pregunta sobre la prevalencia del uso de la transformación de arcosina en la ecología y otros campos se puede evaluar yendo a JStor, seleccionando algunas revistas y haciendo una búsqueda de la palabra en las últimas 2 décadas.

La discusión del tema podría aclararse señalando una (entre muchas) razones para no usar el arcsin. Las proporciones se basan en el número de casos. ¿Le daría el mismo peso a una proporción de 2 de 4 casos (no muy confiable) y una proporción más confiable de 20 de 40 casos? La solución natural es utilizar las probabilidades y la razón de probabilidades, y una distribución binomial para probar el cambio en proporción como un cambio en las probabilidades, como se describe en la publicación de arcsin asinine. De esa manera, le das al 50% de 40, debido al 50% de 4.

David Schneider
fuente
2
+1 ¡Bienvenido a nuestro sitio! Si realizó la búsqueda de palabras que recomienda, ¿qué resultados observó?
whuber
Para ser justos, generalmente se señala que solo es apropiado para (al menos aproximadamente) ensayos de igual número a menos que también se pese por el recíproco del tamaño de la muestra. Y tenga en cuenta que los modelos mixtos lineales generalizados generalmente no están cubiertos en los cursos de estadística de pregrado, incluso para los títulos de Matemáticas / Estadísticas; Por lo tanto, es comprensible por qué la transformación del arcoseno tarda tanto en morir.
Scortchi - Restablece a Monica
2
La varianza asintótica es explícita en el artículo vinculado por el OP, por lo que la regresión ponderada es directa en el caso en que se conocen los denominadores. (Si los denominadores son desconocidos, la regresión logística también tiene un problema).
Glen_b -Reinstate a Monica