Es difícil para mí aceptar que Donald Rubin alguna vez inventará una verdadera técnica. Sin embargo, esa es mi percepción del BESD [ 1 , 2 , 3 ].
El artículo original de Rosenthal y Rubin (1982) afirmaba que era valioso mostrar "cómo reestructurar cualquier correlación de momento de producto en una visualización [2x2], ya sea que los datos originales sean continuos o categóricos".
La siguiente tabla es de p. 451 del segundo enlace anterior:
Esta técnica parece exagerar la magnitud de casi cualquier tamaño de efecto. Aquí, de los datos originales = .01, pero cuando se "traduce" a una tabla de contingencia 2x2, parece que nos enfrentamos a un efecto mucho más fuerte. No niego que, cuando los datos se vuelven a transmitir en formato categórico de esta manera, hecho = .1, pero siento que algo se ha distorsionado mucho en la traducción. ϕ
¿Me estoy perdiendo algo realmente valioso aquí? Además, tengo la impresión de que en los últimos 10 años más o menos la comunidad estadística ha rechazado en gran medida esto como un método legítimo. ¿Me equivoco al respecto?
La ecuación para calcular las tasas de éxito ( ) experimentales ( ) y de control ( ), respectivamente, es simplemente:C s r
y
Referencia:
Rosenthal, R. y Rubin, DB (1982). Una simple exhibición de propósito general de la magnitud del efecto experimental. Revista de Psicología Educativa, 74 , 166-169.
fuente
Respuestas:
Puedo demostrar que es parcial (creo), pero no puedo explicar por qué. Espero que alguien pueda ver mi respuesta y ayudar a explicarla más.
Como en muchos metanálisis y la imagen que publicó, muchas personas interpretan el BESD como: Si dividiera ambas variables, colocaría con precisión a las personas en las celdas "correctas" de una tabla de contingencia 2 x 2, un porcentaje dado de el tiempo.
Entonces, si , la gente podría decir: "Dada esta observada , puedes pensarlo así: las personas que están por encima de la mediana en X también estarían por encima de la mediana en Y el 70% del tiempo. " Así es como Kraus (1995, p. 69) lo interpreta (se basa en una situación hipotética en la que una variable es verdaderamente dicotómica, mientras que la otra es una división mediana):r.50+r/2=.70 r
Las personas han utilizado a menudo metáforas médicas, también: "Este corresponde a una diferencia de 40 puntos porcentuales entre las personas en un control y condición experimental."r
Para ver si la interpretación de esqueleto dividido en mediana es sesgada, simulé una población de 1,000,000 de casos donde la población verdadera . Luego dibujé a 100 personas de esta población, calculé la "tasa correcta" de BESD (es decir, ), y luego calculé las celdas divididas medianas reales para una tabla de contingencia 2 x 2, como la descrita anteriormente para categorizar personas "correctamente". Hice esto 10,000 veces..50 + r / 2r=.38 .50+r/2
Luego tomé la media y la desviación estándar de cada uno de estos vectores de 10,000 de longitud. El código:
Basado en BESD, obtenemos esta tabla, donde
v1
y nosv2
referimos a variableslow
y noshigh
referimos a debajo y arriba de la mediana, respectivamente:Basado en hacer una división mediana con los datos en bruto, obtenemos esta tabla:
Entonces, si bien alguien podría argumentar, utilizando BESD, que hay una "diferencia de 38 puntos porcentuales en control y experimental", la división mediana real tiene este número en 24.
No estoy seguro de por qué sucede esto, o si depende del tamaño de la muestra y la correlación (uno podría hacer más simulaciones para descubrirlo), creo que esto muestra que está sesgado. Me encantaría que alguien pudiera intervenir con una explicación matemática, en lugar de computacional.
fuente
La intuición de Mark White es incorrecta. El BESD en realidad no está modelando una división mediana. Una división mediana está asociada con la pérdida real de información estadística: atenúa sistemáticamente las relaciones (consulte http://psycnet.apa.org/record/1990-24322-001), razón por la cual los valores medianos de división muestran una precisión menor que la BESD. El BESD está demostrando la precisión de la clasificación como si las variables fueran realmente dicotómicas, no dicotomizadas artificialmente a través de una división mediana. Para ver esto, calcule la correlación en la mediana de los datos divididos. Verá que es más pequeño que la correlación para las variables originales. Si las variables fueran originalmente binarias, los dos métodos estarían de acuerdo. Por su naturaleza, el BESD muestra variables como si fueran realmente binarias. Cuando se usa para variables continuas, esto necesariamente representa una abstracción: en realidad no hay grupos de "éxito" y "fracaso" o "tratamiento" y "control",
El BESD no está sesgado. Refleja con precisión el impacto de un tratamiento particular en la precisión de la clasificación si estuviéramos trabajando con dos variables binarias. Es una muestra útil para demostrar el valor práctico potencial de una medida o tratamiento, y sí, demuestra que incluso los efectos con una pequeña variación explicada por las estadísticas pueden ser significativamente importantes. El BESD se usa ampliamente en la práctica psicológica y organizativa aplicada, y está muy de acuerdo con otras visualizaciones prácticas del tamaño del efecto (p. Ej., Que seleccionar de arriba a abajo un grupo utilizando una medida con una correlación de validez de r = .25 conducirá a un .25 SD aumento en el rendimiento del resultado entre el grupo seleccionado versus un grupo no seleccionado).
La variación explicada por las estadísticas conduce constantemente a malentendidos y subestima el tamaño de las relaciones variables porque la operación de cuadratura no es lineal. Muchos metodólogos aplicados (por ejemplo, https://us.sagepub.com/en-us/nam/methods-of-meta-analysis/book240589 ) desaconsejan su uso en favor de sus raíces cuadradas (que transmiten con mayor precisión el tamaño de efectos).
fuente