¿Cuándo / por qué la tendencia central de una simulación de remuestreo difiere notablemente del valor observado?

8

¿Se debe esperar siempre que la tendencia central (es decir, media y / o mediana) de una muestra bootstrap sea similar al valor observado?

En este caso particular, tengo respuestas que se distribuyen exponencialmente para los sujetos en dos condiciones (no ejecuté el experimento, solo tengo los datos). Se me ha encomendado la tarea de ajustar el tamaño del efecto (en términos de d de Cohen, la fórmula de una muestra, es decirMETROre¯sredonde está la estimación muestral de la desviación estándar de la población. El foro para esto se proporciona en Rosenthal y Rosnow (2008) en la página 398, ecuación 13.27. Ellos usanσ en el denominador porque es históricamente correcto, sin embargo, la práctica estándar ha definido erróneamente que d s, y así sigo con ese error en el cálculo anterior.

He aleatorizado tanto dentro de los participantes (es decir, se puede tomar una muestra de RT de los participantes más de una vez) como entre sujetos (se puede tomar una muestra de los participantes más de una vez) de modo que incluso si el participante 1 se muestrea dos veces, es poco probable que su RT media en ambas muestras exactamente igual Para cada conjunto de datos aleatorizado / muestreado recalculo d. En este casonortesyometro=10000. Lo que estoy observando es una tendencia a que el valor observado de Cohen d sea típicamente más cercano al percentil 97.5 de que el percentil 2.5 de los valores observados simulados. También tiende a estar más cerca de 0 que la mediana de la rutina de carga (en un 5% a 10% de la densidad de la distribución simulada).

¿Qué puede explicar esto (teniendo en cuenta la magnitud del efecto que estoy observando)? ¿Se debe a que es "más fácil" al realizar un nuevo muestreo obtener variaciones más extremas que las observadas en relación con la extremidad de los medios al realizar el nuevo muestreo? ¿Podría ser esto un reflejo de datos que han sido excesivamente masajeados / recortados selectivamente? ¿Es este enfoque de remuestreo lo mismo que un bootstrap? Si no, ¿qué más se debe hacer para llegar a un CI?

russellpierce
fuente

Respuestas:

4

Cualquier estadística no lineal (una combinación no lineal de estadísticas lineales, como medias de muestra) tiene un pequeño sesgo de muestra. De Cohenre obviamente no es una excepción: es esencialmente

re=metro1-metro2metro3-metro4 42
que es bastante no lineal, al menos en lo que respecta a los términos en el denominador. Cada uno de los momentos puede considerarse un estimador imparcial de lo que se supone que debe estimar:
metro1=1norte1yogrupo 1yyo,metro2=1norte2yogrupo 2yyo,metro3=1norte1+norte2yoyyo2,metro4 4=1norte1+norte2yoyyo,
Sin embargo, por la desigualdad de Jensen no hay forma en la Tierra de obtener una estimación imparcial de la cantidad de población a partir de una combinación no lineal. Asími[re] población re en muestras finitas, aunque el sesgo es típicamente del orden de O(1/ /norte). El artículo de Wikipedia sobre los tamaños del efecto menciona los pequeños sesgos de muestra en la discusión de Hedgessol.

Me imagino que Cohen's re tiene un rango limitado (en el caso extremo, si no hay variabilidad dentro de los grupos, entonces re debe ser igual ±2, ¿verdad?), por lo tanto, su distribución de muestreo debe estar sesgada, lo que contribuye a los sesgos de la muestra finita (alguna función de la asimetría de la distribución de muestreo es típicamente el multiplicador frente a 1/ /norteque mencioné anteriormente). Cuanto más cerca esté de los límites del rango permitido, más pronunciada es la asimetría.

Lo que hace bootstrap, más bien milagrosamente considerando que es un método tan simple, es que le da la capacidad de estimar este sesgo de muestra finita mediante la comparación de la media de bootstrap y la estimación de la muestra original. (Sin embargo, tenga en cuenta que, a menos que realice ajustes especiales en la configuración del muestreo de bootstrap, el primero estará sujeto a la variabilidad de Monte Carlo). Proporcioné explicaciones más detalladas y técnicas en otra pregunta de bootstrap que vale la pena leer de todos modos.

Ahora, si hay un sesgo positivo, es decir, la estimación basada en la muestra original está sesgada hacia arriba en relación con la población re, entonces el bootstrap se burlará de eso y producirá estimaciones que son, en promedio, incluso más altas que la estimación de la muestra. En realidad, no es tan malo como parece, ya que puede cuantificar el sesgo y restarlo de la estimación original. Si la estimación original de una cantidad eraθ^norte, y el bootstrap medio de las réplicas de bootstrap es θ¯norte, entonces la estimación de sesgo es si^norte=θ¯norte-θ^norte, y una estimación corregida por sesgo es θ^norte-si^norte=2θ^norte-θ¯norte.

StasK
fuente
1
Ya sabía que la d de Cohen era una estadística sesgada. Aprecio los detalles con respecto a las razones por las cuales está sesgado. Sin embargo, soy un poco escéptico de que esté sesgado en el grado que estoy observando. El artículo de Wikipedia no define 'a' en la ecuación referenciada. Además, la ecuación referenciada y la suya parecen hacer referencia a las dos versiones de muestra de d de Cohen. Entonces, no estoy seguro de qué magnitud de sesgo debería esperar en este caso y si su respuesta cubre la diferencia que estoy viendo.
russellpierce
Tampoco tengo claro cómo combinar tus dos últimos párrafos. Bootstrap le permitirá estimar el sesgo, pero también generará resultados más sesgados que la muestra original.
russellpierce
No hay una en mis fórmulas: ¿cuál es el unaa que te refieres? Actualicé el último párrafo para demostrar cómo obtener estimaciones de bootstrap con corrección de sesgo. No soy un experto en tamaños de efectos, y no proporcionó ningún enlace, por lo que he utilizado la mejor información disponible para mí, que era Wikipedia. Si 1 muestra de Cohenrees similar, y también no lineal, entonces mi explicación se aplica cualitativamente.
StasK
La fórmula g de Hedge en el artículo vinculado utiliza una. Actualizaré mi pregunta para incluir la muestra d referencia de Cohen. De hecho, no es lineal. Tu respuesta prediceO(1/ /norte)sesgo, pero la diferencia observada fue mucho más extrema que eso, por lo que no creo que su respuesta cubra el problema que estoy viendo. He proporcionado más detalles arriba; puede ser que no implementé correctamente el procedimiento de arranque.
russellpierce
O(1/ /norte)Es solo la tasa. He visto algunos resultados bastante tontos donde la constante frente a eso1/ /norte se derivó el término (no me malinterpreten, este levantamiento muy pesado deriva estas constantes, más difícil que establecer la tasa en sí), por lo que todo parecía 1-108/ /norte para una probabilidad que se supone converge a 1. una en la fórmula de Wikipedia es solo un índice ficticio, como yo en resumen o Xen integración; quien escribió el artículo lo pegó allí para mostrar queJ(una)es una abreviatura de la relación de funciones gamma.
StasK