Mire este extracto del "Manual de habilidades de estudio", Palgrave, 2012, de Stella Cottrell, página 155:
Porcentajes Aviso cuando se dan porcentajes.
Supongamos, en cambio, que la declaración anterior dice:El 60% de las personas preferían las naranjas; El 40% dijo que prefería las manzanas.
Esto parece convincente: se dan cantidades numéricas. Pero es la diferencia entre el 60% y el 40% significativa ? Aquí necesitaríamos saber a cuántas personas se les preguntó. Si se preguntara a 1000 personas de las cuales 600 preferían las naranjas, el número sería convincente. Sin embargo, si solo se les preguntó a 10 personas, el 60% simplemente significa que 6 personas prefirieron las naranjas. "60%" suena convincente de una manera que "6 de 10" no lo hace. Como lector crítico, debe estar atento a los porcentajes que se utilizan para que los datos insuficientes se vean impresionantes.
¿Cómo se llama esta característica en las estadísticas? Me gustaría leer más al respecto.
Respuestas:
Me gustaría enumerar otro ejemplo intuitivo.
Supongamos que te digo que puedo predecir el resultado de cualquier lanzamiento de moneda. No crees y quieres probar mi habilidad.
Lo probaste 5 veces, y las acerté todas. ¿Crees que tengo la habilidad especial? Tal vez no. Porque puedo corregirlos todos por casualidad. (Específicamente, suponga que la moneda es una moneda justa, y cada experimento es independiente, entonces puedo obtener todos los derechos con sin superpoder. Vea el enlace de Shufflepants para una broma al respecto).0.55≈0.03
Por otro lado, si me probaste muchas veces, es muy poco probable que pueda obtenerlo por casualidad. Por ejemplo, si probó veces, la probabilidad de que las haga bien es 0.5 100 ≈ 0 .100 0.5100≈0
El concepto estadístico se llama poder estadístico, de Wikipeida
Volviendo al ejemplo de super power on coin flip, esencialmente quieres ejecutar una prueba de hipótesis.
Ahora, como puede ver en el ejemplo numérico (probarme 5 veces frente a probarme 100 veces), el poder estadístico se ha visto afectado por el tamaño de la muestra.
Más para leer aquí . (más técnico y basado en la prueba t).
Aquí se puede encontrar una herramienta interactiva para comprender el poder estadístico . Tenga en cuenta que el poder estadístico cambia con el tamaño de la muestra.
fuente
Piénselo en términos de proporciones. Digamos que preferir una naranja es un éxito, mientras que preferir una manzana es un fracaso. Entonces, su tasa de éxito promedio es o en este caso .6μ=# of sucessesn
Se estima que el error estándar de esta cantidad es . Para un tamaño de muestra pequeño (es decir, 10), el error estándar es≈.155pero para un tamaño de muestra de 1000, el error estándar es≈.0155. Básicamente, como se mencionó en los comentarios, "el tamaño de la muestra es importante".μ(1−μ)n−−−−−√ ≈.155 ≈.0155
fuente
Este concepto es una consecuencia de la ley de los grandes números . De Wikipedia ,
Los resultados de una muestra pequeña pueden estar más lejos del valor esperado que el de una muestra más grande. Y así, como se indica en la pregunta, uno debe tener cuidado con los resultados calculados a partir de pequeñas muestras. La idea también se explica bastante bien en este video de YouTube .
fuente
Estamos en la situación de estimar una cantidad de población por una cantidad de muestra. En este caso, estamos utilizando proporciones de muestra para estimar las proporciones de la población, pero el principio es considerablemente más general.
A medida que tomamos muestras cada vez más grandes (usando muestreo aleatorio), las medias de la muestra tenderán a converger a la media de la población. (Esta es la ley de los grandes números).
Sin embargo, lo que realmente queremos tener es una idea de cuán lejos podríamos estar (tal como podría estar representado por el ancho de un intervalo de confianza para la proporción, o por el margen de error, que normalmente es la mitad de ese ancho) .
Como resultado, tenemos más confianza en la precisión de nuestra estimación cuando la muestra es grande; si repetimos nuestro experimento nuevamente, otros medios similares estarían cerca del actual: se agrupan cada vez más estrechamente, y porque (en este caso) nuestra estimación es imparcial, se agrupan alrededor de los valores que estamos tratando de estimar. Una media de muestra única se vuelve cada vez más informativa sobre dónde podría estar la media de la población.
fuente
Una regla general para las estadísticas de "conteo", como contar el número de personas a las que les gustan las naranjas, o contar el número de "clics" en un contador Geiger debido a la desintegración radiactiva, es que el margen de error para el conteo es aproximadamente el cuadrado -raíz del valor de conteo esperado. Las estadísticas de conteo son conocidas como estadísticas de Poisson.
La raíz cuadrada de 6 es 2.4-ish, por lo que el margen de error es de aproximadamente 40% (2.4 / 6). La raíz cuadrada de 600 es 24-ish, por lo que el margen de error es de aproximadamente 4% (24/600). Es por eso que haber contado 600 es más significativo que contar 6. El error relativo es una décima parte.
Estoy siendo un poco descuidado sobre la definición de margen de error. Realmente es el valor de 1 sigma, y no es un límite estricto, pero es el rango donde espera que se ubiquen la mayoría (68%) de las mediciones. Entonces, si espera 6 comedores de naranjas, esperaría que una serie de encuestas le dé mayormente números en el rango de 4 a 8, como 6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8.
fuente
No tengo el nombre que estás buscando, pero el problema no es estadístico. Psicológicamente, la forma en que los humanos procesan los números en nuestros cerebros otorga mayor peso (autoridad) a los números más grandes que a los números más pequeños porque la magnitud (tamaño físico) es visualmente tan importante como el valor representativo. Por lo tanto, 600/1000 parece más creíble que 6/10. Es por eso que los compradores prefieren ver "¡10% de descuento!" para valores inferiores a 100 y "¡Ahorre $ 10!" para valores superiores a 100 (llamada "Regla de 100"). Se trata de cómo nuestros cerebros reaccionan a la percepción.
Nick Kolenda analiza una sorprendente mirada a este y otros tipos de fenómenos similares en su tratado en línea, " Una guía enorme para la psicología de los precios ".
fuente
Si bien el margen de error real es importante, la razón por la que suena más convincente se debe a una experiencia más heurística (regla general) con las personas. El margen de error real confirma que esta heurística tiene mérito.
Si la muestra es 6 a favor y 4 en contra, esto podría ser 50/50 si una sola persona cambia su voto, o si una sola persona fue registrada por error. Solo hay dos personas más en el lado 6. Todos conocen dos copos, todos saben que la muestra podría ser seleccionada: solo le preguntaste a las camareras y a nadie más. O solo encuestó a 10 profesores universitarios en los pasillos de una universidad. O le preguntaste a 10 personas adineradas fuera de Saks Fifth Avenue.
Incluso el margen matemático de error supone una aleatoriedad verdadera y no tiene en cuenta el sesgo de selección, el sesgo de autoselección o cualquier otra cosa, las personas pueden entender eso intuitivamente.
En contraste, el resultado de 600 contra 400 tiene 200 personas más en un lado que en el otro, y 100 personas tendrían que cambiar de opinión. Es muy difícil obtener esos números (pero no imposible) por algún accidente de dónde estaba votando, cómo logró que la gente aceptara, cómo entendieron o interpretaron la pregunta, etc.
Es más convincente no por una prueba matemática de que debería serlo, sino porque sabemos por experiencia que las multitudes de 1000 tienen muchas más probabilidades de ser diversas en sus opiniones (sobre cualquier cosa) que un grupo de 10 (a menos que usted lo haya hecho en secreto). su votación en una convención de partidos políticos o en un mitin del KKK o algo más que pueda atraer a una multitud unilateral).
Las matemáticas solo cuantifican con precisión lo que ya sabemos por intuición; que es más fácil encontrar aleatoriamente uno o dos votos extraviados de 10, que encontrar aleatoriamente 100 o 200 votos extraviados de 1000.
fuente
Algo que no se ha mencionado es mirar el problema desde un punto de vista bayesiano.
Tenga en cuenta que aunque estas parcelas se parecen a las de david25272, representan algo muy diferente .
fuente
La respuesta corta:
Básicamente es más convincente tener 600 de 1000 que seis de 10 porque, dadas las mismas preferencias, es mucho más probable que ocurra 6 de 10 por casualidad.
Supongamos que la proporción que prefería las naranjas y las manzanas en realidad es igual (50% cada una). Llame a esto una hipótesis nula. Dadas estas probabilidades iguales, la probabilidad de los dos resultados son:
(Por simplicidad, estoy asumiendo una población infinita de la cual extraer un número ilimitado de muestras).
Una simple derivación
Una forma de obtener este resultado es simplemente enumerar las posibles formas en que las personas pueden combinarse en nuestras muestras:
Para diez personas es fácil:
Considere tomar muestras de 10 personas al azar de una población infinita de personas con las mismas preferencias para las manzanas o las naranjas. Con las mismas preferencias, es fácil simplemente enumerar todas las combinaciones potenciales de 10 personas:
Aquí está la lista completa.
r es el número de resultados (personas que prefieren las naranjas), C es el número de formas posibles de que muchas personas prefieran las naranjas, y p es la probabilidad discreta resultante de que muchas personas prefieran las naranjas en nuestra muestra.
(p es solo C dividido por el número total de combinaciones. Tenga en cuenta que hay 1024 formas de organizar estas dos preferencias en total (es decir, 2 a la potencia de 10).
(En general, hablamos de n C r combinaciones de resultados r de una muestra de n personas. Hay calculadoras en línea que puede usar para verificar estos números).
Esta lista nos permite darnos las probabilidades anteriores usando solo la división. Hay un 21% de posibilidades de obtener 6 personas en la muestra que prefieren las naranjas (210 de 1024 de las combinaciones). La posibilidad de obtener seis o más personas en nuestra muestra es del 38% (la suma de todas las muestras con seis o más personas, o 386 de 1024 combinaciones).
Gráficamente, las probabilidades se ven así:
Con números más grandes, el número de combinaciones potenciales crece rápidamente.
Para una muestra de solo 20 personas, hay 1,048,576 muestras posibles, todas con la misma probabilidad. (Nota: solo he mostrado cada segunda combinación a continuación).
Todavía hay una sola muestra donde las 20 personas prefieren las naranjas. Las combinaciones que presentan resultados mixtos son mucho más probables, simplemente porque hay muchas más formas en que las personas en las muestras se pueden combinar.
Las muestras sesgadas son mucho más improbables, solo porque hay menos combinaciones de personas que pueden dar lugar a esas muestras:
Con solo 20 personas en cada muestra, la probabilidad acumulada de tener 60% o más (12 o más) personas en nuestra muestra que prefieren naranjas se reduce a solo 25%.
Se puede ver que la distribución de probabilidad se vuelve más delgada y más alta:
Con 1000 personas, los números son enormes
Podemos extender los ejemplos anteriores a muestras más grandes (pero los números crecen demasiado rápido para que sea factible enumerar todas las combinaciones), en su lugar, he calculado las probabilidades en R:
La probabilidad acumulada de que 600 o más de cada 1000 personas prefieran las naranjas es solo 1.364232e-10.
La distribución de probabilidad ahora está mucho más concentrada alrededor del centro:
[
(Por ejemplo, para calcular la probabilidad de exactamente 600 de cada 1000 personas que prefieren las naranjas en el uso de R
dbinom(600, 1000, prob=0.5)
que equivale a 4.633908e-11, y la probabilidad de 600 o más personas es1-pbinom(599, 1000, prob=0.5)
, que equivale a 1.364232e-10 (menos de 1 en mil millones).fuente
Esto se debe a que un número mayor garantiza una mayor precisión. Por ejemplo, si quisieras recoger a 1000 personas al azar de cualquier parte del planeta y 599 de ellos son hombres contra 10 personas al azar con 6 hombres, lo primero sería más exacto. Del mismo modo, si asume una población de 7 mil millones y calcula el número de hombres, obtendría un número más preciso que obviamente sería más convincente que con solo 1000 personas.
fuente