¿Por qué 600 de 1000 es más convincente que 6 de 10?

41

Mire este extracto del "Manual de habilidades de estudio", Palgrave, 2012, de Stella Cottrell, página 155:

Porcentajes Aviso cuando se dan porcentajes.
Supongamos, en cambio, que la declaración anterior dice:

El 60% de las personas preferían las naranjas; El 40% dijo que prefería las manzanas.

Esto parece convincente: se dan cantidades numéricas. Pero es la diferencia entre el 60% y el 40% significativa ? Aquí necesitaríamos saber a cuántas personas se les preguntó. Si se preguntara a 1000 personas de las cuales 600 preferían las naranjas, el número sería convincente. Sin embargo, si solo se les preguntó a 10 personas, el 60% simplemente significa que 6 personas prefirieron las naranjas. "60%" suena convincente de una manera que "6 de 10" no lo hace. Como lector crítico, debe estar atento a los porcentajes que se utilizan para que los datos insuficientes se vean impresionantes.

¿Cómo se llama esta característica en las estadísticas? Me gustaría leer más al respecto.

Juya
fuente
38
el tamaño de la muestra es importante
Aksakal
36
Elijo a dos personas al azar, ambos son hombres y, por lo tanto, concluyo que el 100% de los estadounidenses son hombres. ¿Convincente?
Casey
2
Es el principio de "No comparar manzanas con naranjas"
wolfies
2
Para abordar esa pregunta desde un ángulo diferente, puede considerar excavar la literatura sobre el efecto de encuadre. Sin embargo, es un ejemplo de sesgo cognitivo y es un tema psicológico, no estadístico.
Larx
2
Puede imaginar una diferencia de 1 cuánto afectará la cantidad estimada. 7/10 está mucho más alejado de 6/10 que 601/1000 de 600/1000.
mathreadler

Respuestas:

54

Me gustaría enumerar otro ejemplo intuitivo.

Supongamos que te digo que puedo predecir el resultado de cualquier lanzamiento de moneda. No crees y quieres probar mi habilidad.

Lo probaste 5 veces, y las acerté todas. ¿Crees que tengo la habilidad especial? Tal vez no. Porque puedo corregirlos todos por casualidad. (Específicamente, suponga que la moneda es una moneda justa, y cada experimento es independiente, entonces puedo obtener todos los derechos con sin superpoder. Vea el enlace de Shufflepants para una broma al respecto).0.550.03

Por otro lado, si me probaste muchas veces, es muy poco probable que pueda obtenerlo por casualidad. Por ejemplo, si probó veces, la probabilidad de que las haga bien es 0.5 1000 .1000.51000


El concepto estadístico se llama poder estadístico, de Wikipeida

El poder de una prueba de hipótesis binaria es la probabilidad de que la prueba rechace correctamente la hipótesis nula (H0) cuando la hipótesis alternativa (H1) es verdadera.

Volviendo al ejemplo de super power on coin flip, esencialmente quieres ejecutar una prueba de hipótesis.

  • Hipótesis nula (H0): no tengo la superpotencia
  • Hipótesis alternativa (H1): tengo el superpoder

Ahora, como puede ver en el ejemplo numérico (probarme 5 veces frente a probarme 100 veces), el poder estadístico se ha visto afectado por el tamaño de la muestra.

Más para leer aquí . (más técnico y basado en la prueba t).

Aquí se puede encontrar una herramienta interactiva para comprender el poder estadístico . Tenga en cuenta que el poder estadístico cambia con el tamaño de la muestra.

ingrese la descripción de la imagen aquí

Haitao Du
fuente
24
Obligatorio XKCD
Shufflepants
55
Esto en realidad no responde la pregunta. La pregunta tiene dos partes: "¿Por qué [es] más convincente ..." y "¿Cómo se llama esta característica en las estadísticas?" Proporcionó un ejemplo que le pregunta al lector si está más convencido con el ejemplo, pero no ha explicado el fenómeno ni ha intentado abordar por qué es más convincente (solo se basa en el razonamiento intuitivo del lector en un solo ejemplo). Además, no ha tocado la segunda pregunta: si cree que este fenómeno no tiene nombre, explíquelo explícitamente.
Makyen
1
@Mayken Eso es claramente un intento de respuesta. No es la mejor respuesta y no es una respuesta completa, pero las respuestas parciales o socráticas no son motivos para afirmar que no es una respuesta en absoluto. Las preguntas deben hacer una pregunta y si hacen una serie de preguntas, creo que es perfectamente razonable (si no es lo ideal) abordar solo algunas de ellas. Si cree que es una respuesta pobre , ciertamente es libre de abordar los problemas que ve como problemas. [Por lo demás, tampoco creo que haya respondido la segunda pregunta; Solo discutí el efecto; no todos los fenómenos tendrán un nombre explícito]
Glen_b
1
No puedo evitar sentir que 100% es un caso especial y esta respuesta realmente no respalda mi intuición de que 600/1000 es más convincente que 6/10. Incluso si consideramos que no es un caso especial, se trata esencialmente de reafirmar el problema con un porcentaje diferente.
NotThatGuy
2
@Juya es una herramienta basada en web creada por alguien. Puedes probarlo aquí
Haitao Du
29

Piénselo en términos de proporciones. Digamos que preferir una naranja es un éxito, mientras que preferir una manzana es un fracaso. Entonces, su tasa de éxito promedio es o en este caso .6μ=# of sucessesn

Se estima que el error estándar de esta cantidad es . Para un tamaño de muestra pequeño (es decir, 10), el error estándar es.155pero para un tamaño de muestra de 1000, el error estándar es.0155. Básicamente, como se mencionó en los comentarios, "el tamaño de la muestra es importante".μ(1μ)n.155.0155

Ryan Honea
fuente
17

Este concepto es una consecuencia de la ley de los grandes números . De Wikipedia ,

Según la ley, el promedio de los resultados obtenidos de una gran cantidad de ensayos debe estar cerca del valor esperado y tenderá a acercarse a medida que se realicen más ensayos.

Los resultados de una muestra pequeña pueden estar más lejos del valor esperado que el de una muestra más grande. Y así, como se indica en la pregunta, uno debe tener cuidado con los resultados calculados a partir de pequeñas muestras. La idea también se explica bastante bien en este video de YouTube .

Evan Phibbs
fuente
55
Existen varios teoremas bien conocidos conocidos en estadística como "leyes de grandes números", pero ninguno de ellos hace declaraciones que se parezcan a la de la pregunta. ¿Cómo, entonces, establece la conexión?
whuber
3
De wikipedia en.wikipedia.org/wiki/Law_of_large_numbers , "De acuerdo con la ley, el promedio de los resultados obtenidos de un gran número de ensayos debe estar cerca del valor esperado y tenderá a acercarse a medida que se realicen más ensayos". . Los resultados de una muestra pequeña pueden estar más lejos del valor esperado que el de una muestra más grande. Y así, como se indica en la pregunta, uno debe tener cuidado con los resultados calculados a partir de pequeñas muestras.
Evan Phibbs
66
Esa es una buena explicación, gracias. Aunque tiene razón al escribir que uno debe ser cauteloso acerca de cuántos "gran número de juicios" se necesitan para que la ley sea confiable, la aplicación es intuitivamente sólida. Me gustaría sugerir que su explicación pertenece a su respuesta, donde sería más leída y apreciada, en lugar de ser enterrada en un comentario. Las respuestas de solo enlace (como su enlace a Youtube) sin explicación no duran aquí.
whuber
6

Estamos en la situación de estimar una cantidad de población por una cantidad de muestra. En este caso, estamos utilizando proporciones de muestra para estimar las proporciones de la población, pero el principio es considerablemente más general.

10101

A medida que tomamos muestras cada vez más grandes (usando muestreo aleatorio), las medias de la muestra tenderán a converger a la media de la población. (Esta es la ley de los grandes números).

Sin embargo, lo que realmente queremos tener es una idea de cuán lejos podríamos estar (tal como podría estar representado por el ancho de un intervalo de confianza para la proporción, o por el margen de error, que normalmente es la mitad de ese ancho) .

120

1n

Como resultado, tenemos más confianza en la precisión de nuestra estimación cuando la muestra es grande; si repetimos nuestro experimento nuevamente, otros medios similares estarían cerca del actual: se agrupan cada vez más estrechamente, y porque (en este caso) nuestra estimación es imparcial, se agrupan alrededor de los valores que estamos tratando de estimar. Una media de muestra única se vuelve cada vez más informativa sobre dónde podría estar la media de la población.

Glen_b
fuente
4

Una regla general para las estadísticas de "conteo", como contar el número de personas a las que les gustan las naranjas, o contar el número de "clics" en un contador Geiger debido a la desintegración radiactiva, es que el margen de error para el conteo es aproximadamente el cuadrado -raíz del valor de conteo esperado. Las estadísticas de conteo son conocidas como estadísticas de Poisson.

La raíz cuadrada de 6 es 2.4-ish, por lo que el margen de error es de aproximadamente 40% (2.4 / 6). La raíz cuadrada de 600 es 24-ish, por lo que el margen de error es de aproximadamente 4% (24/600). Es por eso que haber contado 600 es más significativo que contar 6. El error relativo es una décima parte.

Estoy siendo un poco descuidado sobre la definición de margen de error. Realmente es el valor de 1 sigma, y ​​no es un límite estricto, pero es el rango donde espera que se ubiquen la mayoría (68%) de las mediciones. Entonces, si espera 6 comedores de naranjas, esperaría que una serie de encuestas le dé mayormente números en el rango de 4 a 8, como 6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8.

Mark Lakata
fuente
3

No tengo el nombre que estás buscando, pero el problema no es estadístico. Psicológicamente, la forma en que los humanos procesan los números en nuestros cerebros otorga mayor peso (autoridad) a los números más grandes que a los números más pequeños porque la magnitud (tamaño físico) es visualmente tan importante como el valor representativo. Por lo tanto, 600/1000 parece más creíble que 6/10. Es por eso que los compradores prefieren ver "¡10% de descuento!" para valores inferiores a 100 y "¡Ahorre $ 10!" para valores superiores a 100 (llamada "Regla de 100"). Se trata de cómo nuestros cerebros reaccionan a la percepción.

Nick Kolenda analiza una sorprendente mirada a este y otros tipos de fenómenos similares en su tratado en línea, " Una guía enorme para la psicología de los precios ".

JBH
fuente
2
Aunque otras respuestas no son incorrectas, no veo que realmente aborden correctamente el texto citado como es. El texto aborda el impacto de presentar los números y la precisión percibida, no si los números realmente son más precisos. Es decir, puede hacer que una persona perciba que su información es más significativa al decir 600 de 1000 o 60% o puede causar que parezca menos significativo al decir 6 de 10, aunque cada uno significa lo mismo al implicar una muestra más pequeña. tamaño sin si realmente se indica, o incluso posiblemente sea cierto.
dlb
1
Este ejemplo parece fundamentalmente defectuoso en mi opinión. Por ejemplo, una compra de 100 obtiene un descuento del 10% para un total de 90, mientras que una compra de 100.01 obtiene un descuento de 25 para un total de 75.01, lo que resulta en un precio muy diferente. De hecho, hay una diferencia en los valores hasta que obtenga 250.05 (o 250.10 dependiendo del redondeo o truncamiento). La pregunta es sobre el tamaño de la muestra y el error estándar, mientras que su ejemplo trata más sobre una diferencia real debido a nuestra percepción.
Joe W
@Joe W, aunque no puedo hablar sobre los detalles de la "regla de los 100" (no ser psicólogo), el punto que mi respuesta es que los psicólogos han determinado que las personas confían en un número mayor, no por el mayor representa el tamaño de la muestra, pero debido a la percepción de la mayor importancia dada a un número mayor. Como ingeniero, preferiría que no fuera así --- pero es la forma en que funciona la mente humana. Si desea cuestionar esto, le recomiendo leer los detalles subyacentes de la presentación del Sr. Kolenda.
JBH
Te estás perdiendo mi punto, hay una diferencia mayor en el 10% a 100 y 25 no es solo una cuestión de percepción. El hecho simple es que si tomó ambos valores a 100, hay una diferencia del 15%, que es un valor mucho más simple de medir que el error estándar al hablar dos muestras diferentes, una de 10 y una de 1000.
Joe W
Cambié mi pregunta para usar el 10% y $ 10 para ayudarte. El punto de la "regla de 100" es que las personas perciben que los números más grandes tienen mayor relevancia y perciben el valor monetario como más importante que un mero porcentaje. Es un tema algo fuera del alcance de la discusión para los propósitos del OP.
JBH
3

Si bien el margen de error real es importante, la razón por la que suena más convincente se debe a una experiencia más heurística (regla general) con las personas. El margen de error real confirma que esta heurística tiene mérito.

Si la muestra es 6 a favor y 4 en contra, esto podría ser 50/50 si una sola persona cambia su voto, o si una sola persona fue registrada por error. Solo hay dos personas más en el lado 6. Todos conocen dos copos, todos saben que la muestra podría ser seleccionada: solo le preguntaste a las camareras y a nadie más. O solo encuestó a 10 profesores universitarios en los pasillos de una universidad. O le preguntaste a 10 personas adineradas fuera de Saks Fifth Avenue.

Incluso el margen matemático de error supone una aleatoriedad verdadera y no tiene en cuenta el sesgo de selección, el sesgo de autoselección o cualquier otra cosa, las personas pueden entender eso intuitivamente.

En contraste, el resultado de 600 contra 400 tiene 200 personas más en un lado que en el otro, y 100 personas tendrían que cambiar de opinión. Es muy difícil obtener esos números (pero no imposible) por algún accidente de dónde estaba votando, cómo logró que la gente aceptara, cómo entendieron o interpretaron la pregunta, etc.

Es más convincente no por una prueba matemática de que debería serlo, sino porque sabemos por experiencia que las multitudes de 1000 tienen muchas más probabilidades de ser diversas en sus opiniones (sobre cualquier cosa) que un grupo de 10 (a menos que usted lo haya hecho en secreto). su votación en una convención de partidos políticos o en un mitin del KKK o algo más que pueda atraer a una multitud unilateral).

Las matemáticas solo cuantifican con precisión lo que ya sabemos por intuición; que es más fácil encontrar aleatoriamente uno o dos votos extraviados de 10, que encontrar aleatoriamente 100 o 200 votos extraviados de 1000.

Amadeus-Reinstate-Monica
fuente
3

Algo que no se ha mencionado es mirar el problema desde un punto de vista bayesiano.

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

posterior con n_o = 6 y n_a = 4

no=600na=400ingrese la descripción de la imagen aquí

p=0.4p=0.8

Tenga en cuenta que aunque estas parcelas se parecen a las de david25272, representan algo muy diferente .

pno

nop

Luca Citi
fuente
2

La respuesta corta:

Básicamente es más convincente tener 600 de 1000 que seis de 10 porque, dadas las mismas preferencias, es mucho más probable que ocurra 6 de 10 por casualidad.

Supongamos que la proporción que prefería las naranjas y las manzanas en realidad es igual (50% cada una). Llame a esto una hipótesis nula. Dadas estas probabilidades iguales, la probabilidad de los dos resultados son:

  • Dada una muestra de 10 personas, hay un 38% de posibilidades de obtener aleatoriamente una muestra de 6 o más personas que prefieren las naranjas (lo cual no es tan improbable).
  • Con una muestra de 1000 personas, hay menos de 1 en mil millones de posibilidades de que 600 o más de cada 1000 personas prefieran las naranjas.

(Por simplicidad, estoy asumiendo una población infinita de la cual extraer un número ilimitado de muestras).


Una simple derivación

Una forma de obtener este resultado es simplemente enumerar las posibles formas en que las personas pueden combinarse en nuestras muestras:

Para diez personas es fácil:

Considere tomar muestras de 10 personas al azar de una población infinita de personas con las mismas preferencias para las manzanas o las naranjas. Con las mismas preferencias, es fácil simplemente enumerar todas las combinaciones potenciales de 10 personas:

Aquí está la lista completa.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r es el número de resultados (personas que prefieren las naranjas), C es el número de formas posibles de que muchas personas prefieran las naranjas, y p es la probabilidad discreta resultante de que muchas personas prefieran las naranjas en nuestra muestra.

(p es solo C dividido por el número total de combinaciones. Tenga en cuenta que hay 1024 formas de organizar estas dos preferencias en total (es decir, 2 a la potencia de 10).

  • Por ejemplo, solo hay una forma (una muestra) para 10 personas (r = 10) para que todas prefieran las naranjas. Lo mismo es cierto para todas las personas que prefieren las manzanas (r = 0).
  • Hay 10 combinaciones diferentes que dan como resultado nueve de ellas que prefieren las naranjas. (Una persona diferente prefiere manzanas en cada muestra).
  • Hay 45 muestras (combinaciones) donde 2 personas prefieren manzanas, etc., etc.

(En general, hablamos de n C r combinaciones de resultados r de una muestra de n personas. Hay calculadoras en línea que puede usar para verificar estos números).

Esta lista nos permite darnos las probabilidades anteriores usando solo la división. Hay un 21% de posibilidades de obtener 6 personas en la muestra que prefieren las naranjas (210 de 1024 de las combinaciones). La posibilidad de obtener seis o más personas en nuestra muestra es del 38% (la suma de todas las muestras con seis o más personas, o 386 de 1024 combinaciones).

Gráficamente, las probabilidades se ven así:

tamaño de muestra binomial 10

Con números más grandes, el número de combinaciones potenciales crece rápidamente.

Para una muestra de solo 20 personas, hay 1,048,576 muestras posibles, todas con la misma probabilidad. (Nota: solo he mostrado cada segunda combinación a continuación).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

Todavía hay una sola muestra donde las 20 personas prefieren las naranjas. Las combinaciones que presentan resultados mixtos son mucho más probables, simplemente porque hay muchas más formas en que las personas en las muestras se pueden combinar.

Las muestras sesgadas son mucho más improbables, solo porque hay menos combinaciones de personas que pueden dar lugar a esas muestras:

Con solo 20 personas en cada muestra, la probabilidad acumulada de tener 60% o más (12 o más) personas en nuestra muestra que prefieren naranjas se reduce a solo 25%.

Se puede ver que la distribución de probabilidad se vuelve más delgada y más alta:

tamaño de muestra binomial 20

Con 1000 personas, los números son enormes

Podemos extender los ejemplos anteriores a muestras más grandes (pero los números crecen demasiado rápido para que sea factible enumerar todas las combinaciones), en su lugar, he calculado las probabilidades en R:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

La probabilidad acumulada de que 600 o más de cada 1000 personas prefieran las naranjas es solo 1.364232e-10.

La distribución de probabilidad ahora está mucho más concentrada alrededor del centro:

[tamaño de muestra binomial 1000 [3]

(Por ejemplo, para calcular la probabilidad de exactamente 600 de cada 1000 personas que prefieren las naranjas en el uso de R dbinom(600, 1000, prob=0.5)que equivale a 4.633908e-11, y la probabilidad de 600 o más personas es 1-pbinom(599, 1000, prob=0.5), que equivale a 1.364232e-10 (menos de 1 en mil millones).

david25272
fuente
1

Esto se debe a que un número mayor garantiza una mayor precisión. Por ejemplo, si quisieras recoger a 1000 personas al azar de cualquier parte del planeta y 599 de ellos son hombres contra 10 personas al azar con 6 hombres, lo primero sería más exacto. Del mismo modo, si asume una población de 7 mil millones y calcula el número de hombres, obtendría un número más preciso que obviamente sería más convincente que con solo 1000 personas.

Zee
fuente