Inspirado en " ejemplos reales de distribuciones comunes ", me pregunto qué ejemplos pedagógicos utilizan las personas para demostrar asimetría negativa. Hay muchos ejemplos "canónicos" de distribuciones simétricas o normales que se usan en la enseñanza, ¡incluso si algunas como la altura y el peso no sobreviven al escrutinio biológico más cercano! La presión arterial podría estar más cerca de la normalidad. Me gustan los errores de medición astronómicos, de interés histórico, intuitivamente no es más probable que se encuentren en una dirección que en otra, y los errores pequeños son más probables que los grandes.
Ejemplos pedagógicos comunes de asimetría positiva incluyen los ingresos de las personas; kilometraje en autos usados para la venta; tiempos de reacción en un experimento de psicología; precios de la vivienda; número de reclamaciones de accidentes por parte de un cliente de seguros; cantidad de niños en una familia. Su razonabilidad física a menudo se deriva de estar limitada por debajo (generalmente por cero), con valores bajos plausibles, incluso comunes, pero se sabe que ocurren valores muy grandes (a veces órdenes de magnitud más altos).
Para el sesgo negativo, me resulta más difícil dar ejemplos inequívocos y vívidos que un público más joven (estudiantes de secundaria) pueda comprender intuitivamente, tal vez porque menos distribuciones de la vida real tienen un límite superior claro. Un ejemplo de mal gusto que me enseñaron en la escuela fue "número de dedos". La mayoría de la gente tiene diez, pero algunos pierden uno o más en accidentes. ¡El resultado fue "el 99% de las personas tienen un número de dedos superior al promedio"! La polidactilia complica el problema, ya que diez no es un límite superior estricto; Dado que tanto los dedos faltantes como los extra son eventos raros, puede no estar claro para los estudiantes qué efecto predomina.
Usualmente uso una distribución binomial con alto . Pero los estudiantes a menudo encuentran que "el número de componentes satisfactorios en un lote está sesgado negativamente" menos intuitivo que el hecho complementario de que "el número de componentes defectuosos en un lote está sesgado positivamente". (El libro de texto tiene un tema industrial; prefiero huevos rotos e intactos en una caja de doce). Tal vez los estudiantes sientan que el "éxito" debería ser raro.
Otra opción es señalar que si está sesgado positivamente, entonces está sesgado negativamente, pero colocar esto en un contexto práctico ("los precios negativos de la vivienda están sesgados negativamente") parece condenado al fracaso pedagógico. Si bien hay beneficios de enseñar los efectos de las transformaciones de datos, parece prudente dar un ejemplo concreto primero. Preferiría uno que no parezca artificial, donde el sesgo negativo sea bastante inequívoco, y para el cual la experiencia de vida de los estudiantes les dé una conciencia de la forma de la distribución.- X
fuente
Respuestas:
En el Reino Unido, precio de un libro. Existe un "precio de venta recomendado", que generalmente será el precio modal, y prácticamente en ninguna parte tendría que pagar más. Pero algunas tiendas tendrán descuentos, y algunas tendrán grandes descuentos.
Además, edad de jubilación. La mayoría de las personas se jubilan a los 65-68 años, que es cuando comienza la pensión estatal, muy pocas personas trabajan más tiempo, pero algunas personas se jubilan a los 50 y bastante a los 60 años.
Entonces, también, el número de personas GCSE obtiene. La mayoría de los niños ingresan por 8-10 y obtienen 8-10. Un pequeño número hace más. Sin embargo, algunos de los niños no aprueban todos sus exámenes, por lo que hay un aumento constante de 0 a 7.
fuente
Nick Cox comentó con precisión que "la edad de la muerte está sesgada negativamente en los países desarrollados", lo que me pareció un gran ejemplo.
Encontré que las cifras más convenientes que pude encontrar provienen de la Oficina Australiana de Estadísticas ( en particular, usé esta hoja de Excel ), ya que sus contenedores de edad eran de hasta 100 años y el hombre australiano más viejo tenía 111 años , así que Me sentí cómodo cortando el contenedor final a los 110 años. Otras agencias estadísticas nacionales a menudo parecían detenerse en 95, lo que hacía que el contenedor final fuera incómodamente ancho. El histograma resultante muestra un sesgo negativo muy claro, así como algunas otras características interesantes, como un pequeño pico en la tasa de mortalidad entre los niños pequeños, que sería muy adecuado para la discusión e interpretación en clase.
Sigue el código R con datos en bruto, ¡el
HistogramTools
paquete demostró ser muy útil para el trazado basado en datos agregados! Gracias a esta pregunta de StackOverflow por marcarlo.fuente
Aquí están los resultados para los cuarenta atletas que completaron con éxito un salto legal en la ronda clasificatoria del salto de longitud olímpico masculino de 2012, presentado en un diagrama de densidad de granos con un diagrama de alfombra debajo.
Parece ser mucho más fácil estar un metro detrás del grupo principal de competidores que estar un metro por delante, lo que explicaría la asimetría negativa.
Sospecho que algunos de los grupos en el extremo superior se deben a la calificación de los atletas (que requirió un resultado de los doce primeros o un resultado de 8.10 metros o más) en lugar de lograr la distancia más larga posible. El hecho de que los dos primeros resultados fueron de 8,11 metros, justo por encima de la calificación automática, es muy sugerente, al igual que la forma en que los saltos ganadores de medallas en la final fueron más largos y más extendidos en 8,31, 8,16 y 8,12 metros. Los resultados en la final tuvieron un ligero sesgo negativo, no significativo.
Para la comparación, los resultados para la Heptathlon olímpico en Seúl 1988 están disponibles en el
heptathlon
conjunto de datos en el paquete RHSAUR
. En esa competencia no hubo una ronda de clasificación, pero cada evento aportó puntos para la clasificación final; Las competidoras mostraron un sesgo negativo pronunciado en los resultados del salto alto y un sesgo algo negativo en el salto largo. Curiosamente, esto no se repitió en los eventos de lanzamiento (tiro y jabalina) a pesar de que también son eventos en los que un número mayor corresponde a un mejor resultado. Las puntuaciones finales también fueron algo negativamente sesgadas.Datos y codigo
fuente
Los puntajes en exámenes fáciles, o alternativamente, los puntajes en exámenes para los cuales los estudiantes están especialmente motivados, tienden a quedar sesgados.
Como resultado, los puntajes SAT / ACT de los estudiantes que ingresan a las universidades solicitadas (y aún más, sus GPA) tienden a quedar sesgados. Hay muchos ejemplos en collegeapps.about.com, por ejemplo, una trama de SAT / ACT y GPA de la Universidad de Chicago está aquí .
Del mismo modo, los GPA de los graduados a menudo son sesgados a la izquierda, por ejemplo, los histogramas a continuación de los GPA de los graduados blancos y negros en una universidad con fines de lucro tomada de la Fig. 5 de Gramling, Tim. " Cómo cinco características de los estudiantes predicen con precisión las probabilidades de graduación universitaria con fines de lucro ". SAGE Open 3.3 (2013): 2158244013497026.
(No es difícil encontrar otros ejemplos similares).
fuente
En el Análisis estocástico de fronteras, y específicamente en su enfoque históricamente inicial, la producción, la función de producción de una empresa / unidad de producción en general, se especifica estocásticamente como
Entonces, la asimetría negativa es, diría, el modelo más natural de los esfuerzos de la propia raza humana: siempre se desvía de su ideal imaginado, en la mayoría de los casos va a la zaga (la parte negativa de la densidad), mientras que en relativamente menos casos, trascendiendo sus límites percibidos (la parte positiva de la densidad). Los estudiantes mismos pueden ser modelados como una función de producción. Es sencillo mapear la perturbación simétrica y el error unilateral a aspectos de la vida real. No puedo imaginar cuán más intuitivo puede uno ser al respecto.
fuente
La asimetría negativa es común en la hidrología de inundaciones. A continuación se muestra un ejemplo de una curva de frecuencia de inundación (South Creek en Mulgoa Rd, lat -33.8783, lon 150.7683) que tomé de 'Australian Rainfall and Runoff' (ARR), la guía para la estimación de inundaciones desarrollada por Engineers, Australia.
Hay un comentario en ARR:
A menudo, se considera que las inundaciones, en un lugar particular, tienen un límite superior llamado 'Inundación máxima probable' (PMF). Hay formas estándar de calcular un PMF.
fuente
Los cambios en los precios de los activos (retornos) generalmente tienen un sesgo negativo: muchos aumentos de precios pequeños con algunas caídas de precios grandes. El sesgo parece mantenerse para casi todos los tipos de activos: precios de acciones, precios de productos básicos, etc. El sesgo negativo se puede observar en los cambios de precios mensuales, pero es mucho más evidente cuando comienzas a observar los cambios de precios diarios u horarios. Creo que este sería un buen ejemplo porque puedes mostrar los efectos de la frecuencia en el sesgo.
Más detalles: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
fuente
La edad gestacional al momento del parto (especialmente para los nacimientos vivos) se deja sesgada. Los bebés pueden nacer vivos muy temprano (aunque las posibilidades de supervivencia continua son pequeñas cuando son demasiado tempranas), alcanzan su punto máximo entre 36-41 semanas y disminuyen rápidamente. Es típico que las mujeres en los EE. UU. Sean inducidas después de 41/42 semanas, por lo que generalmente no vemos muchos partos después de ese punto.
fuente
En la pesca a menudo hay ejemplos de sesgo negativo debido a los requisitos reglamentarios. Por ejemplo, la distribución de tallas de peces liberados en la pesca recreativa; porque a veces hay una longitud mínima que debe tener un pez para retenerlo, se descartan todos los peces por debajo del límite. Pero debido a que las personas pescan donde tiende a haber peces de longitud legal, tienden a ser sesgados y negativos hacia el límite legal superior. Sin embargo, la longitud legal no representa un corte duro. Debido a los límites de la bolsa (o los límites en la cantidad de peces que se pueden devolver al muelle), las personas aún descartarán peces de tamaño legal cuando hayan capturado peces más grandes.
por ejemplo, Sauls, B. 2012. Un resumen de datos sobre la distribución de tallas y la condición de liberación de los descartes de pargo rojo de las encuestas de pesca recreativa en el Golfo de México. SEDAR31-DW11. SEDAR, North Charleston, SC. 29 pp.
fuente
Se han hecho algunas sugerencias geniales en este hilo. Sobre el tema de la mortalidad relacionada con la edad, las tasas de falla de la máquina son frecuentemente una función de la edad de la máquina y caerían en esta clase de distribuciones. Además de los factores financieros ya señalados, las funciones y distribuciones de pérdidas financieras generalmente se parecen a estas formas, particularmente en el caso de pérdidas de valor extremo, por ejemplo, como se encuentra en las estimaciones del déficit esperado (ES) del BIS III (Banco de Pagos Internacionales), o en BIS II el valor en riesgo (VAR) como insumos para los requisitos reglamentarios para las asignaciones de reservas de capital.
fuente
La edad de jubilación en los Estados Unidos está sesgada negativamente. La mayoría de los jubilados son mayores y algunos se jubilan relativamente jóvenes.
fuente
En la teoría de matrices aleatorias, la distribución de Tracy Widom está sesgada a la derecha. Esta es la distribución del mayor valor propio de una matriz aleatoria. Por simetría, el valor propio más pequeño tiene una distribución negativa de Tracy Widom y, por lo tanto, está sesgado a la izquierda.
Esto se debe aproximadamente al hecho de que los valores propios aleatorios son similares a las partículas cargadas que se repelen entre sí y, por lo tanto, el valor propio más grande tiende a alejarse del resto. Aquí hay una foto exagerada (tomada desde aquí ):
fuente