Soy un estudiante de posgrado desarrollando un interés por las estadísticas En general, me gusta el material, pero a veces me cuesta pensar en aplicaciones para la vida real. Específicamente, mi pregunta es sobre distribuciones estadísticas comúnmente utilizadas (normal - beta-gamma, etc.). Supongo que en algunos casos obtengo las propiedades particulares que hacen que la distribución sea bastante agradable, por ejemplo, la propiedad exponencial sin memoria. Pero para muchos otros casos, no tengo una intuición sobre las áreas de importancia y aplicación de las distribuciones comunes que vemos en los libros de texto.
Probablemente hay muchas buenas fuentes que abordan mis inquietudes, me alegraría que pudieras compartirlas. Estaría mucho más motivado en el material si pudiera asociarlo con ejemplos de la vida real.
EstimatedDistribution
función de Mathematica .Respuestas:
Wikipedia tiene una página que enumera muchas distribuciones de probabilidad con enlaces a más detalles sobre cada distribución. Puede consultar la lista y seguir los enlaces para tener una mejor idea de los tipos de aplicaciones para las que se utilizan comúnmente las diferentes distribuciones.
Solo recuerde que estas distribuciones se utilizan para modelar la realidad y, como dijo Box: "todos los modelos están mal, algunos modelos son útiles".
Estas son algunas de las distribuciones comunes y algunas de las razones por las que son útiles:
Normal: esto es útil para observar las medias y otras combinaciones lineales (por ejemplo, coeficientes de regresión) debido a la CLT. Relacionado con eso, si se sabe que algo surge debido a los efectos aditivos de muchas causas pequeñas diferentes, entonces lo normal puede ser una distribución razonable: por ejemplo, muchas medidas biológicas son el resultado de múltiples genes y múltiples factores ambientales y, por lo tanto, a menudo son aproximadamente normales. .
Gamma: sesgado a la derecha y útil para cosas con un mínimo natural de 0. Se usa comúnmente para tiempos transcurridos y algunas variables financieras.
Exponencial: caso especial de la Gamma. No tiene memoria y se escala fácilmente.
Chi-cuadrado ( ): caso especial de la Gamma. Se presenta como la suma de las variables normales al cuadrado (así utilizadas para las variaciones).χ2
Beta: Definido entre 0 y 1 (pero podría transformarse para estar entre otros valores), útil para proporciones u otras cantidades que deben estar entre 0 y 1.
Binomial: Cuántos "éxitos" de un número dado de ensayos independientes con la misma probabilidad de "éxito".
Poisson: Común para los recuentos. Buenas propiedades de que si el número de eventos en un período de tiempo o área sigue a un Poisson, entonces el número en dos veces el tiempo o área sigue al Poisson (con el doble de la media): esto funciona para agregar Poissons o escalar con valores distintos a 2)
Tenga en cuenta que si los eventos ocurren a lo largo del tiempo y el tiempo entre ocurrencias es exponencial, el número que ocurre en un período de tiempo sigue a un Poisson.
Binomial negativo: cuenta con un mínimo de 0 (u otro valor según la versión) y sin límite superior. Conceptualmente es el número de "fallas" antes de k "éxitos". El binomio negativo también es una mezcla de variables de Poisson cuyas medias provienen de una distribución gamma.
Geométrico: caso especial para binomio negativo donde es el número de "fallas" antes del primer "éxito". Si trunca (redondea hacia abajo) una variable exponencial para hacerla discreta, el resultado es geométrico.
fuente
La teoría asintótica conduce a la distribución normal, los tipos de valores extremos, las leyes estables y el Poisson. El exponencial y el Weibull tienden a aparecer como tiempo paramétrico para distribuciones de eventos. En el caso de Weibull, es un tipo de valor extremo para el mínimo de una muestra. En relación con los modelos paramétricos para observaciones distribuidas normalmente, las distribuciones de chi cuadrado, t y F surgen en las pruebas de hipótesis y la estimación del intervalo de confianza. El chi cuadrado también aparece en el análisis de tablas de contingencia y las pruebas de bondad de ajuste. Para estudiar el poder de las pruebas tenemos las distribuciones no centrales t y F. La distribución hipergeométrica surge en la prueba exacta de Fisher para tablas de contingencia. La distribución binomial es importante cuando se realizan experimentos para estimar proporciones. El binomio negativo es una distribución importante para modelar la sobredispersión en un proceso puntual. Eso debería darle un buen comienzo en las distribuciones paramétricas prácticas. Para las variables aleatorias no negativas en (0, ∞), la distribución Gamma es flexible para proporcionar una variedad de formas y el registro normal también se usa comúnmente. En [0,1], la familia beta proporciona alteraciones simétricas que incluyen el uniforme y las distribuciones sesgadas hacia la izquierda o hacia la derecha.
También debo mencionar que si desea conocer todos los detalles esenciales sobre las distribuciones en estadística, hay una serie clásica de libros de Johnson y Kotz que incluyen distribuciones discretas, distribuciones univariadas continuas y distribuciones multivariadas continuas y también el volumen 1 de la teoría avanzada de estadísticas de Kendall y Stuart.
fuente
Compre y lea al menos los primeros 6 capítulos (primeras 218 páginas) de William J. Feller "Introducción a la teoría de la probabilidad y sus aplicaciones, Vol. 2" http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb . Al menos lea todos los Problemas para la solución, y preferiblemente intente resolver tantos como pueda. No necesita haber leído el Vol. 1, que en mi opinión no es particularmente meritorio.
A pesar de que el autor falleció hace 45 años y medio, incluso antes de que el libro estuviera terminado, este es simplemente el mejor libro que existe, sin excepción, para desarrollar una intuición en los procesos estocásticos y de probabilidad, y comprender y desarrollar una sensación de varias distribuciones , cómo se relacionan con los fenómenos del mundo real y varios fenómenos estocásticos que pueden ocurrir y ocurren. Y con la base sólida que construirá a partir de ella, obtendrá buenas estadísticas.
Si puede hacerlo en los capítulos posteriores, lo que se vuelve un poco más difícil, estará a años luz de casi todos. En pocas palabras, si conoce Feller Vol 2, conoce la probabilidad (y los procesos estocásticos); lo que significa que, cualquier cosa que no sepa, como nuevos desarrollos, podrá aprender y dominar rápidamente construyendo sobre esa base sólida.
Casi todo lo mencionado anteriormente en este hilo está en Feller Vol 2 (no todo el material en Kendall Advanced Theory of Statistics, pero leer ese libro será pan comido después de Feller Vol 2), y más, mucho más, todo de una manera que desarrolle tu pensamiento e intuición estocástica. Johnson y Kotz son buenos para las minucias en varias distribuciones de probabilidad, Feller Vol 2 es útil para aprender a pensar probabilísticamente y saber qué extraer de Johnson y Kotz y cómo usarlo.
fuente
Solo para agregar a las otras excelentes respuestas.
fuente
Investigación publicada recientementesugiere que el rendimiento humano NO se distribuye normalmente, al contrario del pensamiento común. Se analizaron los datos de cuatro campos: (1) Académicos en 50 disciplinas, basados en la frecuencia de publicación en las revistas de disciplina más destacadas. (2) Artistas, como actores, músicos y escritores, y el número de prestigiosos premios, nominaciones o distinciones recibidas. (3) Políticos en 10 naciones y resultados de elecciones / reelecciones. (4) Atletas universitarios y profesionales que analizan las medidas más individualizadas disponibles, como el número de jonrones, recepciones en deportes de equipo y victorias totales en deportes individuales. El autor escribe: "Vimos una distribución clara y consistente de la ley de poder en cada estudio, independientemente de cuán estrecha o ampliamente analizamos los datos ..."
fuente