El libro de Taleb "El cisne negro" fue un best seller del New York Times cuando salió hace varios años. El libro está ahora en su segunda edición. Después de reunirse con estadísticos en un JSM (una conferencia estadística anual), Taleb atenuó un poco sus críticas a las estadísticas. Pero el objetivo del libro es que las estadísticas no son muy útiles porque se basan en la distribución normal y en eventos muy raros: los "cisnes negros" no tienen distribuciones normales.
¿Crees que esta es una crítica válida? ¿Le falta a Taleb algunos aspectos importantes del modelado estadístico? ¿Se pueden predecir eventos raros al menos en el sentido de que se puedan estimar las probabilidades de ocurrencia?
extreme-value
rare-events
Michael Chernick
fuente
fuente
Respuestas:
Leí el Cisne negro hace un par de años. La idea del Cisne Negro es buena y el ataque a la falacia lúdica (ver las cosas como si fueran juegos de dados, con probabilidades conocidas) es bueno, pero las estadísticas están escandalosamente tergiversadas, con el problema central de ser la afirmación incorrecta de que todas las estadísticas se desmoronan si las variables No se distribuyen normalmente. Este aspecto me molestó lo suficiente como para escribirle a Taleb la siguiente carta:
Estimado Dr. Taleb
Hace poco leí "El cisne negro". Como tú, soy fanático de Karl Popper, y me encontré de acuerdo con mucho de lo que contiene. Creo que su exposición de la falacia lúdica es básicamente sólida y llama la atención sobre un problema real y común. Sin embargo, creo que gran parte de la Parte III decepciona mal su argumento general, incluso hasta el punto de desacreditar el resto del libro. Es una pena, ya que creo que los argumentos con respecto a los Cisnes Negros y las "incógnitas desconocidas" se basan en sus méritos sin depender de algunos de los errores de la Parte III.
El tema principal que deseo señalar, y buscar su respuesta, especialmente si he entendido mal los problemas, es su tergiversación del campo de las estadísticas aplicadas. A mi juicio, los capítulos 14, 15 y 16 dependen en gran medida de un argumento del hombre de paja, que tergiversan las estadísticas y la econometría. El campo de la econometría que usted describe no es el que me enseñaron cuando estudié estadística aplicada, econometría y teoría del riesgo actuarial (en la Universidad Nacional de Australia, pero usando textos que parecían bastante estándar). Los problemas que usted plantea (como las limitaciones de las distribuciones gaussianas) se entienden y se enseñan verdaderamente, incluso a nivel de pregrado.
Por ejemplo, va hasta cierto punto para mostrar cómo la distribución del ingreso no sigue una distribución normal, y presenta esto como un argumento en contra de la práctica estadística en general. Ningún estadista competente afirmaría que lo hace, y las formas de abordar este problema están bien establecidas. Solo usando técnicas desde el nivel más básico de "econometría de primer año", por ejemplo, transformar la variable tomando su logaritmo haría que sus ejemplos numéricos parecieran mucho menos convincentes. Tal transformación de hecho invalidaría gran parte de lo que usted dice, porque entonces la varianza de la variable original aumenta a medida que aumenta su media.
Estoy seguro de que hay algunos economometristas incompetentes que realizan regresiones OLS, etc. con una variable de respuesta no transformada como usted dice, pero eso los hace incompetentes y utilizan técnicas que están bien establecidas para ser inapropiadas. Ciertamente, habrían fracasado incluso en cursos de pregrado, que pasan mucho tiempo buscando formas más apropiadas de modelar variables como el ingreso, reflejando la distribución real observada (no gaussiana).
La familia de modelos lineales generalizados es un conjunto de técnicas desarrolladas en parte para solucionar los problemas que usted plantea. Muchas de las familias de distribuciones exponenciales (p. Ej., Distribuciones gamma, exponencial y de Poisson) son asimétricas y tienen una varianza que aumenta a medida que aumenta el centro de la distribución, evitando el problema que señala utilizando la distribución gaussiana. Si esto todavía es demasiado limitante, es posible eliminar una "forma" preexistente por completo y simplemente especificar una relación entre la media de una distribución y su varianza (por ejemplo, permitir que la varianza aumente proporcionalmente al cuadrado de la media), utilizando el método de estimación "cuasi-verosimilitud".
Por supuesto, podría argumentar que esta forma de modelar es todavía demasiado simplista y una trampa intelectual que nos hace pensar que el futuro será como el pasado. Puede que tengas razón, y creo que la fortaleza de tu libro es hacer que personas como yo lo consideren. Pero necesita argumentos diferentes a los que usa en los capítulos 14-16. El gran peso que le da al hecho de que la variación de la distribución gaussiana es constante independientemente de su media (que causa problemas de escalabilidad), por ejemplo, no es válida. Así es su énfasis en el hecho de que las distribuciones de la vida real tienden a ser asimétricas en lugar de curvas de campana.
Básicamente, ha tomado una simplificación excesiva del enfoque más básico de las estadísticas (modelado ingenuo de variables en bruto como distribuciones gaussianas) y ha mostrado, con gran detalle, (correctamente) las deficiencias de un enfoque tan simplificado. Luego usa esto para hacer un hueco para desacreditar a todo el campo. Esto es un serio error de lógica o una técnica de propaganda. Es desafortunado porque resta valor a su argumento general, gran parte del cual (como dije) encontré válido y persuasivo.
Me interesaría escuchar lo que dices en respuesta. Dudo que sea el primero en haber planteado este problema.
Tuyo sinceramente
EDUCACIÓN FÍSICA
fuente
No he leído el libro, pero como dije, las críticas me parecen poco razonables. Si los eventos extremos son importantes, entonces las estadísticas tienen herramientas apropiadas en la caja de herramientas, como la teoría del valor extremo, y un buen estadístico sabrá cómo usarlos (o al menos descubrirá cómo usarlos y estará lo suficientemente comprometido con el propósito de El análisis a mirar). La crítica parece ser "las estadísticas son malas porque hay malos estadísticos que solo conocen las distribuciones normales".
fuente
Creo que decir que "el objetivo del libro es que las estadísticas no son muy útiles" es inexacto. Después de leer el libro, lo que parece estar diciendo es que cosas como las finanzas cuantitativas o cualquier tipo de negociación de valores que suponga que una distribución normal es fundamentalmente defectuosa (en realidad, en el libro, llama a las personas que afirman usar estos modelos para hacer predicciones , "charlatanes"). Según Taleb, mientras que la distribución normal hace un gran trabajo al modelar los valores de cosas tangibles / físicas (por ejemplo, altura, peso, vida útil, etc.), los sistemas como los mercados a menudo son impulsados por la emoción humana y, por lo tanto, son propensos a grandes oscilaciones que las distribuciones normales no pueden predecir con precisión.
No entiendo bien las estadísticas, y hasta que leí las respuestas aquí, nunca había oído hablar de cosas como la teoría del valor extremo. De todos modos, The Black Swan y Fooled By Randomness parecen tener premisas similares, que es "distribución normal que no siempre está bien". No lo recuerdo difamando todo el campo de las estadísticas.
fuente
Leí "El cisne negro", lo disfruté y soy estadístico. No me pareció insoportable su "crítica de estadísticas". Punto por punto:
Para aquellos a quienes no les gusta esta respuesta, o no les gusta el libro, pueden echar un vistazo a los argumentos técnicos de Taleb en el nuevo https://fernandonogueiracosta.files.wordpress.com/2014/07/taleb-nassim-silent-risk. pdf "Riesgo silencioso", que es técnico.
fuente
No he leído el Cisne negro, pero si su crítica de las estadísticas es realmente tan simple como usted dice, entonces es ridículo. Obviamente, algunas estadísticas se basan en la distribución Normal, pero muchas no.
¿Se pueden modelar eventos raros? Por supuesto que pueden. La verdadera pregunta es qué tan bien se pueden modelar. Y esa pregunta tendrá diferentes respuestas en diferentes campos, en función de cuánto sepamos sobre los eventos raros y sus antecedentes.
En la revista NY Times de hoy hay un interesante artículo de Nate Silver sobre cómo ha mejorado el pronóstico del tiempo en la última década más o menos. Esto incluye un mejor modelado de eventos raros como los huracanes.
¿Vale la pena leer el libro?
fuente
Tampoco he leído el libro, pero no hay forma de que su punto sea tan simple como decir que hay distribuciones con colas más gruesas que la distribución normal. Este sería un comentario a las otras respuestas, pero no he acumulado suficientes elogios en este sitio web.
De Wikipedia:
"Afirma que las estadísticas son fundamentalmente incompletas como campo, ya que no pueden predecir el riesgo de eventos raros ..."
Esta pregunta también es bastante similar a ¿Cuál es la opinión de la comunidad sobre el Cuarto Cuadrante?
fuente
Recomiendo encarecidamente la reseña de este libro de Dennis Lindley. Contiene una serie de argumentos devastadores contra la exposición pobre y arrogante de ideas en el libro:
http://onlinelibrary.wiley.com/doi/10.1111/j.1740-9713.2008.00281.x/abstract
El Black Swan es otro ejemplo en el que ser un "superventas" no garantiza contenido de alta calidad.
fuente
No creo que Taleb realmente diga que las técnicas estadísticas que dependen de la distribución gaussiana no son útiles. Su punto en el libro fue que son muy útiles para muchos (pero no todos) los procesos y modelos físicos o biológicos. Hace algunos puntos buenos y otros malos (The Black Swan y Linked fueron el comienzo de la plaga "¡todo es una ley de poder!" Que todavía nos persigue hoy), pero es importante recordar que el libro es una colección de obras literarias y filosóficas. ensayos destinados a laicos.
Dicho esto, creo que a Taleb le gusta agravar a la gente. Puedes ver esto en su batalla con Myron Scholes. En este caso, puede haber sido útil como educación estadística en el nivel de pregrado y, a veces, en el nivel de posgrado, más o menos sobre la suposición de las distribuciones gaussianas. Me imagino que durante sus años en finanzas se encontró con una gran cantidad de quants con un gran conocimiento de Black-Scholes y otras técnicas, pero que no consideraban supuestos subyacentes como la distribución. Sospecho que Taleb estaba hurgando en el establecimiento educativo por no haber educado adecuadamente.
fuente
Aquellos de ustedes que no han leído el libro están fuera de lugar. Él hace una GRAN distinción entre lo escalable y lo no escalable. Para asuntos no escalables, las estadísticas tradicionales serán suficientes. No está criticando eso en absoluto. Los cisnes negros se originan en la escalabilidad y son difíciles de predecir dados los datos empíricos pasados. El libro trata sobre cómo estos eventos pueden tener un enorme impacto y generalmente solo se explican después del hecho. La epistemología es excelente.
fuente
Sin leer el libro, siento que las campanas gaussianas fallan porque nunca han dado una definición clara de "densidad de probabilidad"; además de eso, nunca dan un conjunto completo de puntos de curvas de Lorenz que incluyen al mismo tiempo el total de variables distribuidas y el total de poblaciones que perciben la primera. Si se usa "densidad" es necesario explicar con respecto a qué variable; Por ejemplo, si habla de kilogramos por litro, se refiere a una densidad de peso relacionada con el volumen. La teoría gaussiana no da ese paso en los libros de texto. No es de extrañar que los jóvenes no entiendan adecuadamente las estadísticas.
fuente