¿Cuáles fueron las principales contribuciones estadísticas de Ronald Fisher?

13

Richard Dawkins ha descrito a Ronald Fisher como "el padre de las estadísticas modernas y el diseño experimental", una línea que se cita en la biografía de Fisher en Wikipedia . Y también Anders Hald lo llamó "un genio que casi por sí solo creó las bases para la ciencia estadística moderna" en su libro A History of Mathematical Statistics .

Me pregunto qué hizo exactamente para que la gente le haga una evaluación tan alta.

WCMC
fuente
10
Esta sería una gran publicación para HSM .
Antoni Parellada
66
@ Antoni Creo que en algún momento en el futuro, a medida que HSM continúe creciendo y prosperando, HSM podría convertirse en un mejor hogar para preguntas de historia estadística. Pero hay una base de experiencia tan sólida en CV, con muchos usuarios que tienen un interés real en aspectos históricos, que podría decirse que CV es el mejor lugar por ahora. (Creo que a la larga, el CV probablemente continuará siendo el mejor lugar para las preguntas de historia más "conceptuales".)
Silverfish
3
No creo que la naturaleza potencialmente 'basada en la opinión' de esta pregunta sea el problema. Estoy de acuerdo con @AntoniParellada: si esta pregunta no pertenece al sitio SE de Historia de la Ciencia y las Matemáticas , no está claro qué sería. Le debemos a nuestros colegas de SE migrarlo allí. El encuadre original estaba perfectamente bien.
gung - Restablece a Monica
3
Estoy de acuerdo, 'buena pregunta', pero tal vez no aquí. El trabajo de Fisher ya se ha recopilado en un volumen considerable Contribuciones a las estadísticas matemáticas que se obtiene fácilmente en cualquier tienda de libros de segunda mano. Para una revisión de un libro, ver: jstor.org/stable/2332332 Personalmente no soy capaz de agregar mejores palabras y solo puedo referirme a Efron jstor.org/stable/2676745 Lo que de hecho sería interesante y agregar información es una visión de los historiadores. (o filósofos, ya que las diferentes vistas estadísticas son una pregunta seria y en realidad no la entiendo, es decir, las uso todas)
Sextus Empiricus
77
@MatthewDrury Tenemos una etiqueta [historia] relativamente popular. Las preguntas de historia son sobre el tema en nuestro sitio. Si algo está en el tema aquí, en mi humilde opinión no deberíamos migrarlo, incluso si está en el tema en otro lugar también.
ameba dice Reinstate Monica

Respuestas:

19

Es muy difícil escribir una respuesta a la pregunta.

¿Cuáles fueron las principales contribuciones estadísticas de Ronald Fisher?

dado que ya existen numerosas obras excelentes sobre este tema, creadas por excelentes escritores, incluidos grandes estadísticos, por ejemplo:

Estos trabajos son muy difíciles de combinar en unas pocas líneas simples en un tablero de preguntas y respuestas de Internet. Además de eso, no es fácil captar la totalidad de las ideas de Fisher, como Efron escribió en su trabajo sobre Fisher:

Una dificultad para evaluar la importancia de las estadísticas de los pescadores es que es difícil decir qué es. Fisher tenía una increíble cantidad de ideas importantes y algunas de ellas, como la inferencia de aleatorización y la condicionalidad, son contradictorias. Es un poco como si en economía Marx, Adam Smith y Keynes resultaran ser la misma persona.


Fisher fue un pionero

Una fuente simple, pero muy buena, de la contribución de Fisher es Wikipedia. Simplemente leyendo el artículo sobre el historial de las estadísticas (o puede usar cualquier otro texto) le dará una idea de la cantidad e importancia de las contribuciones de Fisher.

También verá que es en parte el tiempo, la ubicación y la suerte lo que hizo que Fisher sea un gran contribuyente. Fisher fue un estadístico importante e influyente a principios del siglo XX cuando se crearon los fundamentos básicos de la estadística aplicada y el campo era relativamente pequeño (comparable al período de las matemáticas de los siglos XVIII y XIX).

El primer diario de estadísticas y el primer departamento de estadísticas de una universidad acababan de comenzar cuando Fisher entró en escena. Antes del comienzo del siglo XX, existían principalmente métodos para hacer regresiones y varias ideas sobre distribuciones de términos y errores residuales, utilizados en campos como la astronomía.

Conceptos de errores de medición y probabilidad de resultados. Este tipo de matemática y lógica (más cercano a las matemáticas puras, y ... visto como más noble y menos condenado por matemáticos serios de esa época), se aplicó más ampliamente a los campos de elección de Fisher: genética, evolución, biología, agricultura . Dado que Fisher, un excelente matemático, aportó importantes contribuciones a estos primeros desarrollos (o incluso puede considerarse como el principal impulsor de estos desarrollos), su trabajo se ha colocado en una posición importante en la historia de las estadísticas.

Conceptos básicos y herramientas

Si observa los temas en un libro de introducción a las estadísticas (específicamente los conceptos matemáticos o inferencia), podría considerar a Fisher como el contribuyente dominante. También fue Fisher quien escribió la primera y más influyente introducción a los libros de estadísticas :

  • Métodos estadísticos para investigadores (1925)
  • The Design of Experiments (1935) (usando el experimento de la taza de té para explicar, entre otros, la aleatorización, el uso de cuadrados latinos, hipótesis nula, significado, sensibilidad / poder, y básicamente todo; Yates proporciona un historial histórico de este trabajo)

Tenga en cuenta que existen versiones en línea de estos libros SMRW y parcialmente DE (consulte las lecturas del 29 de octubre b) .

De 1912 a 1925, Fisher:

  • ayudó a mejorar la prueba de chi-cuadrado (donde Pearson y otros estaban equivocados sobre el número de grados de libertad durante muchos años),
  • proporcionó una prueba exacta para calcular el valor p de bondad de ajuste con un bajo número de observaciones (que recibió su nombre como la prueba exacta de Fisher ),
  • norte-1norte
  • desarrolló un análisis de varianza y la distribución F (también llamada así por él), y
  • (otra "pequeña" cosa que hizo como estudiante) fue desarrollar los conceptos básicos y conceptos para la máxima probabilidad ( Aldrich's RA Fisher y Making of Maximum Likelihood ).

Así que más o menos esto cubre la mayoría de las herramientas inferenciales básicas que usan los textos de introducción actuales. Mientras hacía este trabajo sobre estadísticas, Fisher abordó problemas importantes en genética que hacen que personas como Richard Dawkins lo admiren tanto.

Terminología

L2L1L2L1'varianza' (en su artículo de 1920 Una observación matemática de los métodos para determinar la precisión de la observación por el error medio y el error cuadrado medio ).

Cimientos

En el artículo de 1922 sobre los fundamentos matemáticos de la estadística teórica, Fisher proporciona una visión general breve y simple de los conceptos principales, solo para nombrar la lista de definiciones: 'centro de ubicación', 'consistencia', 'distribución', 'eficiencia', ' estimación ',' precisión intrínseca ',' regiones isoestadísticas ',' probabilidad ',' ubicación ',' óptimo ',' escala ',' especificación ',' suficiencia ',' validez ' . Se requiere un historiador para ver lo que Fisher contribuyó aquí en el sentido de ser el creador de los conceptos, y esto también se relaciona con la declaración de Efron. Es difícil comprender qué aporta exactamente quién.

En ese artículo, Fisher comienza a mencionar el problema de aplicar términos como 'media' y 'varianza' tanto al valor de distribución real como al valor estimado.

(Trataré de evitar poner a Fisher en algún lugar de una 'escuela' como frecuentista o bayesiano. Diría que él era 'suficientemente' práctico para cualquier pregunta que tuviera entre manos).

Conceptos avanzados

En su trabajo posterior, Fisher desarrolló los primeros conceptos de análisis discriminante lineal :

X=λ1X1+λ2X2+λ3X3+λ4 4X4 4 maximizará la razón de la diferencia entre las medias específicas y las desviaciones estándar dentro de la especie?

El uso de mediciones múltiples en problemas taxonómicos, 1936

y el concepto de estimación por probabilidad de que Fisher exploró más a fondo y tiene dos conceptos que llevan su nombre, información de Fisher y puntaje de Fisher . Ver Teoría de la estimación estadística, 1925 , Dos nuevas propiedades de probabilidad matemática, 1934 , y La lógica de la inferencia inductiva, 1935. .

Más enlaces:

  • RA Fisher Guide , por John Aldrich. Una fuente enorme, si no la más grande, con información sobre Fisher, con muchas referencias adicionales.
  • La respuesta de Michael Hardy en Mathoverflow sobre una pregunta sobre los mejores matemáticos: /mathpro//a/173374

Escrito por StackExchangeStrike

Sextus Empiricus
fuente
¡Gracias @Martijn! Revisé su respuesta e hice pequeñas ediciones aquí y allá, principalmente para aclarar el formato y corregir algunos errores tipográficos. Espero que no te importe. Estoy feliz de otorgar mi recompensa por esta respuesta; Muy buena contribución. Es especialmente genial tener todas estas referencias.
ameba dice Reinstate Monica
En absoluto, grandes ediciones, por eso lo hice wiki comunitario. Esta es una gran pregunta para responder. Aunque soy un gran admirador de Fisher y he leído varios de sus artículos, sentía que no debería haber respondido a esta pregunta (cargada).
Sextus Empiricus
Anuncié su respuesta en nuestro chat y ahora veo que se convirtió en la más votada en este hilo. Creo que es bien merecido.
ameba dice Reinstate Monica
8

Él inventó algunos conceptos: Suficiencia, eficiencia, ANOVA, ancilaridad, valor p y probablemente una gran cantidad de otros (lo más importante diseño de experimentos).

La función de probabilidad y la mle tenían precursores, pero fue popularizada por él.

kjetil b halvorsen
fuente
99
+1 Aunque Fisher ciertamente debería obtener crédito en relación con él, el concepto del valor p parece haber existido, al menos de manera informal, antes del trabajo de FIsher. Pearson está calculando claramente los valores p en su artículo de 1900 sobre la prueba de bondad de ajuste de chi cuadrado, y trata lo que calcula (si solo se describe de pasada), como si fuera algo obvio y aceptado. Uno tiene la impresión de que no fue visto como un nuevo concepto introducido en ese documento. Por supuesto, se podrían decir cosas similares de muchos conceptos ... a menudo están "alrededor" por un tiempo antes de que alguien lo formalice.
Glen_b -Reinstalar a Monica
8

Sir Ronald Aylmer Fisher es acreditado por numerosos aspectos del diseño experimental y la teoría y práctica estadística moderna. Algunas de sus contribuciones más importantes incluyen pruebas de significación (Bandyopadhyay y Cherry 2011), estimación de máxima verosimilitud (MLE), distribuciones de permutación (re-muestreo), suficiencia, teoría de la optimización asintótica (Efron 1998) y componentes de diseño experimental que incluyen aleatorización, replicación, bloqueo, confusión y análisis de varianza (ANOVA). También es notable su afirmación del experimento de Mendel's Pea Plant. Afirmó que era "demasiado bueno para ser verdad".

Considere leer el artículo de Efron (1998), "RA Fisher en el siglo XXI". Permítanme citar el resumen:

Fisher es la figura más importante en las estadísticas del siglo XX. Esta charla examina su influencia en el pensamiento estadístico moderno, tratando de predecir cuán pescadores podemos esperar que sea el siglo XXI. La filosofía de Fisher se caracteriza por una serie de astutos compromisos entre los puntos de vista bayesiano y frecuentista, aumentados por algunas características únicas que son particularmente útiles en problemas aplicados. Varios temas de investigación actuales se examinan teniendo en cuenta la influencia de los pescadores, o la falta de ella, y lo que esto presagia para futuros desarrollos estadísticos. Basado en la conferencia de Fisher de 1996, el artículo sigue de cerca el texto de esa charla.

Referencias

  • Bandyopadhyay, Prasanta S. y Steve Cherry. "Probabilidad elemental y estadística: una cartilla". Filosofía de la estadística 7 (2011): 53.

  • Efron, Bradley. " RA Fisher en el siglo XXI ". Ciencia estadística (1998): 95-114.

Jessica Burnett
fuente
1
Su versión de las pruebas de significación fue la inferencia fiducial, que ha sido controvertida y no ha aceptado la forma en que lo ha sido la teoría de Neyman-Pearson. Otras contribuciones fueron monumentales y parte de la base de las estadísticas.
Michael R. Chernick
3
Bueno, la inferencia fiducial parece estar encontrando algunos fanáticos ahora. Noto que nadie ha mencionado la Información de Fisher, sin embargo, ni pautas útiles como "Usted analiza como su aleatorización".
Björn el
Bjorn: sí, definitivamente se perdió la parte de Fisher Information. Probablemente porque copié este texto de un artículo que estoy escribiendo sobre la información del pescador. ¡Decir ah!
Jessica Burnett