Comprender el problema de Behrens-Fisher

8

Esta sección de este artículo dice:

Ronald Fisher en 1935 introdujo la inferencia fiducial para aplicarla a este problema. Se refirió a un artículo anterior de WV Behrens de 1929. Behrens y Fisher propusieron encontrar la distribución de probabilidad de

Tx¯1x¯2s12/n1+s22/n2
dónde x¯1 y x¯2 son las dos medias de muestra, y s1 y s2son sus desviaciones estándar. [. . . ] Fisher aproximó la distribución de esto al ignorar la variación aleatoria de los tamaños relativos de las desviaciones estándar,
s1/n1s12/n1+s22/n2.

Me parece que no estoy dispuesto a creer esto. (¡Por lo tanto, Wikipedia es falible!) En algún momento de las próximas semanas voy a leer lo que Fisher, Behrens y Bartlett escribieron sobre esto en la década de 1930. Por ahora, estoy mirando el libro de Fisher Métodos estadísticos e inferencia científica . Al igual que con Edwin Jaynes, tengo la impresión de que el hecho de que ocasionalmente fuera un idiota de ninguna manera altera el hecho de que era un gran genio, pero no siempre se expresaba de la mejor manera para comunicarse con mortales menores. En la página 97, Fisher escribe sobre Bartlett:

[...] el conjunto de referencia [...] no se ha limitado al subconjunto que tiene la relación s1/s2observó, pero MS Bartlett lo aprovechó con entusiasmo, como si fuera un defecto en la prueba de significación de la hipótesis compuesta, que en casos especiales el criterio de rechazo se alcanza con menos frecuencia por casualidad que en otros. Sobre la reflexión, no creo que uno deba esperar otra cosa, [...]

Por lo tanto, me parece que Fisher no tenía la intención de "ignorar" la "variación aleatoria de" la relación s1/s2 como un medio de aproximación, pero más bien, pensó que uno debería condicionar s1/s2. Esto parece "condicionarse en una estadística auxiliar", que Fisher empleó con tanto éxito en otros contextos.

Si recuerdo bien, escuché por primera vez sobre Bartlett cuando leí sobre esto en la Enciclopedia de Ciencias Estadísticas , que decía simplemente que Bartlett fue el primero en mostrar que los intervalos fiduciales no son lo mismo que los intervalos de confianza, al mostrar que los intervalos fiduciales que Fisher había derivado en este problema no tenía tasas de cobertura constantes. Esa declaración no me dejó con la impresión de que había cierta controversia sobre esto.

Así que aquí está mi pregunta: ¿Cuál está más cerca de la verdad: el artículo de Wikipedia o mi sospecha?

  • Fisher, RA (1935) "El argumento fiducial en inferencia estadística", Annals of Eugenics , 8, 391-398.
Michael Hardy
fuente

Respuestas:

10

Puede que haya mencionado esto en el sitio una vez antes. Trataré de encontrar un enlace a una publicación donde discutí esto. Alrededor de 1977, cuando era un estudiante graduado en Stanford, tuvimos un seminario de Fisher en el que me inscribí. Participaron varios profesores y visitantes de Stanford, incluidos Brad Efron y los visitantes Seymour Geisser y David Hinkley. Jimmie Savage acababa de publicar un artículo con el título "Relectura de RA Fisher" en Annal of Statistics, creo. Como está tan interesado en Fisher, le recomiendo que encuentre y lea este documento.

Motivado por el documento, el seminario fue diseñado para releer muchos de los famosos artículos de Fisher. Mi tarea fue el artículo sobre el problema de Behrens-Fisher. Mi sensación es que Fisher fue vanidoso y terco, pero nunca tonto. Tenía una gran intuición geométrica y a veces tenía dificultades para comunicarse con los demás. Tenía una relación muy cordial con Gosset, pero desacuerdos con Karl Pearson (máxima probabilidad frente al método de los momentos) y con Neyman y Egon Pearson (prueba de significación por inferencia fiducial frente al enfoque de Neyman-Pearson para la prueba de hipótesis). Aunque el argumento fiducial generalmente se considera el único gran defecto de Fisher y ha sido desacreditado, el enfoque no está totalmente muerto y ha habido nuevas investigaciones en los últimos años.

Creo que la inferencia fiducial era la forma en que Fisher intentaba ser un "objetivo bayesiano". Estoy seguro de que pensó mucho sobre las bases estadísticas. No aceptó el enfoque bayesiano, pero tampoco vio la idea de basar la inferencia en considerar las posibles muestras que tampoco extrajo con sentido. Él creía que la inferencia debería basarse solo en los datos disponibles. Esta idea es muy parecida a la inferencia bayesiana en el sentido de que los bayesianos dibujan únicamente la inferencia basada en la información (la probabilidad) y los parámetros (la distribución previa). En mi opinión, Fisher pensaba mucho en Jeffreys, excepto que quería que la inferencia se basara en la probabilidad y que prescindiera por completo de lo anterior. Eso es lo que llevó a la inferencia fiducial.

Un enlace al artículo salvaje

La biografía de la hija de Fisher, Joan Fisher Box

RA Fisher An Appreciation, editores de Hinkley y Feinberg

Un libro de Erich Lehmann sobre Fisher y Neyman y el nacimiento de la estadística clásica.

Este es un enlace a una publicación anterior que comenté y que también publicaste. Problema de Behrens-Fisher

En conclusión, creo que necesito abordar su breve pregunta. Si la afirmación que citó "Fisher aproximó la distribución de esto al ignorar la variación aleatoria de los tamaños relativos de las desviaciones estándar" es a lo que se refiere, creo que es totalmente falso. Fisher nunca ignoró la variación. Reitero que creo que el argumento fiducial se basó en la idea de que los datos observados y la función de probabilidad deberían ser la base de la inferencia y no las otras muestras que podría haber obtenido de la distribución de la población. Así que me pondría del lado de usted en este caso. Con respecto a Bartlett, como recuerdo de mi estudio de esto hace tantos años, también tuvieron acalorados debates sobre esto y Bartlett hizo un buen caso y mantuvo el suyo en el debate.

Michael R. Chernick
fuente