La subjetividad en la estadística frecuente

14

A menudo escucho la afirmación de que las estadísticas bayesianas pueden ser muy subjetivas. El argumento principal es que la inferencia depende de la elección de un previo (a pesar de que uno podría usar el principio de indiferencia o entropía máxima para elegir un previo). En comparación, según el reclamo, las estadísticas frecuentistas son en general más objetivas. ¿Cuánta verdad hay en esta declaración?

Además, esto me hace preguntarme:

  1. ¿Cuáles son los elementos concretos de las estadísticas frecuentistas (si los hay) que pueden ser particularmente subjetivos y que no están presentes o son menos importantes en las estadísticas bayesianas?
  2. ¿Es la subjetividad más frecuente en las estadísticas bayesianas que en las frecuentistas?
Amelio Vazquez-Reina
fuente
55
Ciertamente, los métodos frecuentistas son mucho más subjetivos de lo que se anuncia, pero yo diría que los métodos bayesianos son aún más subjetivos. Y por favor no convencerse de que la invariancia de su anterior bajo un grupo o la especificación de un MaxEnt anterior son de alguna manera "objetiva" - los dos tipos antes potencialmente expresan creencias que yo considero informativo, y en todo caso, ninguna de estas estrategias es aplicable en la generalidad completa (por ejemplo, no creo que haya anteriores invariantes o MaxEnt en el espacio de los CDF, y cualquier previo en este espacio asigna la probabilidad 1 a un conjunto topológicamente exiguo).
chico
2
Los bayesianos comienzan en el terreno subjetivo, luego los datos (con suerte) los devuelven a la realidad objetiva. Los frecuentes comienzan (o al menos piensan que lo hacen) desde posiciones objetivas, pero luego terminan contaminando el análisis con sus supuestos subjetivos.
Aksakal
2
Los bayesianos saben y son francos con sus suposiciones. Los frecuentistas generalmente no lo son.
Alexis

Respuestas:

15

A menudo escucho la afirmación de que las estadísticas bayesianas pueden ser muy subjetivas.

Yo también. Pero note que hay una gran ambigüedad en llamar a algo subjetivo.

Subjetividad (ambos sentidos)

Subjetivo puede significar (al menos) uno de

  1. depende de las idiosincrasias del investigador
  2. explícitamente preocupado por el estado del conocimiento de un individuo

El bayesianismo es subjetivo en el segundo sentido porque siempre ofrece una forma de actualizar las creencias representadas por las distribuciones de probabilidad condicionando la información. (Tenga en cuenta que si esas creencias son creencias que algún sujeto realmente tiene o solo creencias que un sujeto podría tener es irrelevante para decidir si es 'subjetivo').

El argumento principal es que la inferencia depende de la elección de un

En realidad, si una previa representa su creencia personal sobre algo, entonces es casi seguro que no lo elige en cualquier más de lo que eligió la mayoría de sus creencias. Y si representa las creencias de alguien, entonces puede ser una representación más o menos precisa de esas creencias, por lo que, irónicamente, habrá un hecho bastante "objetivo" sobre qué tan bien las representa.

(aunque uno podría usar el principio de indiferencia o máxima entropía para elegir un previo).

Uno podría, aunque esto no tiende a generalizarse sin problemas a dominios continuos. Además, podría decirse que es imposible ser plano o 'indiferente' en todas las parametrizaciones a la vez (aunque nunca he estado muy seguro de por qué querría serlo).

En comparación, según el reclamo, las estadísticas frecuentistas son en general más objetivas. ¿Cuánta verdad hay en esta declaración?

Entonces, ¿cómo podríamos evaluar esta afirmación?

Sugiero que en el segundo segundo sentido de subjetivo: es principalmente correcto. Y en el primer sentido de subjetivo: probablemente sea falso.

Frequentismo como subjetivo (segundo sentido)

Algunos detalles históricos son útiles para mapear los problemas

Para Neyman y Pearson, solo existe un comportamiento inductivo , no una inferencia inductiva, y toda evaluación estadística funciona con propiedades de muestreo a largo plazo de los estimadores. (De ahí el análisis alfa y de potencia, pero no los valores de p). Eso es bastante subjetivo en ambos sentidos.

De hecho, es posible, y creo que bastante razonable, argumentar en este sentido que el Frecuentismo en realidad no es un marco de inferencia en absoluto, sino más bien una colección de criterios de evaluación para todos los posibles procedimientos de inferencia que enfatizan su comportamiento en la aplicación repetida. Ejemplos simples serían consistencia, imparcialidad, etc. Esto lo hace obviamente no subjetivo en el sentido 2. Sin embargo, también corre el riesgo de ser subjetivo en el sentido 1 cuando tenemos que decidir qué hacer cuando esos criterios no se aplican (por ejemplo, cuando no hay un estimador imparcial a tener) o cuando se aplican pero se contradicen.

Fisher ofreció un frequentismo menos subjetivo que es interesante. Para Fisher, existe una inferencia inductiva, en el sentido de que un sujeto, el científico, hace inferencias sobre la base de un análisis de datos, realizado por el estadístico. (Por lo tanto, valores p pero no alfa y análisis de potencia). Sin embargo, las decisiones sobre cómo comportarse, si continuar con la investigación, etc. son tomadas por el científico sobre la base de su comprensión de la teoría del dominio, no por el estadístico que aplica el paradigma de inferencia. Debido a esta división del trabajo de los pescadores, tanto la subjetividad (sentido 2) como el sujeto individual (sentido 1) se sientan en el lado de la ciencia, no en el lado estadístico.

Hablando legalmente, el Frequentismo de Fisher es subjetivo. Es solo que el sujeto que es subjetivo no es el estadístico.

Hay varias síntesis de estos disponibles, tanto la mezcla apenas coherente de estos dos que se encuentra en los libros de texto de estadísticas aplicadas y versiones más matizadas, por ejemplo, las 'Estadísticas de errores' promovidas por Deborah Mayo. Este último es bastante poco subjetivo en el sentido 2, pero altamente subjetivo en el sentido 1, porque el investigador tiene que usar el juicio científico (estilo Fisher) para determinar qué probabilidades de error importan y debe ser probado.

Frequentismo como subjetivo (primer sentido)

Entonces, ¿es el frequentismo menos subjetivo en el primer sentido? Depende. Cualquier procedimiento de inferencia puede estar plagado de idiosincracias tal como se aplican realmente. Entonces, ¿quizás sea más útil preguntar si el frequentismo fomenta un enfoque menos subjetivo (primer sentido)? Lo dudo: creo que la aplicación consciente de los métodos subjetivos (segundo sentido) conduce a resultados menos subjetivos (primer sentido), pero se puede argumentar de cualquier manera.

Suponga por un momento que la subjetividad (primer sentido) se cuela en un análisis a través de 'elecciones'. El bayesianismo parece implicar más "elecciones". En el caso más simple, las opciones se suman como: un conjunto de supuestos potencialmente idiosincrásicos para el Frequentista (la función de Probabilidad o equivalente) y dos conjuntos para el Bayesiano (la Probabilidad y un previo sobre las incógnitas).

Sin embargo, los bayesianos saben que están siendo subjetivos (en el segundo sentido) sobre todas estas opciones, por lo que es probable que sean más conscientes de las implicaciones que deberían conducir a una menor subjetividad (en el primer sentido).

Por el contrario, si uno busca una prueba en un gran libro de pruebas, podría tener la sensación de que el resultado es menos subjetivo (primer sentido), pero podría decirse que es el resultado de sustituir la comprensión del problema por parte de otro sujeto. . No está claro que uno se haya vuelto menos subjetivo de esta manera, pero podría sentirse así. Creo que la mayoría estaría de acuerdo en que eso no ayuda.

conjugadoprior
fuente
44
Una definición de diccionario de "subjetivo" (directamente de Google) dice: basado o influenciado por sentimientos personales, gustos u opiniones. por ejemplo, "sus puntos de vista son sinónimos muy subjetivos": personal, personalizado, individual, interno, emocional, instintivo, intuitivo, impresionista . Tenga en cuenta que esto refleja una teoría popular de que una 'visión' (es decir, una creencia) es subjetiva (sentido 1: impresionista, intuitivo, extraño, etc.) porque se refiere al estado interno de un sujeto en particular (sentido 2: personalizado, individual, etc. .) en lugar de ser público, es decir, impersonal .
conjugateprior
2
Puede ser útil pensar en la psicología cognitiva como un ejemplo. Este campo es totalmente subjetiva (en el segundo sentido, porque es todo acerca de los estados internos de las personas y sus efectos sobre el comportamiento de las personas), pero es no subjetivo en el primer sentido, porque los psicólogos no pueden en realidad sólo sentarse y la materia para arriba en la base de su propio estado interno.
conjugateprior
2
El extremo opuesto, donde algo es totalmente idiosincrásico y subjetivo (sentido 1) pero no realmente sobre temas, es más difícil de encontrar. Quizás Lucrecio explicando átomos y vacío en De Rerum Naturae es un ejemplo.
conjugateprior
1
Exactamente. El inglés no ayuda mucho con esto ...
conjugateprior
1
y he aprobado (y ajustado ligeramente) la alteración propuesta
conjugateprior
6

La subjetividad en los enfoques frecuentistas es rampante en la aplicación de la inferencia. Cuando prueba una hipótesis, establece un nivel de confianza, digamos 95% o 99%. ¿De donde viene esto? No proviene de ningún otro lugar que no sean sus propias preferencias o una práctica predominante en su campo.

La materia bayesiana previa es muy pequeña en grandes conjuntos de datos, porque cuando la actualiza con los datos, la distribución posterior se alejará de la anterior a medida que se procesen más y más datos.

Dicho esto, los bayesianos parten de una definición subjetiva de probabilidades, creencias, etc. Esto los hace diferentes de los frecuentistas, que piensan en términos de probabilidades objetivas. En pequeños conjuntos de datos esto hace la diferencia

ACTUALIZACIÓN: Espero que odies la filosofía tanto como yo, pero de vez en cuando tienen un pensamiento interesante, considera el subjetivismo . ¿Cómo sé que realmente estoy en SE? ¿Y si es mi sueño? etc. :)

Aksakal
fuente
1
Además de la elección de un nivel de confianza en la prueba de hipótesis (dado que lo mismo podría argumentarse en las estadísticas bayesianas, por ejemplo, al elegir un criterio para comparar HDP / HDI con ROPE para rechazar o aceptar una hipótesis ), la subjetividad juega un papel en ¿obtener una estimación puntual u obtener intervalos de confianza, tal vez en la elección de estimadores?
Amelio Vazquez-Reina
1
Además, entiendo que los niveles de significación se establecen en las estadísticas frecuentes en el contexto de la toma de decisiones (es decir, ¿deberíamos rechazar la hipótesis nula?), No en el cálculo de las probabilidades. En la teoría de la decisión bayesiana, se podría argumentar lo mismo sobre la elección de una función de pérdida, que puede afectar la decisión óptima (elegida). Además, los valores del nivel de confianza generalmente se eligen de una tasa de error de tipo I aceptable (por ejemplo, el 95% en NHST se establece directamente a partir de una tasa de falsos positivos "no superior al 5%")
Amelio Vazquez-Reina
44
nortepagnortepagnorte
55
Vale la pena señalar que las funciones de pérdida pueden no ser subjetivas (es decir, completamente determinadas por el contexto), en cuyo caso las decisiones óptimas bayesianas tienen el potencial de ser completamente objetivas aparte de las anteriores.
1
α