Así que acabo de leer un gran libro Introducción a Empirical Bayes . Pensé que el libro era genial, pero construir anteriores a partir de los datos se sintió mal. Fui entrenado para que elabore un plan de análisis, luego recopile datos y luego pruebe la hipótesis que previamente determinó en su plan de análisis. Cuando realiza un análisis de los datos que ya se han recopilado, esto lo coloca en una inferencia posselectiva en la que debe ser mucho más estricto con lo que llama "significativo", vea aquí . Creo que el aprendizaje automático tiene algo análogo que se llama "selección de cereza", que significa elegir predictores antes de configurar conjuntos de prueba y entrenamiento ( Introducción al aprendizaje estadístico ).

Dado lo que he aprendido anteriormente, me parece que Bayes empírico se basa en una base débil. ¿La gente lo usa solo en entornos donde los datos se generaron pasivamente? Si es así, esto puede ser justificable, pero no parece correcto usarlo cuando se realiza un diseño experimental riguroso, sin embargo, sé que Brad Efron usa Bayes empíricos específicamente para Bioestadística, generalmente un campo muy NHST.

Mis preguntas son:

¿Cómo es válido el empírico Bayes?
¿En qué situaciones se usa?
¿En qué situaciones debe evitar usar el enfoque empírico de Bayes y por qué?
¿Las personas lo usan en otros campos además de Bioestadística? De ser así, ¿en qué situaciones lo usan?

machine-learning hypothesis-testing bayesian empirical-bayes Alex
fuente

¿Qué significa "válido"? Según el eminente, ahora fallecido, bayesiano, DV Lindley, "No hay nadie menos bayesiano que un bayesiano empírico".

Mark L. Stone

Creo que es importante recordar que los diferentes métodos son buenos para diferentes cosas, y las pruebas de significación no son todo lo que hay en el mundo de las estadísticas.

1 y 3) EB probablemente no sea un procedimiento de prueba de hipótesis válido, pero tampoco está destinado a serlo.

La validez podría ser muchas cosas, pero usted está hablando del Diseño Experimental Riguroso, por lo que probablemente estamos discutiendo una prueba de hipótesis que se supone que lo ayudará a tomar la decisión correcta con cierta frecuencia a largo plazo. Este es un régimen estrictamente dicotómico de tipo sí / no que es principalmente útil para las personas que tienen que tomar una decisión de tipo sí / no. Hay mucho trabajo clásico sobre esto por personas muy inteligentes. Estos métodos tienen una buena validez teórica en el límite, suponiendo que se cumplan todas sus suposiciones, & c. Sin embargo, EB ciertamente no fue hecho para esto. Si desea la maquinaria de los métodos clásicos de NHST, adhiérase a los métodos clásicos de NHST.

2) EB se aplica mejor en problemas en los que se estiman muchas cantidades variables similares.

El propio Efron abre su libro Inferencia a gran escala que enumera tres eras distintas de la historia de las estadísticas, y señala que actualmente estamos en

[la] era de la producción científica en masa, en la que las nuevas tecnologías tipificadas por el microarray permiten a un solo equipo de científicos producir conjuntos de datos de un tamaño que Quetelet envidiaría. Pero ahora la avalancha de datos va acompañada de una avalancha de preguntas, quizás miles de estimaciones o pruebas de hipótesis que el estadístico tiene la responsabilidad de responder juntos; en absoluto lo que los maestros clásicos tenían en mente.

Él continúa:

Por su naturaleza, los argumentos empíricos de Bayes combinan elementos frecuentistas y bayesianos al analizar problemas de estructura repetida. Las estructuras repetidas son exactamente lo que la producción científica en masa se destaca, por ejemplo, en niveles de expresión que comparan sujetos enfermos y sanos para miles de genes al mismo tiempo por medio de microarrays.

Tal vez la aplicación reciente éxito la mayor parte de EB es limma, disponibles en Bioconductor . Este es un paquete R con métodos para evaluar la expresión diferencial (es decir, microarrays) entre dos grupos de estudio en decenas de miles de genes. Smyth muestra que sus métodos de EB producen una estadística t con más grados de libertad que si se calcularan estadísticas t genéticas regulares. El uso de EB aquí "es equivalente a la reducción de las variaciones de muestra estimadas hacia una estimación agrupada, lo que da como resultado una inferencia mucho más estable cuando el número de matrices es pequeño", lo que a menudo es el caso.

Como Efron señala anteriormente, esto no se parece en nada al para qué se desarrolló el NHST clásico, y el entorno suele ser más exploratorio que confirmatorio.

4) Generalmente, puede ver EB como un método de contracción, y puede ser útil en todas partes donde la contracción es útil

limma $X_1, ..., X_k$ $\hat \theta^{JS}_i = (1- c/S^2)X_i,$ $S^2=\sum_{j=1}^k X_j,$ $c$ $X_i$

$\bar X,$

Cuanto más similares sean las cantidades que se estimen, más probable es que la contracción sea útil. El libro al que se refiere utiliza tasas de éxito en el béisbol. Morris (1983) señala un puñado de otras aplicaciones:

Reparto de ingresos --- oficina del censo. Estima los ingresos del censo per cápita para varias áreas.
Garantía de calidad --- Bell Labs. Estima el número de fallas para diferentes períodos de tiempo.
Elaboración de tarifas de seguros. Estima el riesgo por exposición para grupos de asegurados o para diferentes territorios.
Admisiones a la facultad de derecho. Estima el peso del puntaje LSAT en relación con el GPA para diferentes escuelas.
Alarmas de incendio --- NYC. Estima la tasa de falsas alarmas para diferentes ubicaciones de cajas de alarma.

Todos estos son problemas de estimación paralela y, que yo sepa, tienen más que ver con hacer una buena predicción de lo que es cierta cantidad que con determinar una decisión de sí / no.

Algunas referencias

Efron, B. (2012). Inferencia a gran escala: métodos empíricos de Bayes para la estimación, prueba y predicción (Vol. 1). Prensa de la Universidad de Cambridge. Chicago
Efron, B. y Morris, C. (1973). La regla de estimación de Stein y sus competidores: un enfoque empírico de Bayes. Revista de la Asociación Americana de Estadística, 68 (341), 117-130. Chicago
James, W. y Stein, C. (1961, junio). Estimación con pérdida cuadrática. En Actas del cuarto simposio de Berkeley sobre estadística matemática y probabilidad (Vol. 1, No. 1961, pp. 361-379). Chicago
Morris, CN (1983). Inferencia empírica paramétrica de Bayes: teoría y aplicaciones. Revista de la Asociación Americana de Estadística, 78 (381), 47-55.
Smyth, GK (2004). Modelos lineales y métodos empíricos de Bayes para evaluar la expresión diferencial en experimentos de microarrays. Aplicaciones estadísticas en genética y biología molecular Volumen 3, número 1, artículo 3.

einar
fuente

¿Cómo es válido el empírico Bayes?

Respuestas:

1 y 3) EB probablemente no sea un procedimiento de prueba de hipótesis válido, pero tampoco está destinado a serlo.

2) EB se aplica mejor en problemas en los que se estiman muchas cantidades variables similares.

4) Generalmente, puede ver EB como un método de contracción, y puede ser útil en todas partes donde la contracción es útil

Algunas referencias