Estoy viendo algunas diapositivas de conferencias sobre un curso de ciencias de datos que se pueden encontrar aquí:
https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf
Lamentablemente, no puedo ver el video de esta conferencia y en un punto de la diapositiva, el presentador tiene el siguiente texto:
Algunos principios clave
Piensa como un Bayesiano, verifica como un Frequentista (reconciliación)
¿Alguien sabe lo que eso realmente significa? Tengo la sensación de que hay una buena idea acerca de estas dos escuelas de pensamiento que se pueden extraer de esto.
Respuestas:
La principal diferencia entre las escuelas de estadística bayesianas y frecuentistas surge debido a una diferencia en la interpretación de la probabilidad. Una probabilidad bayesiana es una declaración sobre la creencia personal de que un evento ocurrirá (o ha ocurrido). Una probabilidad frecuentista es una declaración sobre la proporción de eventos similares que ocurren en el límite a medida que aumenta el número de esos eventos.
Para mí, "pensar como un bayesiano" significa actualizar su creencia personal a medida que surge nueva información y "verificar [o preocuparse] como un frecuentista" significa preocuparse por el desempeño de los procedimientos estadísticos agregados a lo largo de los tiempos en que se utilizan esos procedimientos, por ejemplo, cuál es la cobertura de intervalos creíbles, cuáles son las tasas de error Tipo I / II, etc.
fuente
Las estadísticas bayesianas resumen las creencias, mientras que las estadísticas frecuentistas resumen la evidencia. Los bayesianos ven la probabilidad como un grado de creencia. Este tipo de razonamiento inclusivo y generativo es útil para formular hipótesis. Por ejemplo, los bayesianos pueden asignar arbitrariamente cierta probabilidad a la noción de que la luna está hecha de queso verde, independientemente de si los astronautas realmente han podido viajar allí para verificar esto. Esta hipótesis quizás esté respaldada por la idea de que, de lejos, la luna se vecomo el queso verde Los frecuentes no pueden concebir singularmente una hipótesis que sea más que un hombre de paja, ni pueden decir que la evidencia favorece una hipótesis sobre otra. Incluso la máxima probabilidad solo genera una estadística que es "más consistente con lo observado". Formalmente, las estadísticas bayesianas nos permiten pensar fuera de la caja y proponer ideas defendibles a partir de los datos. Pero esto es estrictamente hipótesis generadora en la naturaleza.
Las estadísticas frecuentes se aplican mejor para confirmar hipótesis. Cuando un experimento se lleva a cabo bien, las estadísticas frecuentas proporcionan un contexto de "observador independiente" o "empírico" a los hallazgos evitando los antecedentes. Esto es consistente con la filosofía de la ciencia de Karl Popper. El punto de evidencia no es promulgar una idea determinada. Mucha evidencia es consistente con hipótesis incorrectas. La evidencia puede simplemente falsificar creencias.
La influencia de los antecedentes generalmente se considera un sesgo en el razonamiento estadístico. Como saben, podemos inventar una gran cantidad de razones por las cuales suceden las cosas. Psicológicamente, muchas personas creen que nuestro sesgo de observador es el resultado de antecedentes en nuestro cerebro que nos impiden realmente pesar lo que vemos. "La esperanza nubla la observación", como dijo la Reverenda Madre en Dune. Popper hizo esta idea rigurosa.
Esto tuvo una gran importancia histórica en algunos de los más grandes experimentos científicos de nuestro tiempo. Por ejemplo, John Snow recolectó meticulosamente evidencia de la epidemia de cólera y concluyó astutamente que el cólera no es causado por privación moral, y señaló que la evidencia era altamente consistente con la contaminación de las aguas residuales: tenga en cuenta que no concluyóesto, los hallazgos de Snow fueron anteriores al descubrimiento de bacterias, y no hubo una comprensión mecanicista o etiológica. Un discurso similar se encuentra en Origen de las especies. En realidad, no sabíamos si la luna estaba hecha de queso verde hasta que los astronautas realmente aterrizaron en la superficie y recolectaron muestras. En ese punto, los posteriores bayesianos han asignado muy, muy baja probabilidad a cualquier otra posibilidad, y los frequentistas en el mejor de los casos pueden decir que las muestras son altamente inconsistentes con cualquier cosa, excepto el polvo de la luna.
En resumen, las estadísticas bayesianas son susceptibles de generar hipótesis y las estadísticas frecuentistas son susceptibles de confirmación de hipótesis. Asegurar que los datos se recopilen de forma independiente en estos esfuerzos es uno de los mayores desafíos que enfrentan los estadísticos modernos.
fuente
Plenty of evidence is consistent with incorrect hypotheses
?Según
Cliff AB
el comentario al OP, parece que se dirigen hacia una filosofía empírica bayesiana. Hay tres escuelas de pensamiento bayesianas principales, y Empirical Bayes estima los antecedentes de los datos, a menudo con métodos frecuentistas. Eso no se ajusta exactamente a la cita (lo que implica Bayes por adelantado, preocupaciones similares a las de los frecuentistas después), pero no debemos pasarCliff AB
por alto el excelente comentario.Además, había, y puede haber, una escuela de Bayesiana que pensó que no tenía que verificar nada después de un procedimiento Bayesiano. El pensamiento más moderno usaría verificaciones predictivas posteriores, y quizás ese tipo de enfoque de doble verificación de sus respuestas es a lo que se refiere la cita.
Además, la filosofía frecuentista se refiere a los procedimientos más que a las inferencias de los datos. Entonces, quizás eso también sea una pista del significado de la cita.
fuente
En el contexto de esta clase de ciencias de datos, mi interpretación de "cheque como un frequentist" es que evalúe el desempeño de su función de predicción o la función de decisión sobre la validación de datos en poder de salida. El consejo de "pensar como un bayesiano" expresa la opinión de que una función de predicción derivada de un enfoque bayesiano generalmente dará buenos resultados.
fuente
Suena como "pensar como un bayesiano, verificar como un frecuentista" se refiere al enfoque de uno en el diseño y análisis estadístico. Según tengo entendido, el pensamiento bayesiano implica cierta creencia sobre situaciones anteriores (experimental o estadísticamente), digamos, por ejemplo, que las puntuaciones medias de lectura para los alumnos de cuarto grado son 80 palabras por minuto, y que alguna intervención podría aumentar esto a 90 palabras por minuto . Estas son creencias basadas en estudios e hipótesis previas. El pensamiento frecuente extrapola los hallazgos (de la intervención) para obtener intervalos de confianza u otras estadísticas que se basan en la frecuencia o probabilidad teórica y práctica de que estos resultados vuelvan a ocurrir (es decir, cuán "con frecuencia"). Por ejemplo, la puntuación de lectura posterior a la intervención puede ser de 91 palabras por minuto con un intervalo de confianza del 95% de 85 a 97 palabras por minuto y un valor p asociado (valor de probabilidad) de que sea diferente de la puntuación previa a la intervención. Entonces, el 95% del tiempo, los nuevos puntajes de lectura estarían entre 85 y 97 palabras por minuto después de la intervención. Por lo tanto, "piense como un bayesiano", es decir, teorice, plantee hipótesis, mire pruebas anteriores y "verifique como un frecuentista", es decir, con qué frecuencia se producirán estos resultados experimentales y qué tan probable es que se deban a oportunidad más que la intervención. los nuevos puntajes de lectura estarían entre 85 y 97 palabras por minuto después de la intervención. Por lo tanto, "piense como un bayesiano", es decir, teorice, plantee hipótesis, mire pruebas anteriores y "verifique como un frecuentista", es decir, con qué frecuencia se producirán estos resultados experimentales y qué tan probable es que se deban a oportunidad más que la intervención. los nuevos puntajes de lectura estarían entre 85 y 97 palabras por minuto después de la intervención. Por lo tanto, "piense como un bayesiano", es decir, teorice, plantee hipótesis, mire pruebas anteriores y "verifique como un frecuentista", es decir, con qué frecuencia se producirán estos resultados experimentales y qué tan probable es que se deban a oportunidad más que la intervención.
fuente