¿Debo enseñar primero las estadísticas bayesianas o frecuentistas?

32

Estoy ayudando a mis hijos, actualmente en la escuela secundaria, a comprender estadísticas, y estoy considerando comenzar con algunos ejemplos simples sin dejar de lado algunos atisbos de teoría.

Mi objetivo sería darles el enfoque más intuitivo pero instrumentalmente constructivo para aprender estadísticas desde cero, a fin de estimular su interés en seguir las estadísticas y el aprendizaje cuantitativo.

Sin embargo, antes de comenzar, tengo una pregunta particular con implicaciones muy generales:

¿Deberíamos comenzar a enseñar estadísticas usando un marco bayesiano o frecuentista?

Investigando alrededor, he visto que un enfoque común está comenzando con una breve introducción sobre estadísticas frecuentistas seguida de una discusión en profundidad de las estadísticas bayesianas (por ejemplo, Stangl ).

Joe_74
fuente
55
Su pregunta es difícil de responder sin más contexto. ¿Qué es lo que te gustaría lograr?
Glen_b -Reinstate Monica
44
Es una mala educación enseñarles a los niños las estadísticas bayesianas, como servirles vodka o encender cigarros. Tenga en cuenta que tanto el vodka y los cigarros están muy bien para los adultos, siempre y los descubren por sí mismos
Aksakal
2
@ Aksakal En realidad estaba planeando enseñarles el teorema de Bayes mientras tomaba vodka y soplaba havanas ... ;-)
Joe_74
2
Esa es una buena manera de mantener al niño alejado de las estadísticas bayesianas durante unos años. Les dices que son solo las aplicaciones del teorema de Bayes. El teorema funciona bien en estadísticas frecuentas
Aksakal
55
El libro de Nate Silver "La señal y el ruido" es un caso para enseñar a los jóvenes estadísticas bayesianas.
Lloyd Christmas

Respuestas:

25

Tanto las estadísticas bayesianas como las estadísticas frecuentistas se basan en la teoría de la probabilidad, pero yo diría que la primera se basa más en la teoría desde el principio. Por otro lado, seguramente el concepto de un intervalo creíble es más intuitivo que el de un intervalo de confianza, una vez que el alumno comprende bien el concepto de probabilidad. Entonces, sea lo que sea que elija, defiendo en primer lugar fortalecer su comprensión de los conceptos de probabilidad, con todos esos ejemplos basados ​​en dados, cartas, ruleta, paradoja de Monty Hall, etc.

Elegiría un enfoque u otro basado en un enfoque puramente utilitario: ¿es más probable que estudien estadísticas frecuentistas o bayesianas en la escuela? En mi país, definitivamente aprenderían el marco frecuentista primero (y por último: nunca escuché que a los estudiantes de secundaria se les enseñara estadísticas bayesianas, la única posibilidad es en la universidad o después, por autoaprendizaje). Quizás en el tuyo sea diferente. Tenga en cuenta que si necesitan lidiar con NHST (Prueba de significación de hipótesis nulas), eso surge más naturalmente en el contexto de estadísticas frecuentistas, OMI. Por supuesto, también puede probar hipótesis en el marco bayesiano, pero hay muchos estadísticos bayesianos destacados que defienden no usar NHST en absoluto, ya sea bajo el marco frecuentista o bayesiano (por ejemplo, Andrew Gelman de la Universidad de Columbia).

Finalmente, no sé sobre el nivel de estudiantes de secundaria en su país, pero en el mío sería realmente difícil para un estudiante asimilar con éxito (lo básico) la teoría de la probabilidad y el cálculo integral al mismo tiempo. Por lo tanto, si decide seguir con las estadísticas bayesianas, realmente evitaría el caso de la variable aleatoria continua y me limitaría a las variables aleatorias discretas.

DeltaIV
fuente
2
Tenía la impresión (al leer su blog) de que Andrew Gelman abogaría tanto contra el NSHT frecuente como contra Bayesian.
psarka
2
@psarka sí, claro , nunca dije lo contrario.
DeltaIV
3
"En mi país, definitivamente aprenderían primero el marco frecuentista". Esto (u omitir por completo la discusión del bayesianismo) es el enfoque tradicional en todo el mundo.
Kodiólogo
1
@Kodiologist sospechaba tanto. Al menos, puede haber algunos sistemas educativos donde, después del marco frecuentista, también se introduce el bayesiano en la escuela secundaria. Pero ese no es el caso por aquí.
DeltaIV
22

Bayesianos y frecuentistas hacen diferentes preguntas. Bayesian pregunta qué valores de parámetros son creíbles, dados los datos observados. Frequentist pregunta sobre la probabilidad de datos simulados imaginarios si algunos valores de parámetros hipotéticos son verdaderos. Las decisiones frecuentes están motivadas por errores de control, las decisiones bayesianas están motivadas por la incertidumbre en las descripciones de los modelos.

Entonces, ¿cuál deberías enseñar primero? Bueno, si una u otra de esas preguntas es lo que quieres hacer primero, esa es tu respuesta. Pero en términos de accesibilidad y pedagogía, creo que Bayesian es mucho más fácil de entender y es mucho más intuitivo. La idea básica del análisis bayesiano es la reasignación de credibilidad a través de las posibilidades, tal como Sherlock Holmes dijo, y que millones de lectores han entendido intuitivamente. Pero la idea básica del análisis frecuentista es muy desafiante: el espacio de todos los posibles conjuntos de datos que podrían haber sucedido si una hipótesis particular fuera cierta, y la proporción de esos conjuntos de datos imaginarios que tienen una estadística resumida tan o más extrema que el resumen estadística que realmente se observó.

Un capítulo introductorio gratuito sobre ideas bayesianas está aquí . Aquí hay un artículo que pone de lado los conceptos frecuentistas y bayesianos . El artículo explica enfoques frecuentistas y bayesianos para la prueba de hipótesis y la estimación (y muchas otras cosas). El marco del artículo podría ser especialmente útil para los principiantes que intentan obtener una vista del paisaje.

John K. Kruschke
fuente
La inclusión de títulos del capítulo y del artículo podría ser útil en caso de que los enlaces desaparezcan en el futuro.
Richard Hardy
8

Esta pregunta corre el riesgo de estar basada en la opinión, por lo que intentaré ser muy breve con mi opinión y luego darle una sugerencia de libro. A veces vale la pena adoptar un enfoque particular porque es el enfoque que adopta un libro particularmente bueno.

Estoy de acuerdo en que las estadísticas bayesianas son más intuitivas. La distinción Intervalo de confianza versus Intervalo creíble lo resume más o menos: la gente piensa naturalmente en términos de "cuál es la posibilidad de que ..." en lugar del enfoque del Intervalo de confianza. El enfoque del intervalo de confianza suena como si dijera lo mismo que el intervalo creíble, excepto que, por principio general, no puede dar el último paso del "95% del tiempo" al "95% de probabilidad", lo que parece muy frecuente, pero usted No puedo hacerlo. No es inconsistente, simplemente no intuitivo.

Equilibrar eso es el hecho de que la mayoría de los cursos universitarios que tomarán utilizarán el enfoque frecuentador menos intuitivo.

Dicho esto, me gusta mucho el libro Replanteamiento estadístico: un curso bayesiano con ejemplos en R y Stan de Richard McElreath. No es barato, así que léalo y mire en Amazon antes de comprarlo. Me parece un enfoque particularmente intuitivo que aprovecha el enfoque bayesiano y es muy práctico. (Y dado que R y Stan son excelentes herramientas para las estadísticas bayesianas y son gratuitas, es un aprendizaje práctico).

EDITAR: Un par de comentarios han mencionado que el libro probablemente esté más allá de un estudiante de secundaria, incluso con un tutor experimentado . Así que tendré que colocar una advertencia aún más grande: tiene un enfoque simple al principio, pero aumenta rápidamente. Es un libro increíble, pero realmente, realmente tendría que leerlo en Amazon para tener una idea de sus suposiciones iniciales y qué tan rápido aumenta. Hermosas analogías, gran trabajo práctico en R, flujo y organización increíbles, pero tal vez no te sean útiles.

Asume un conocimiento básico de programación y R (paquete estadístico gratuito), y cierta exposición a los conceptos básicos de probabilidad y estadística. No es de acceso aleatorio y cada capítulo se basa en capítulos anteriores. Comienza muy simple, aunque la dificultad aumenta en el medio: termina en una regresión de varios niveles. Por lo tanto, es posible que desee obtener una vista previa de algunos de ellos en Amazon y decidir si puede cubrir fácilmente los conceptos básicos o si salta un poco demasiado lejos en el camino.

EDITAR 2: El resultado final de mi contribución aquí e intentar convertirlo de pura opinión es que un buen libro de texto puede decidir qué enfoque tomar. Prefiero un enfoque bayesiano, y este libro lo hace bien, pero tal vez a un ritmo demasiado rápido.

Wayne
fuente
2
El libro de McElreath es excelente, pero me sorprendería mucho que los estudiantes de secundaria pudieran seguir ese nivel de tratamiento, incluso con un tutor talentoso.
DeltaIV
2
@DeltaIV: Buena respuesta, editaré mi respuesta. Me han engañado varias veces por lo legible y analógico que es al principio. Entra en una curva de aprendizaje empinada a la mitad, y probablemente mucho antes de eso.
Wayne el
1
Otra nota: creo que hay una mayor brecha entre los fundamentos (es decir, la teoría de la probabilidad) y la aplicación en los métodos frequentistas sobre los métodos bayesianos. Es decir, tengo problemas para imaginar que alguien realmente entienda la teoría MLE, la prueba del CLT, etc., sin una educación de posgrado, que es necesaria incluso para los procedimientos frequentistas más básicos. Una vez que conoce la probabilidad condicional, básicamente comprende cómo funciona la inferencia bayesiana. La teoría MCMC es un poco complicada, pero honestamente mucho más simple que comprender realmente la teoría MLE ...
Cliff AB
... y dado que es más fácil cerrar la brecha entre la probabilidad y la aplicación de estadísticas en el marco bayesiano, al menos, creo que eso hace que las cosas sean mentalmente más rápidas. Odiaba hacer TA en los cursos donde teníamos que decir "y confía en nosotros, la teoría MLE funciona con grandes muestras", ya que sentí que tenía que matar algo la curiosidad científica de alguien o requerir un compromiso mental mucho mayor.
Cliff AB
... Pero la intuición detrás de mle es bastante natural ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen
5

Primero me enseñaron el enfoque frecuentista, luego el bayesiano. No soy un estadístico profesional.

Tengo que admitir que no encontré que mi conocimiento previo del enfoque frecuentista fuera decisivamente útil para comprender el enfoque bayesiano.

Me atrevería a decir que depende de qué aplicaciones concretas mostrarás a tus alumnos a continuación, y cuánto tiempo y esfuerzo dedicarás a ellos.

Dicho esto, comenzaría con Bayes.

Emanuele Cipolla
fuente
3

El marco bayesiano está estrechamente vinculado a las habilidades generales de pensamiento crítico. Es lo que necesita en las siguientes situaciones:

  1. Piensa en solicitar un trabajo competitivo. ¿Cuáles son tus posibilidades de entrar? ¿Qué recompensa espera de la solicitud?
  2. Un titular dice que los teléfonos móviles causan cáncer en humanos a largo plazo. ¿Cuánta evidencia tienen de esto?
  3. ¿A qué organización benéfica debe donar dinero si desea que tenga el mayor efecto?
  4. Alguien ofrece lanzar una moneda con una apuesta de $ 0.90 de usted y $ 1.10 de ellos. ¿Les darías el dinero? ¿Por qué por qué no?
  5. Has perdido tus llaves (o una bomba atómica). ¿Dónde empiezas a buscar?

Además, esto es mucho más interesante que memorizar la fórmula para una prueba t de dos muestras: p. Lo que aumenta la posibilidad de que los estudiantes se mantengan interesados ​​lo suficiente como para molestarse con material cada vez más técnico.

conjeturas
fuente
3

Nadie ha mencionado la probabilidad, que es fundamental para las estadísticas bayesianas. Un argumento a favor de enseñar primero a Bayes es que el flujo de la probabilidad, a la probabilidad, a Bayes, es bastante continuo. Bayes puede estar motivado por la probabilidad al notar que (i) la función de probabilidad se ve (y actúa) como una función de distribución de probabilidad, pero no es porque el área bajo la curva no sea 1.0, y (ii) el Wald crudo, comúnmente usado los intervalos asumen una función de probabilidad que es proporcional a una distribución normal, pero los métodos bayesianos superan fácilmente esta limitación.

Otro argumento que favorece a Bayes primero es que la preocupación P (A | B) versus P (B | A) sobre los valores p puede explicarse más fácilmente, como lo han mencionado otros.

Otro argumento a favor de "Bayes primero" es que obliga a los estudiantes a pensar más cuidadosamente sobre los modelos de probabilidad condicional, lo cual es útil en otros lugares, por ejemplo, en el análisis de regresión.

Perdón por la autopromoción, pero dado que está completamente en el tema, no me importa decir que este es precisamente el enfoque que Keven Henning y yo tomamos en nuestro libro "Comprender los métodos estadísticos avanzados" ( https: // peterwestfall. wixsite.com/book-1 ) cuyo público objetivo no son estadísticos.

Peter Westfall
fuente
2

¿Estás enseñando por diversión y comprensión o para uso práctico? Si se trata de enseñar y comprender, iría a Bayes. Si para fines prácticos, definitivamente me volvería frequentista.

En muchos campos, y supongo que en la mayoría de los campos de las ciencias naturales, las personas están acostumbradas a publicar sus trabajos con un valor p. Sus "muchachos" tendrán que leer los documentos de otras personas antes de que escriban los suyos. Para leer los documentos de otras personas, al menos en mi campo, necesitan comprender las hipótesis nulas y los valores p, sin importar cuán estúpidos puedan parecer después de los estudios bayesianos. E incluso cuando estén listos para publicar su primer artículo, probablemente tendrán algún científico de alto rango al frente del equipo y es probable que prefieran el Frequentismo.

Dicho esto, me gustaría estar de acuerdo con @Wayne, ya que el replanteamiento estadístico muestra un camino muy claro hacia las estadísticas bayesianas como primer enfoque y no basado en el conocimiento existente sobre el frequentismo. Es genial cómo este libro no intenta convencerte en una pelea de mejores o peores estadísticas. El argumento declarado del autor para Bayes es (IIRC) que él ha estado enseñando a ambos tipos y Bayes fue más fácil de enseñar.

Bernhard
fuente
2

Me mantendría alejado de Bayesian, seguiría a los gigantes.

Los soviéticos tenían una excelente serie de libros para estudiantes de secundaria, traducidos aproximadamente al inglés como "pequeña biblioteca 'Quant'". Kolmogorov contribuyó con un libro con coautores titulado "Introducción a una teoría de probabilidad". No estoy seguro de que haya sido traducido al inglés, pero aquí está el enlace a su original ruso.

Se acercan explicando las probabilidades a través de la combinatoria, que creo que es la mejor manera de comenzar. El libro es muy accesible para un estudiante de secundaria con matemáticas decentes. Tenga en cuenta que los soviéticos enseñaron matemáticas de manera bastante extensa, por lo que los estudiantes de secundaria occidentales promedio pueden no estar tan bien preparados, pero con suficiente interés y fuerza de voluntad aún pueden manejar el contenido, en mi opinión.

El contenido es muy interesante para los estudiantes, tiene caminatas aleatorias, distribuciones limitantes, procesos de supervivencia, ley de grandes números, etc. Si combina este enfoque con simulaciones por computadora, se vuelve aún más divertido.

Aksakal
fuente