Estoy ayudando a mis hijos, actualmente en la escuela secundaria, a comprender estadísticas, y estoy considerando comenzar con algunos ejemplos simples sin dejar de lado algunos atisbos de teoría.
Mi objetivo sería darles el enfoque más intuitivo pero instrumentalmente constructivo para aprender estadísticas desde cero, a fin de estimular su interés en seguir las estadísticas y el aprendizaje cuantitativo.
Sin embargo, antes de comenzar, tengo una pregunta particular con implicaciones muy generales:
¿Deberíamos comenzar a enseñar estadísticas usando un marco bayesiano o frecuentista?
Investigando alrededor, he visto que un enfoque común está comenzando con una breve introducción sobre estadísticas frecuentistas seguida de una discusión en profundidad de las estadísticas bayesianas (por ejemplo, Stangl ).
Respuestas:
Tanto las estadísticas bayesianas como las estadísticas frecuentistas se basan en la teoría de la probabilidad, pero yo diría que la primera se basa más en la teoría desde el principio. Por otro lado, seguramente el concepto de un intervalo creíble es más intuitivo que el de un intervalo de confianza, una vez que el alumno comprende bien el concepto de probabilidad. Entonces, sea lo que sea que elija, defiendo en primer lugar fortalecer su comprensión de los conceptos de probabilidad, con todos esos ejemplos basados en dados, cartas, ruleta, paradoja de Monty Hall, etc.
Elegiría un enfoque u otro basado en un enfoque puramente utilitario: ¿es más probable que estudien estadísticas frecuentistas o bayesianas en la escuela? En mi país, definitivamente aprenderían el marco frecuentista primero (y por último: nunca escuché que a los estudiantes de secundaria se les enseñara estadísticas bayesianas, la única posibilidad es en la universidad o después, por autoaprendizaje). Quizás en el tuyo sea diferente. Tenga en cuenta que si necesitan lidiar con NHST (Prueba de significación de hipótesis nulas), eso surge más naturalmente en el contexto de estadísticas frecuentistas, OMI. Por supuesto, también puede probar hipótesis en el marco bayesiano, pero hay muchos estadísticos bayesianos destacados que defienden no usar NHST en absoluto, ya sea bajo el marco frecuentista o bayesiano (por ejemplo, Andrew Gelman de la Universidad de Columbia).
Finalmente, no sé sobre el nivel de estudiantes de secundaria en su país, pero en el mío sería realmente difícil para un estudiante asimilar con éxito (lo básico) la teoría de la probabilidad y el cálculo integral al mismo tiempo. Por lo tanto, si decide seguir con las estadísticas bayesianas, realmente evitaría el caso de la variable aleatoria continua y me limitaría a las variables aleatorias discretas.
fuente
Bayesianos y frecuentistas hacen diferentes preguntas. Bayesian pregunta qué valores de parámetros son creíbles, dados los datos observados. Frequentist pregunta sobre la probabilidad de datos simulados imaginarios si algunos valores de parámetros hipotéticos son verdaderos. Las decisiones frecuentes están motivadas por errores de control, las decisiones bayesianas están motivadas por la incertidumbre en las descripciones de los modelos.
Entonces, ¿cuál deberías enseñar primero? Bueno, si una u otra de esas preguntas es lo que quieres hacer primero, esa es tu respuesta. Pero en términos de accesibilidad y pedagogía, creo que Bayesian es mucho más fácil de entender y es mucho más intuitivo. La idea básica del análisis bayesiano es la reasignación de credibilidad a través de las posibilidades, tal como Sherlock Holmes dijo, y que millones de lectores han entendido intuitivamente. Pero la idea básica del análisis frecuentista es muy desafiante: el espacio de todos los posibles conjuntos de datos que podrían haber sucedido si una hipótesis particular fuera cierta, y la proporción de esos conjuntos de datos imaginarios que tienen una estadística resumida tan o más extrema que el resumen estadística que realmente se observó.
Un capítulo introductorio gratuito sobre ideas bayesianas está aquí . Aquí hay un artículo que pone de lado los conceptos frecuentistas y bayesianos . El artículo explica enfoques frecuentistas y bayesianos para la prueba de hipótesis y la estimación (y muchas otras cosas). El marco del artículo podría ser especialmente útil para los principiantes que intentan obtener una vista del paisaje.
fuente
Esta pregunta corre el riesgo de estar basada en la opinión, por lo que intentaré ser muy breve con mi opinión y luego darle una sugerencia de libro. A veces vale la pena adoptar un enfoque particular porque es el enfoque que adopta un libro particularmente bueno.
Estoy de acuerdo en que las estadísticas bayesianas son más intuitivas. La distinción Intervalo de confianza versus Intervalo creíble lo resume más o menos: la gente piensa naturalmente en términos de "cuál es la posibilidad de que ..." en lugar del enfoque del Intervalo de confianza. El enfoque del intervalo de confianza suena como si dijera lo mismo que el intervalo creíble, excepto que, por principio general, no puede dar el último paso del "95% del tiempo" al "95% de probabilidad", lo que parece muy frecuente, pero usted No puedo hacerlo. No es inconsistente, simplemente no intuitivo.
Equilibrar eso es el hecho de que la mayoría de los cursos universitarios que tomarán utilizarán el enfoque frecuentador menos intuitivo.
Dicho esto, me gusta mucho el libro Replanteamiento estadístico: un curso bayesiano con ejemplos en R y Stan de Richard McElreath. No es barato, así que léalo y mire en Amazon antes de comprarlo. Me parece un enfoque particularmente intuitivo que aprovecha el enfoque bayesiano y es muy práctico. (Y dado que R y Stan son excelentes herramientas para las estadísticas bayesianas y son gratuitas, es un aprendizaje práctico).
EDITAR: Un par de comentarios han mencionado que el libro probablemente esté más allá de un estudiante de secundaria, incluso con un tutor experimentado . Así que tendré que colocar una advertencia aún más grande: tiene un enfoque simple al principio, pero aumenta rápidamente. Es un libro increíble, pero realmente, realmente tendría que leerlo en Amazon para tener una idea de sus suposiciones iniciales y qué tan rápido aumenta. Hermosas analogías, gran trabajo práctico en R, flujo y organización increíbles, pero tal vez no te sean útiles.
Asume un conocimiento básico de programación y R (paquete estadístico gratuito), y cierta exposición a los conceptos básicos de probabilidad y estadística. No es de acceso aleatorio y cada capítulo se basa en capítulos anteriores. Comienza muy simple, aunque la dificultad aumenta en el medio: termina en una regresión de varios niveles. Por lo tanto, es posible que desee obtener una vista previa de algunos de ellos en Amazon y decidir si puede cubrir fácilmente los conceptos básicos o si salta un poco demasiado lejos en el camino.
EDITAR 2: El resultado final de mi contribución aquí e intentar convertirlo de pura opinión es que un buen libro de texto puede decidir qué enfoque tomar. Prefiero un enfoque bayesiano, y este libro lo hace bien, pero tal vez a un ritmo demasiado rápido.
fuente
Primero me enseñaron el enfoque frecuentista, luego el bayesiano. No soy un estadístico profesional.
Tengo que admitir que no encontré que mi conocimiento previo del enfoque frecuentista fuera decisivamente útil para comprender el enfoque bayesiano.
Me atrevería a decir que depende de qué aplicaciones concretas mostrarás a tus alumnos a continuación, y cuánto tiempo y esfuerzo dedicarás a ellos.
Dicho esto, comenzaría con Bayes.
fuente
El marco bayesiano está estrechamente vinculado a las habilidades generales de pensamiento crítico. Es lo que necesita en las siguientes situaciones:
Además, esto es mucho más interesante que memorizar la fórmula para una prueba t de dos muestras: p. Lo que aumenta la posibilidad de que los estudiantes se mantengan interesados lo suficiente como para molestarse con material cada vez más técnico.
fuente
Nadie ha mencionado la probabilidad, que es fundamental para las estadísticas bayesianas. Un argumento a favor de enseñar primero a Bayes es que el flujo de la probabilidad, a la probabilidad, a Bayes, es bastante continuo. Bayes puede estar motivado por la probabilidad al notar que (i) la función de probabilidad se ve (y actúa) como una función de distribución de probabilidad, pero no es porque el área bajo la curva no sea 1.0, y (ii) el Wald crudo, comúnmente usado los intervalos asumen una función de probabilidad que es proporcional a una distribución normal, pero los métodos bayesianos superan fácilmente esta limitación.
Otro argumento que favorece a Bayes primero es que la preocupación P (A | B) versus P (B | A) sobre los valores p puede explicarse más fácilmente, como lo han mencionado otros.
Otro argumento a favor de "Bayes primero" es que obliga a los estudiantes a pensar más cuidadosamente sobre los modelos de probabilidad condicional, lo cual es útil en otros lugares, por ejemplo, en el análisis de regresión.
Perdón por la autopromoción, pero dado que está completamente en el tema, no me importa decir que este es precisamente el enfoque que Keven Henning y yo tomamos en nuestro libro "Comprender los métodos estadísticos avanzados" ( https: // peterwestfall. wixsite.com/book-1 ) cuyo público objetivo no son estadísticos.
fuente
¿Estás enseñando por diversión y comprensión o para uso práctico? Si se trata de enseñar y comprender, iría a Bayes. Si para fines prácticos, definitivamente me volvería frequentista.
En muchos campos, y supongo que en la mayoría de los campos de las ciencias naturales, las personas están acostumbradas a publicar sus trabajos con un valor p. Sus "muchachos" tendrán que leer los documentos de otras personas antes de que escriban los suyos. Para leer los documentos de otras personas, al menos en mi campo, necesitan comprender las hipótesis nulas y los valores p, sin importar cuán estúpidos puedan parecer después de los estudios bayesianos. E incluso cuando estén listos para publicar su primer artículo, probablemente tendrán algún científico de alto rango al frente del equipo y es probable que prefieran el Frequentismo.
Dicho esto, me gustaría estar de acuerdo con @Wayne, ya que el replanteamiento estadístico muestra un camino muy claro hacia las estadísticas bayesianas como primer enfoque y no basado en el conocimiento existente sobre el frequentismo. Es genial cómo este libro no intenta convencerte en una pelea de mejores o peores estadísticas. El argumento declarado del autor para Bayes es (IIRC) que él ha estado enseñando a ambos tipos y Bayes fue más fácil de enseñar.
fuente
Me mantendría alejado de Bayesian, seguiría a los gigantes.
Los soviéticos tenían una excelente serie de libros para estudiantes de secundaria, traducidos aproximadamente al inglés como "pequeña biblioteca 'Quant'". Kolmogorov contribuyó con un libro con coautores titulado "Introducción a una teoría de probabilidad". No estoy seguro de que haya sido traducido al inglés, pero aquí está el enlace a su original ruso.
Se acercan explicando las probabilidades a través de la combinatoria, que creo que es la mejor manera de comenzar. El libro es muy accesible para un estudiante de secundaria con matemáticas decentes. Tenga en cuenta que los soviéticos enseñaron matemáticas de manera bastante extensa, por lo que los estudiantes de secundaria occidentales promedio pueden no estar tan bien preparados, pero con suficiente interés y fuerza de voluntad aún pueden manejar el contenido, en mi opinión.
El contenido es muy interesante para los estudiantes, tiene caminatas aleatorias, distribuciones limitantes, procesos de supervivencia, ley de grandes números, etc. Si combina este enfoque con simulaciones por computadora, se vuelve aún más divertido.
fuente