Uso de simulaciones por computadora para comprender mejor los conceptos estadísticos a nivel de posgrado

Hola, estoy tomando un curso de postgrado en Estadística y hemos estado cubriendo estadísticas de exámenes y otros conceptos.

Sin embargo, a menudo puedo aplicar las fórmulas y desarrollar una especie de intuición sobre cómo funcionan las cosas, pero a menudo me queda la sensación de que tal vez si respaldo mi estudio con experimentos simulados desarrollaré una mejor intuición sobre los problemas en cuestión. .

Entonces, he estado pensando en escribir simulaciones simples para comprender mejor algunos de los conceptos que discutimos en clase. Ahora podría usar say Java para:

Produzca una población aleatoria con una media normal y una desviación estándar.
Luego tome una pequeña muestra e intente calcular empíricamente los errores de Tipo I y Tipo II.

Ahora las preguntas que tengo son:

¿Es este un enfoque legítimo para desarrollar la intuición?
¿Hay software para hacer esto ( SAS?, R?)
¿Es esta una disciplina en Estadística que se ocupa de dicha programación: estadística experimental ?, estadística computacional? ¿simulación?

r hypothesis-testing sas simulation computational-statistics usuario1172468
fuente

Uso simulación todo el tiempo para tratar de comprender mejor lo que está sucediendo. Podría usar prácticamente cualquier lenguaje de programación o programa estadístico para hacer este tipo de experimentos (incluso Excel).

John

+1, las simulaciones y las figuras son 2 de las técnicas más útiles para desarrollar la intuición. Los he usado comúnmente para ayudar a otros y a mí mismo a entender las cosas. Hay muchas respuestas a las preguntas de CV que usan sims para ilustrar cosas. Si desea algunos enlaces, podría enumerar fácilmente algunas de mis propias respuestas que han utilizado sims de esta manera. También puede hacer una pregunta aquí en CV en este sentido; por ejemplo, 'Estoy tratando de entender _____, pero tengo dificultades, ¿alguien puede dar una explicación con un sim que lo aclare?' o 'hice este sim y sugiere que funciona de esta manera, ¿no es así?'

gung - Restablece a Monica

En un esfuerzo por cumplir con los altos estándares y expectativas de este sitio, utilizo simulación (así como derivaciones teóricas e ilustraciones) en cada respuesta que se beneficiaría de ella. Una gran parte de mis respuestas recientes incluirá alguna forma de simulación, especialmente casi cualquier respuesta a una pregunta con la etiqueta r . Por ejemplo, puede consultarlos desde la página de búsqueda si está interesado.

whuber

Encontrarás muchas excelentes al ver las respuestas de @ whuber. Como mis respuestas (y habilidades de programación) tienden a ser menos sofisticadas, podrían ser un buen primer paso. Utilizo un sim para mostrar que es difícil usar el ajuste del modelo para elegir el mejor enlace en un GLiM aquí: diferencia entre modelos logit y probit . Aquí utilizo un simulador para mostrar cómo la potencia cae a medida que los tamaños de grupo se vuelven desiguales en la prueba t: ¿cómo se debe interpretar la comparación de medias de diferentes tamaños de muestra ?

gung - Restablece a Monica

Esta pregunta de CV: explicación de simulación estadística , también puede ser de interés para los lectores de este hilo.

gung - Restablece a Monica

Respuestas:

¿Me gusta su pregunta pero no tengo respuestas específicas para 2 y 3? Me imagino que los paquetes de software como SAS (en términos generales de productos SAS y no solo SAS / STAT) pueden tener herramientas que facilitan la simulación, pero no puedo decirlo con certeza. No creo que este tipo de cosas encajen como una rama de las matemáticas o las estadísticas.

Ahora la pregunta 1 es en qué me gustaría centrarme. La simulación puede ayudar en el aprendizaje de estadísticas en todos los niveles y puede ayudar en la investigación estadística en general. De hecho, hay revistas centradas en la simulación y la computación. Incluso la FDA está reconociendo la importancia de la simulación en el diseño de ensayos clínicos y para ayudar a predecir los resultados.

En la década de 1960, Julian Simon enseñó estadística introductoria utilizando la simulación como motivador. Aunque controvertido, más tarde afirmó que estaba haciendo un nuevo muestreo (permutación y arranque) antes de Efron. Publicó un libro usando estas ideas en 1969. Ciertamente carecía de la teoría y era solo una ayuda para la enseñanza y no un nuevo enfoque para la estimación estadística. No desarrolló ninguna de las propiedades matemáticas que vinieron con y después de Efron.

Creo que para las estadísticas introductorias es útil hacer una simulación para demostrar distribuciones de muestreo, mostrar cómo se produce el teorema del límite central y la simulación física a través del quincunx demuestra la versión DeMoivre - Laplace del teorema del límite central.

A veces mejora la intuición. Creo que el problema de Monty Hall es desconcertante y aparentemente paradójico incluso para matemáticos como Paul Erdos. Pero simular el juego suele ser muy convincente. Hay muchos problemas en la probabilidad que son contraintuitivos y la simulación puede, creo, ayudar.

En 1978, cuando estaba trabajando en mi doctorado en teoría del valor extremo, tuve una idea intuitiva para un teorema de límite que estaba tratando de probar. Luché con las matemáticas. Entonces decidí simular el proceso estocástico y la simulación "confirmó" mi resultado. Esto me dio la confianza necesaria para probarlo.

Por lo tanto, incluso a nivel de posgrado y más allá de la simulación puede ser útil de dos maneras.

Para ayudar a desarrollar la intuición como sugiere en la pregunta 1 pero también
Para confirmar la intuición como lo hice en mi tesis

Michael R. Chernick
fuente

Encontré a alguien que ha abordado el problema de Monty Hall en SAS y R aquí sas-and-r.blogspot.com/2010/01/… - disfrute

usuario1172468

Susan Holmes, de la Universidad de Stanford, puso la simulación del juego Monty Hall en su sitio web hace varios años. Gracias por recordarnos @ user1172468 que muchas personas pueden y probablemente están poniendo simulaciones en sus sitios web.

Michael R. Chernick

Problema de Monty Hall con R (muy fácil de seguir): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf

vasili111

Si. Después de todo, se trata de tu intuición.
R te vendría bien. La codificación será bastante fácil para usted si ya conoce Java (o cualquier otro "lenguaje de programación estándar").
La estadística computacional se ocupa del diseño de algoritmos para implementar métodos estadísticos, probablemente eso es lo más parecido a lo que intenta describir aquí.

Diviértete con tu curso!

usεr11852
fuente

Creo que tu respuesta complementa la mía. Di una respuesta detallada a 1 y usted proporcionó una respuesta más definitiva a 2 y 3. Parece que está respondiendo la pregunta a los pocos minutos de la mía. Probablemente nos superpusimos. De todos modos, ¡diste 2 buenas respuestas y yo te di votos positivos por ellas!

Michael R. Chernick

¡Gracias por la aprobación! Parece que estás un paso por delante para responder. :)

usεr11852

Sigue respondiendo Voy a descansar Ya casi he alcanzado mi límite de repeticiones diarias.

Michael R. Chernick

Chicos, pensé que ambas respuestas eran buenas. Seleccioné la respuesta de @Michael porque solo puedo seleccionar una respuesta correcta y sentí que abordaba algunos de los problemas más fundamentales a la mano.

user1172468

@ user1172468 Realmente no necesitas explicarlo, pero es bueno que lo hayas hecho.

Michael R. Chernick

El paquete TeachingDemos para R nació de un proceso de pensamiento similar al suyo, tratando de visualizar y comprender los conceptos de diferentes maneras. Hay funciones dentro del paquete que utilizan la simulación para ayudar a comprender algunos conceptos clave. La versión de desarrollo (R-forge, pero aún no en CRAN) incluye una función "simfun" que puede usarse para crear funciones de simulación para ayudar aún más con las simulaciones.

Greg Snow
fuente

Ya en CRAN: cran.r-project.org/package=TeachingDemos

vasili111

También una lista de otros enlaces de enseñanza y aprendizaje para estadísticas con R: cran.r-project.org/web/views/TeachingStatistics.html

vasili111