Dar sentido a la teoría y las aplicaciones estadísticas

13

Recientemente me gradué con mi maestría en modelado médico y biológico, acompañado de matemáticas de ingeniería como fondo. A pesar de que mi programa educativo incluía una cantidad significativa de cursos sobre estadística matemática (ver a continuación una lista), que manejé con calificaciones bastante altas, con frecuencia termino completamente perdido mirando tanto la teoría como las aplicaciones de la estadística. Tengo que decir que, en comparación con las matemáticas "puras", la estadística realmente tiene poco sentido para mí. Especialmente las anotaciones y el lenguaje utilizado por la mayoría de los estadísticos (incluidos mis conferencistas anteriores) es irritantemente complicado y casi ninguno de los recursos que he visto hasta ahora (incluida la wikipedia) tenía ejemplos simples con los que uno podría relacionarse fácilmente y asociarse con la teoría dada. ..

Siendo este el fondo; También me doy cuenta de la amarga realidad de que no puedo tener una carrera como investigador / ingeniero sin un firme control de las estadísticas, especialmente en el campo de la bioinformática.

Esperaba poder obtener algunos consejos de estadísticos / matemáticos más experimentados. ¿Cómo puedo superar este problema que he mencionado anteriormente? ¿Conoces algún buen recurso? tales como libros, libros electrónicos, cursos abiertos (a través de iTunes o OpenCourseware para ex), etc.

EDITAR: Como he mencionado, estoy bastante sesgado (negativamente) hacia la mayoría de la literatura bajo el título general de estadística, y dado que no puedo comprar una cantidad de libros de texto grandes (y caros) por rama de estadística, lo que necesitaría en términos de un libro es algo similar a lo que Tipler & Mosca es para Física, pero en lugar de estadísticas.

Para aquellos que no saben sobre Tipler; Es un gran libro de texto que cubre la gran mayoría de los temas que uno puede encontrar durante los estudios superiores, y los presenta desde la introducción básica hasta detalles un poco más profundos. Básicamente un libro de referencia perfecto, lo compré durante mi primer año en la universidad, todavía lo uso de vez en cuando.


Los cursos que he tomado sobre estadística:

  • un gran curso de introducción
  • procesos estocásticos estacionarios,
  • Procesos de Markov,
  • Métodos de Monte Carlo
  • Análisis de supervivencia
posdef
fuente

Respuestas:

4

Puedo entender completamente tu situación. Aunque soy estudiante de doctorado, a veces me resulta difícil relacionar la teoría y la aplicación. Si está dispuesto a sumergirse en la comprensión de la teoría, definitivamente es gratificante cuando piensa en problemas del mundo real. Pero el proceso puede ser frustrante.

Una de las muchas referencias que me gustan es el análisis de datos de Gelman y Hill con modelos jerárquicos / multinivel . Evitan la teoría en la que pueden expresar el concepto subyacente utilizando simulaciones. Definitivamente lo beneficiará ya que tiene experiencia en MCMC, etc. Como usted dice, está trabajando en bioinformática, probablemente las Estrategias de modelado de regresión de Harrell también son una gran referencia.

Haré de esto un wiki comunitario y dejaré que otros lo agreguen.

suncoolsu
fuente
Gracias por su atención al respecto. Es bueno ver que no soy el único confundido por las cosas. Dicho esto, creo que has sobreestimado mi situación; mientras he tomado varios cursos y estoy familiarizado con la existencia de varias formas diferentes de análisis estadístico; nunca se quedan conmigo después de los cursos. Un par de meses después de los exámenes, me sigo preguntando; "He visto / escuchado esto en alguna parte, pero ¿cómo funcionó realmente?" Esto me sugiere que necesito derribarlo todo y comenzar a construirlo con una base más sólida.
posdef
Añadiría un rotundo "acuerdo" para el texto de Harrell (ortografía de nota). Es excelente, al igual que la combinación de dos paquetes del código R que lo acompaña. También creo que "Estadística aplicada moderna con S" de Venables y Ripley sería una buena adquisición. Tenía un nivel de maestría (con una licenciatura en física) antes de usar MASS para aprender R. Hay una gran cantidad de sabiduría de aplicación en ese texto.
DWin
El libro de regresión Gelman es maravilloso, lo explica todo muy bien y proporciona un código R que es realmente útil para verificar su comprensión del material.
richiemorrisroe 03 de
2

¿Está familiarizado con el análisis de datos bayesianos (por Gelman, Carlin, Stern y Rubin)? Tal vez de eso necesites una dosis.

mef
fuente
2

Todos los problemas de estadística esencialmente se reducen a los siguientes 4 pasos (que tomé prestado de @whuber answer en otra pregunta ):

  1. Estime el parámetro.

  2. Evaluar la calidad de esa estimación.

  3. Explore los datos.

  4. Evaluar el ajuste.

Puede intercambiar parámetros de palabras con el modelo de palabras .

Los libros de estadísticas generalmente presentan los primeros dos puntos para diversas situaciones. El problema de que cada aplicación del mundo real requiere un enfoque diferente, por lo tanto, un modelo diferente, por lo que una gran parte de los libros terminan catalogando estos diferentes modelos. Esto tiene un efecto no deseado de que es fácil perderse en los detalles y perderse el panorama general.

El gran libro de imágenes que recomiendo sinceramente son las estadísticas asintóticas . Da un tratamiento riguroso del tema y es matemáticamente "puro". Aunque su título menciona estadísticas asintóticas, el gran secreto no contado es que la mayoría de los métodos estadísticos clásicos se basan esencialmente en resultados asintóticos.

mpiktas
fuente
2

Creo que lo más importante aquí es desarrollar una intuición sobre estadísticas y algunos conceptos estadísticos generales. Quizás la mejor manera de hacer esto es tener un dominio que pueda "poseer". Esto puede proporcionar un ciclo de retroalimentación positiva donde la comprensión sobre el dominio lo ayuda a comprender más sobre las estadísticas subyacentes, lo que lo ayuda a comprender más sobre el dominio, etc.

Para mí ese dominio eran las estadísticas de béisbol. Entendí que un bateador que va 3 por 4 en un juego no es un "verdadero" bateador .750. Esto ayuda a comprender el punto más general de que los datos de la muestra no son lo mismo que la distribución subyacente. También sé que probablemente esté más cerca de un jugador promedio que de un bateador de .750, por lo que esto ayuda a comprender conceptos como la regresión a la media. A partir de ahí, puedo llegar a la inferencia bayesiana completa donde mi distribución de probabilidad anterior tenía una media de la del jugador de béisbol promedio, y ahora tengo 4 muestras nuevas con las que actualizar mi distribución posterior.

No sé cuál es ese dominio para ti, pero supongo que sería más útil que un simple libro de texto. Los ejemplos ayudan a comprender la teoría, lo que ayuda a comprender los ejemplos. Un libro de texto con ejemplos es bueno, pero a menos que pueda hacer que esos ejemplos sean "suyos", me pregunto si obtendrá suficiente de ellos.

Michael McGowan
fuente
1

Todos aprenden de manera diferente, pero creo que es seguro decir que los ejemplos, ejemplos, ejemplos, ayudan mucho en las estadísticas. Mi sugerencia sería aprender R (solo los conceptos básicos son suficientes para ayudar mucho) y luego puede probar todos y cada uno de los ejemplos hasta que sus ojos sangren. Puede ordenarlo, ajustarlo, trazarlo, nombrarlo. Y, dado que R está orientado a las estadísticas, a medida que aprende R, aprenderá estadísticas. Esos libros que usted enumeró pueden ser atacados desde el punto de vista "muéstrame".

Dado que R es gratis, y una gran cantidad de material fuente es gratis, todo lo que necesita invertir es su tiempo.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Hay muchos buenos libros sobre R que puedes comprar, aquí hay uno que he usado:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Editar ============

Olvidé agregar un par de enlaces. Si está utilizando Windows, un buen editor para alimentar a R es Tinn-R (alguien más puede agregar enlaces para editores en una Mac o Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/

bill_080
fuente
gracias por los enlaces, intentaré revisarlos tanto como pueda en las próximas semanas ... He estado expuesto a R una vez antes, en un curso de análisis de supervivencia en el que hicimos mucha regresión multivariada (cox y aelen modelos) y un montón de otras cosas que realmente no puedo recordar. Mi impresión de R, como una persona que está muy acostumbrada a MATLAB, fue bastante negativa, pero lo hice tenía mucho que ver con el hecho de que estábamos más o menos arrojados al fondo de la piscina, y luego esperaba aprender a nadar por nuestra cuenta, lo que, por supuesto, me llevó a odiar el software a partir de entonces :) Es hora de cambiar eso tal vez
posdef
1

Personalmente me encantó esto, que tenía una muy buena combinación de teoría y aplicación (con muchos ejemplos). Fue una buena combinación con Casella y Berger para un enfoque más orientado a la teoría. Y para una visión general amplia del pincel esto .

siempre
fuente
Ambos libros parecen tener buenas críticas sobre Amazon, ¿alguien puede agregar alguna opinión (quizás con un poco más de detalle) sobre estos? por cierto; por casella & berger te refieres a "Inferencia estadística"?
posdef
Sí 'inferencia estadística'. Para mí, un gran paso fue pasar de comprender los modelos de probabilidad a comprender cómo usar los datos para probar modelos y estimar los parámetros de los modelos. Especialmente el libro de Davison realmente se enfoca en este punto.
siempre