He tenido suficientes cursos sobre estadísticas durante mis años escolares y en la universidad. Tengo una buena comprensión de los conceptos, como CI, valores p, interpretación de significación estadística, pruebas múltiples, correlación, regresión lineal simple (con mínimos cuadrados) (modelos lineales generales) y todas las pruebas de hipótesis. Me lo habían presentado gran parte de los días anteriores, principalmente matemáticamente. Y últimamente, con la ayuda del libro Bioestadística intuitiva , he comprendido una comprensión sin precedentes de la teoría conceptual real, creo.
Ahora, lo que me falta es la comprensión de los modelos de ajuste (estimación de parámetros para modelar) y similares. En particular, conceptos como la estimación de máxima verosimilitud, modelos lineales generalizados , enfoques bayesianos a las estadísticas inferenciales siempre me parecen extraños. No hay suficientes ejemplos o tutoriales o conceptualmente sólidos, como uno encontraría en modelos probabilísticos simples u otros temas (básicos) en Internet.
Soy bioinformático y trabajo en datos de RNA-Seq que tratan con recuentos de lectura sin procesar para encontrar, digamos, expresión génica (o expresión génica diferencial). Desde mi trasfondo, incluso si no estoy familiarizado con los modelos estadísticos, puedo comprender la razón de un supuesto de distribución de Poisson y binomios negativos, etc. Pero algunos documentos tratan de modelos lineales generalizados y estiman un MLE, etc. Creo que tengo los antecedentes necesarios para entender.
Supongo que lo que estoy pidiendo es un enfoque que algunos expertos entre ustedes consideren útil y (un) libro (s) que me ayuda a comprender estos conceptos de una manera más intuitiva (no solo matemática rigurosa, sino teoría respaldada por las matemáticas). Como voy a aplicarlos principalmente, estaría satisfecho (en este momento) con comprender qué es qué y más tarde, puedo volver a las pruebas matemáticas rigurosas ... ¿Alguien tiene alguna recomendación? No me importa comprar más de 1 libro si los temas que solicité están realmente dispersos para ser cubiertos en un libro.
¡Muchas gracias!
Respuestas:
Encontrará todo lo que no sea bayesiano sobre lo que preguntó sobre las Estrategias de modelado de regresión de Frank Harrell . Dejaría las recomendaciones bayesianas a personas más conocedoras (aunque tengo a Gelman, Carlin, Stern y Rubin , así como a Gilks, Richardson y Speigelhalter , en mi estantería). Debería haber algunos libros de biostato bayesiano en el mercado.
Actualización: McCullach y Nelder (1989) es un libro clásico sobre GLM, por supuesto. Fue innovador para su época, pero francamente lo encuentro bastante aburrido. Además, no cubre las adiciones posteriores como diagnósticos residuales, modelos inflados a cero o extensiones multinivel / jerárquicas. Hardin e Hilbe (2007) cubren algunas de estas cosas más nuevas con buenos detalles con ejemplos prácticos en Stata (donde GLMs y extensiones están muy bien implementadas; Hardin solía trabajar en Stata Corp. escribiendo muchos de estos comandos, además de contribuir al estimador de sándwich).
fuente
Yo recomendaría seguir dos libros:
fuente