¿Transición de usar software estadístico para comprender ecuaciones matemáticas?

12

Contexto:

Soy estudiante de doctorado en psicología. Al igual que con muchos estudiantes de doctorado en psicología, sé cómo realizar diversos análisis estadísticos utilizando software estadístico, hasta técnicas como PCA, árboles de clasificación y análisis de conglomerados. Pero no es realmente satisfactorio porque, aunque puedo explicar por qué hice un análisis y qué significan los indicadores, no puedo explicar cómo funciona la técnica.

El verdadero problema es que dominar el software estadístico es fácil, pero es limitado. Aprender nuevas técnicas en artículos requiere que entienda cómo leer ecuaciones matemáticas. En este momento no pude calcular valores propios o K-medias. Las ecuaciones son como un idioma extranjero para mí.

Pregunta:

  • ¿Existe una guía completa que ayude a comprender las ecuaciones en los artículos de revistas?

Editar:

Pensé que la pregunta se explicaría más por sí misma: por encima de cierta complejidad, la notación estadística se convierte en una tontería para mí; Digamos que me gustaría codificar mis propias funciones en R o C ++ para comprender una técnica, pero hay una barrera. No puedo transformar una ecuación en un programa. Y realmente: no sé la situación en las escuelas de doctorado de EE. UU., Pero en la mía (Francia), los únicos cursos que puedo seguir son sobre algún movimiento literario del siglo XVI ...

Coronier
fuente
@Coronier Lo siento, dudo que haya una guía completa para comprender los artículos de psicología que utilizan modelos estadísticos. Pero los antecedentes requeridos deben estar al nivel de una maestría en estadística. Si su programa lo pagará, considere obtener una maestría en estadísticas. La siguiente mejor opción para sus propósitos podría ser volver a tomar la versión de estadísticas multivariadas del departamento de estadísticas; por lo general, proporcionan notas con el fondo matemático para PCA, agrupación, árboles, etc. Necesitará un fondo en álgebra lineal y matemática básica estadísticas independientemente.
cerrado el
Por favor haga preguntas más específicas.
44
También soy estudiante de doctorado en psicología, y tomé la decisión de tomar una cantidad significativa de matemáticas en mis años de licenciatura porque había muchos doctores en psicología que no tenían idea de cómo se computaba un PCA (por ejemplo). Lo primero que debe hacer es abrirse camino a través de cualquier libro de texto de álgebra lineal decente. ¿Qué es un libro de texto de álgebra lineal decente? Gilbert Strang es la bomba, y tiene video conferencias de su curso de álgebra lineal en el sitio web del MIT para arrancar. Incluso puedes obtenerlos en iTunes.
Phillip Cloud
1
La pregunta es tan amplia que no obtendrá una respuesta satisfactoria en unos pocos párrafos. Las estadísticas son como preguntas: se vuelve más fácil si lo divide en varios componentes manejables.
p.
Solo puedo estar de acuerdo con los comentarios anteriores. O tendrá que enfocarse en un tema en particular, o simplemente necesita primero revisar algunos libros de texto o folletos en línea. Un libro de texto decente que cubre conceptos básicos para estadísticas multivariadas con ilustraciones es Mathematical Tools for Applied Multivariate Analysis , de Carroll y Green (AP, 1997, Rev. Ed.). Otro es Estadística multivariada aplicada y modelado matemático , de Tinsley y Brown (AP, 2000).
chl

Respuestas:

9

Visión general:

  • Mi impresión es que su experiencia es común a muchos estudiantes de ciencias sociales.
  • El punto de partida es una motivación para aprender.
  • Puede seguir rutas de instrucción autodidacta o formal .

Instrucción formal:

Hay muchas opciones a este respecto. Puede considerar una maestría en estadística o simplemente tomar algunas materias en un departamento de estadística. Sin embargo, es probable que desee comprobar que tiene los conocimientos matemáticos necesarios. Dependiendo del curso, es posible que deba volver a visitar las matemáticas previas al cálculo, y tal vez algún material como cálculo y álgebra lineal antes de abordar materias de estadística matemáticamente rigurosas a nivel universitario.

Autodidacta

Alternativamente, puede seguir la ruta autodidacta. Hay montones de buenos recursos en internet. En particular, leer y hacer ejercicios en libros de texto de matemáticas es importante, pero probablemente no es suficiente. Es importante escuchar a los instructores hablar sobre matemáticas y verlos resolver problemas.

También es importante pensar en sus objetivos matemáticos y los requisitos previos matemáticos necesarios para lograr esos objetivos. Si las ecuaciones son como un idioma extranjero para usted, entonces es posible que primero necesite estudiar matemáticas elementales.

He preparado algunos recursos destinados a ayudar a las personas que están haciendo la transición del uso del software estadístico a la comprensión de las matemáticas subyacentes.

Jeromy Anglim
fuente
Gracias, los recursos que proporciona son geniales. Por cierto, tu blog es totalmente absorbente (soy un estudiante de I / OP y useR, es como una revelación para mí).
Coronier
@Coronier Es genial conocer a otra persona que combina R con I / O Psych.
Jeromy Anglim
3

Tengo la impresión de que cree que puede obtener una idea de una ecuación estadística programándola en R o C ++; no puedes Para entender una ecuación estadística, encuentre un libro de texto de "licenciatura" con muchos problemas de tarea al final de cada capítulo que contenga la ecuación, y luego haga la tarea al final del capítulo que contiene la ecuación.

Por ejemplo, para comprender la PCA, necesita una buena comprensión del álgebra lineal y, en particular, la descomposición de valores singulares. Mientras aprendía computación cuántica a través del libro de Michael Nielsen, se me hizo evidente que necesitaba revisar el álgebra lineal. Encontré los videos de Gilbert Strang, fueron extremadamente útiles para establecer una comprensión fundamental de los conceptos. Sin embargo, el matiz del material no llegó hasta que encontré un libro de álgebra lineal que contenía muchos problemas de tarea, y luego tuve que resolverlos.

Schenectady
fuente
44
@ schenectady mientras simpatizo con su punto de vista, al menos para mí, el código R proporciona un puente que puedo usar para comprender mejor las ecuaciones y las matemáticas en cuestión. Dicho esto, estoy totalmente de acuerdo con la necesidad de problemas, las estadísticas y las matemáticas en general es algo que solo se puede aprender haciendo.
richiemorrisroe
2

Entiendo su dificultad, ya que tengo un problema similar cuando trato de hacer algo nuevo en estadística (también soy un estudiante graduado, pero en un campo diferente). He descubierto que examinar el código R es bastante útil para tener una idea de cómo se calcula algo. Por ejemplo, recientemente he estado aprendiendo cómo usar el kmeansagrupamiento y tengo muchas preguntas básicas, tanto conceptuales como de cómo se implementa. Usando una Rinstalación (recomiendo R Studio, http://www.rstudio.org/ , pero cualquier instalación funciona), simplemente escriba kmeansen la línea de comando. Aquí hay un ejemplo de parte de la salida:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

No estoy seguro de lo práctico que es examinar la fuente cada vez, pero realmente me ayuda a tener una idea de lo que está sucediendo, suponiendo que esté familiarizado con la sintaxis.

Una pregunta anterior que hice en stackoverflow me señaló en esta dirección, pero también me ayudó que los comentarios sobre el código a veces se incluyen aquí .


En términos más generales, el Journal of Statistical Software ilustra este vínculo entre la teoría y la implementación, pero con frecuencia se trata de temas avanzados (que personalmente tengo dificultades para comprender), pero es útil como ejemplo.

celenius
fuente