En matemáticas, hay ramas como álgebra, análisis, topología, etc. En el aprendizaje automático hay aprendizaje supervisado, no supervisado y de refuerzo. Dentro de cada una de estas ramas, hay ramas más finas que dividen aún más los métodos.
Tengo problemas para trazar un paralelo con las estadísticas. ¿Cuáles serían las principales ramas de las estadísticas (y sub-ramas)? Probablemente no sea posible una partición perfecta, pero cualquier cosa es mejor que un gran mapa en blanco.
self-study
classification
silly.deer
fuente
fuente
Respuestas:
Encuentro estos sistemas de clasificación extremadamente inútiles y contradictorios. Por ejemplo:
y así. No hay "ramas" inequívocas de las matemáticas, y tampoco debería haber estadísticas.
fuente
Este es un contrapunto menor a la respuesta de Rob Hyndman. Comenzó como un comentario y luego se volvió demasiado complejo para uno. Si esto está muy lejos de abordar la pregunta principal, me disculpo y lo eliminaré.
La biología ha estado representando relaciones jerárquicas desde mucho antes del primer garabato de Darwin (ver el comentario de Nick Cox para un enlace). La mayoría de las relaciones evolutivas todavía se muestran con este tipo de 'árbol filogenético' agradable, limpio y ramificado:
Sin embargo, finalmente nos dimos cuenta de que la biología es más complicada que esto. Ocasionalmente, existe un intercambio genético (a través de cruces y otros procesos) entre distintas especies y genes presentes en una parte del árbol que 'salta' a una parte diferente del árbol. La transferencia horizontal de genes mueve los genes de una manera que hace que la simple representación del árbol anterior sea inexacta. Sin embargo, no abandonamos los árboles, sino que simplemente creamos modificaciones a este tipo de visualización:
Esto es más difícil de seguir, pero transmite una imagen más precisa de la realidad.
Otro ejemplo:
Sin embargo, nunca presentamos estas figuras más complejas para empezar, porque son difíciles de comprender sin comprender los conceptos básicos. En cambio, enseñamos la idea básica con la figura simple, y luego les presentamos la figura más compleja y las complicaciones más nuevas de la historia.
Cualquier "mapa" de estadísticas sería igualmente inexacto y una valiosa herramienta de enseñanza. Las visualizaciones del formulario que sugiere OP son muy útiles para los estudiantes y no deben ignorarse simplemente porque no logran capturar la realidad en su totalidad. Podemos agregar más complejidad a la imagen una vez que tengan un marco básico en su lugar.
fuente
Puede consultar las palabras clave / etiquetas del sitio web Cross Validated.
Ramas como una red
Una forma de hacerlo es trazarlo como una red basada en las relaciones entre las palabras clave (con qué frecuencia coinciden en la misma publicación).
Cuando utiliza este script SQL para obtener los datos del sitio de (data.stackexchange.com/stats/query/edit/1122036)
Luego, obtiene una lista de palabras clave para todas las preguntas con una puntuación de 2 o más.
Puede explorar esa lista trazando algo como lo siguiente:
Actualización: lo mismo con el color (basado en vectores propios de la matriz de relación) y sin la etiqueta de autoestudio
Puede limpiar este gráfico un poco más (por ejemplo, retire las etiquetas que no se relacionan con conceptos estadísticos como las etiquetas de software, en el gráfico anterior esto ya está hecho para la etiqueta 'r') y mejore la representación visual, pero supongo que esta imagen de arriba ya muestra un buen punto de partida.
Código R:
Ramas jerárquicas
Creo que este tipo de gráficos de red anteriores se relacionan con algunas de las críticas con respecto a una estructura jerárquica puramente ramificada. Si lo desea, supongo que podría realizar un agrupamiento jerárquico para forzarlo a una estructura jerárquica.
A continuación se muestra un ejemplo de dicho modelo jerárquico. Todavía sería necesario encontrar nombres de grupo adecuados para los diversos grupos (pero no creo que este grupo jerárquico sea la buena dirección, por lo que lo dejo abierto).
La medida de distancia para el agrupamiento se ha encontrado por prueba y error (haciendo ajustes hasta que los grupos parezcan agradables.
Escrito por StackExchangeStrike
fuente
Una manera fácil de responder a su pregunta es buscar las tablas de clasificación comunes. Por ejemplo, la clasificación de asignaturas de matemáticas de 2010 es utilizada por algunas publicaciones para clasificar trabajos. Estos son relevantes porque así es como muchos autores clasifican sus propios artículos.
Hay muchos ejemplos de clasificaciones similares, por ejemplo, la clasificación de arxiv o el UDK (clasificación decimal universal) del ministerio de educación ruso, que se utiliza ampliamente para todas las publicaciones e investigaciones.
Otro ejemplo es el Sistema de Claasificación JEL de la Asociación Económica Americana. Artículo de Rob Hyndman " Predicción automática de series de tiempo: el paquete de pronóstico para R ". Está clasificado como C53, C22, C52 según JEL. Hyndman tiene un punto en criticar las clasificaciones de los árboles. Un mejor enfoque podría ser el etiquetado, por ejemplo, las palabras clave en su artículo son: "modelos ARIMA, pronóstico automático, suavizado exponencial, intervalos de predicción, modelos de espacio de estado, series de tiempo, R." Se podría argumentar que estas son mejores formas de clasificar los documentos, ya que no son jerárquicos y se podrían construir múltiples jerarquías.
@whuber señaló que algunos de los últimos avances, como el aprendizaje automático, no estarán bajo estadísticas en las clasificaciones actuales. Por ejemplo, eche un vistazo al documento " Aprendizaje profundo: una introducción para matemáticos aplicados " de Catherine F. Higham, Desmond J. Higham. Clasificaron su trabajo bajo el MSC mencionado anteriormente como 97R40, 68T01, 65K10, 62M45. estos están bajo ciencias de la computación, educación matemática y análisis numérico además de estadísticas
fuente
Una forma de abordar el problema es mirar las redes de citas y coautoría en revistas de estadísticas, como Annals of Statistics, Biometrika, JASA y JRSS-B. Esto fue hecho por:
Identificaron comunidades de estadísticos y utilizaron su conocimiento de dominio para etiquetar a las comunidades como:
El documento incluye una discusión detallada de las comunidades junto con la descomposición de las más grandes en otras subcomunidades.
Es posible que esto no responda completamente a la pregunta, ya que se trata de los campos de investigación de estadísticas en lugar de todos los campos, incluidos los que ya no están activos. Espero que, sin embargo, sea útil. Por supuesto, hay otras advertencias (como considerar solo estas cuatro revistas) que se analizan más adelante en el documento.
fuente
Veo muchas respuestas sorprendentes, y no sé cómo se puede recibir una humilde clasificación propia, pero no conozco ningún libro completo de todas las estadísticas para mostrar el resumen de, y creo que, como @ Como comentó brillantemente, una clasificación de un campo de estudio puede ser útil. Entonces, aquí está mi tiro:
Por supuesto, esto es demasiado simplista, solo tiene la intención de darle una idea directa a alguien que apenas conoce el campo, cada uno de nosotros aquí seguramente sabe que hay muchos métodos entre las categorías aquí, muchos otros no No enumero porque son menos famosos o porque simplemente lo olvidé. Espero que te guste.
fuente
Una forma de organizar esta información es encontrar un buen libro y mirar la tabla de contenido. Esto es una paradoja porque usted preguntó específicamente sobre estadísticas , mientras que la mayoría de los textos introductorios de nivel de posgrado sobre el tema son estadísticos y teoría de la probabilidad juntos. Un libro que estoy leyendo sobre regresión ahora tiene el siguiente TOC:
Modelos de datos binarios
Modelos de regresión general
(Las secciones restantes son compatibles con las matemáticas y la teoría de la probabilidad)
fuente