¿Cómo comenzar a leer sobre minería de datos?

14

Soy un novato que comenzará a leer sobre minería de datos. Tengo conocimientos básicos de IA y estadísticas. Dado que muchos dicen que el aprendizaje automático también juega un papel importante en la minería de datos, ¿es necesario leer sobre el aprendizaje automático antes de poder continuar con la minería de datos?

Hormiga
fuente
1
Minería de datos: conceptos y técnicas Por Jiawei Han es un buen comienzo
aaronjg

Respuestas:

12

Al estar yo mismo en esta posición, trataré de dar una idea.

En primer lugar, descargue los Elementos del aprendizaje estadístico . Presume cálculo y álgebra lineal, y aunque es muy técnico, también está extremadamente bien escrito.

En segundo lugar (o en primer lugar), mire los tutoriales de Andrew Ng sobre aprendizaje automático.

En tercer lugar, obtenga algunos datos y comience a intentar analizarlos. Deberá dividirse en conjuntos de entrenamiento y prueba, y luego construir modelos en el conjunto de entrenamiento y probarlos contra el conjunto de prueba. El paquete caret para R me pareció muy útil para todo esto. Después de eso es práctica, práctica práctica (como casi todo lo demás).

richiemorrisroe
fuente
1
¡Asustarás al pobre hombre para siempre!
Neil McGuigan
El curso de Andew Ng se "ofrecerá gratis y en línea" a los estudiantes de todo el mundo durante el otoño de 2011, según ml-class.org
Andre
4

La minería de datos puede ser descriptiva o predictiva.

Por un lado, si está interesado en la minería de datos descriptiva, el aprendizaje automático no le ayudará.

knorte

  • knorte
  • knortenorte
Wok
fuente
3
Vale la pena señalar que a algunos autores les gusta hacer una distinción entre DM y ML dependiendo de la magnitud de k/ /norte. Personalmente, me gusta el enfoque de Radford Neale, en su curso sobre Métodos estadísticos para el aprendizaje automático y la minería de datos : muchos problemas de aprendizaje automático tienen una gran cantidad de variables, las aplicaciones de minería de datos a menudo involucran un gran número de casos.
chl
3

Solo agrego otra muy buena fuente de tutoriales sobre minería de datos / aprendizaje automático de Tom Mitchell .

Él lo explica muy claramente y también puede descargar sus presentaciones desde su sitio web (junto con ver sus conferencias allí).

Miroslav Sabo
fuente