Soy un novato que comenzará a leer sobre minería de datos. Tengo conocimientos básicos de IA y estadísticas. Dado que muchos dicen que el aprendizaje automático también juega un papel importante en la minería de datos, ¿es necesario leer sobre el aprendizaje automático antes de poder continuar con la minería de datos?
machine-learning
references
data-mining
Hormiga
fuente
fuente
Respuestas:
Al estar yo mismo en esta posición, trataré de dar una idea.
En primer lugar, descargue los Elementos del aprendizaje estadístico . Presume cálculo y álgebra lineal, y aunque es muy técnico, también está extremadamente bien escrito.
En segundo lugar (o en primer lugar), mire los tutoriales de Andrew Ng sobre aprendizaje automático.
En tercer lugar, obtenga algunos datos y comience a intentar analizarlos. Deberá dividirse en conjuntos de entrenamiento y prueba, y luego construir modelos en el conjunto de entrenamiento y probarlos contra el conjunto de prueba. El paquete caret para R me pareció muy útil para todo esto. Después de eso es práctica, práctica práctica (como casi todo lo demás).
fuente
Introducción a Data Mining por Tan, Steinbech, Kumar es el mejor libro de introducción que existe
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
guarda EoSL para cuando quieras profundizar. Es más una referencia.
fuente
La minería de datos puede ser descriptiva o predictiva.
Por un lado, si está interesado en la minería de datos descriptiva, el aprendizaje automático no le ayudará.
fuente
Solo agrego otra muy buena fuente de tutoriales sobre minería de datos / aprendizaje automático de Tom Mitchell .
Él lo explica muy claramente y también puede descargar sus presentaciones desde su sitio web (junto con ver sus conferencias allí).
fuente