Aunque me formé como ingeniero, descubro que me estoy interesando más en la minería de datos. En este momento estoy tratando de investigar más el campo. En particular, me gustaría entender las diferentes categorías de herramientas de software que existen y qué herramientas son notables en cada categoría y por qué. (Tenga en cuenta que no dije las "mejores" herramientas, solo las notables para que no comencemos una guerra de llamas). Especialmente tome nota de las herramientas que son de código abierto y están disponibles gratuitamente, aunque no tome esto como que significa Solo estoy interesado en código abierto y gratis.
data-mining
John Berryman
fuente
fuente
Respuestas:
Esta es probablemente la lista más completa que encontrarás: mloss.org
fuente
Mira esto
y el Depósito de aprendizaje automático UCI para conjuntos de datos.
fuente
Rattle es una GUI de minería de datos que proporciona una interfaz para una amplia gama de paquetes R.
fuente
Echa un vistazo a KNIME .
Muy facil de aprender. Con mucho margen para seguir avanzando. Se integra muy bien con Weka y R.
fuente
Desde la perspectiva de la popularidad, este artículo (2008) analiza los 10 algoritmos principales en la minería de datos .
fuente
RapidMiner (Java) [código abierto]
fuente
Existe ELKI , un proyecto universitario de código abierto algo comparable a WEKA, pero mucho más fuerte cuando se trata de agrupamiento y detección de valores atípicos. WEKA en realidad no es realmente minería de datos, sino software de aprendizaje automático.
fuente
Existe este Red-R que tiene una buena interfaz gráfica de usuario y una interfaz de programación visual. Hace uso de R para procesar los diversos análisis de datos.
fuente
Rexer Anlaytics realiza una encuesta de kit de herramientas cada año. KDnuggets tiene descripciones de software por industria e intención.
fuente
La minería de datos de SQL Server (SSDM) no se ha actualizado en mucho tiempo, pero sigue siendo bastante competitiva si extrae grandes bases de datos relacionales y cubos. Estoy avanzando lenta pero sistemáticamente a través de las pruebas de tantas herramientas de minería como puedo y la interfaz de Windows de SQL Server es la más productiva y estable que he encontrado hasta la fecha (particularmente cuando se trata de bases de datos empresariales, algunas de las cuales sorprendentemente interfaces descuidadas) a pesar de su antigüedad. Prefiero una interfaz moderna de Windows Presentation Foundation (WPF), pero esta es la mejor opción.
Escribí una serie completa de tutoriales amateurs detallados sobre él titulados A Rickety Stairway to SQL Server Data Mining , cuando intentaba adquirir algunas habilidades básicas de minería. A pesar de mi inexperiencia, siguen siendo útiles para ayudar a identificar algunas de las "trampas" de antemano.
fuente