Algoritmos de aprendizaje automático para la clasificación de la cobertura del suelo
37
Estoy interesado en aprender qué software existe para la clasificación de tierras utilizando algoritmos de aprendizaje automático (por ejemplo, k-NN, Random Forest, árboles de decisión, etc.). Conozco el paquete randomForest en R y MILK y SPy en Python.
¿Qué algoritmos de aprendizaje automático de código abierto o comerciales existen que sean adecuados para la clasificación de la cobertura del suelo?
Debo decir que el entorno de software más completo para el aprendizaje automático y el modelado no paramétrico es R. Este es un gran campo en estadística, que abarca K-NN, suavizado de kernel, modelos aditivos generales, estudiantes débiles, vectores de soporte, redes neuronales, semi - regresión spline paramétrica, imputación, etc. Recomiendo leer: Hastie, T., R. Tibshirani, J. Friedman (2009) Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción. Serie Springer en Estadística.
Además de R, el software comercial de Salford Systems tiene bosques aleatorios, divisiones de regresión adaptativa multivariante, CART y refuerzo de gradiente (TreeNet) disponibles en un entorno GUI. RuleQuest todavía vende See5 / C5, que es una versión actualizada del algoritmo C4 / ID3 CART. Weka 3 de la Universidad de Waikato es un esfuerzo Java de código abierto GUI / Commandline con una gran cantidad de modelos disponibles.
@ Aaron FYI, Falk Hutterman y yo estamos enseñando un taller en la reunión 2013 de US-IALE (Ecología del Paisaje) en Austin, TX. Nuestro enfoque estará en usar R para el aprendizaje automático y el modelado no paramétrico. También proporcionaré una introducción al uso de objetos espaciales en R para la preparación de datos y la especificación de modelos.
Desafortunadamente, no hay GUI a menos que desee dedicar tiempo a construir uno, pero recomendaría el IDE de iPython como un excelente entorno de secuencias de comandos interactivas, incluidas las parcelas en línea con matplotlib en la consola QT.
Una buena visión general de las técnicas de aprendizaje automático en R es la vista de tareas de aprendizaje automático . Ofrece una gran cantidad de algoritmos diferentes, recomendados por los expertos.
Su pregunta supone que los algoritmos de aprendizaje automático para la clasificación de terrenos son de alguna manera distintos del software utilizado para otras aplicaciones de aprendizaje automático. Hay algunas aplicaciones que requieren un tratamiento especial debido a características inusuales, pero no sé por qué sé que el uso del suelo necesita un tratamiento especial. Si los datos de uso de la tierra se pueden poner en una forma estándar delimitada por comas, las herramientas existentes como R deberían funcionar bien. Ahora puede haber o no software de uso del suelo que use modelos descubiertos a partir de técnicas de aprendizaje automático, pero esa es una pregunta diferente.
Editado después de la primera respuesta. -> La mayoría de los paquetes principales para el aprendizaje automático tienen algunas herramientas para la visualización espacial, aunque, por supuesto, pueden no satisfacer sus necesidades particulares. Por ejemplo, ¿está familiarizado con la biblioteca sp para R que está destinada a la visualización de datos espaciales? Veamos si puedo encontrar un enlace apropiado que dé el sabor de lo que puedes hacer con él.
¿Has echado un vistazo a eCognition? Con su nueva versión (8.9) proporcionan el algoritmo de bosques aleatorios dentro de un entorno GUI. Puede crear árboles de proceso agradables e incluir características de objeto.
Hay un grupo de la Universidad de Duke que ha desarrollado algunas herramientas de script interesantes para ArcGIS, incluidos modelos de bosque aleatorios.
La caja de herramientas MGET es solo un contenedor para R. Si tiene la capacidad de usar R, puede evitar un dolor de cabeza considerable llamando a R a través de ArcGIS, a través de Python (Rpy2). Tampoco tiene flexibilidad para usar otras herramientas en R que se pueden aplicar a los objetos resultantes de RF, GAM, regresión o modelo CART.
Recomiendo mucho scikits-learn para Python. Es compatible con la clasificación supervisada y sin supervisión y la documentación es excelente (en particular, consulte el tutorial de Aprendizaje automático para análisis de datos astronómicos y el video de YouTube que lo acompaña (nota: esto dura 3 horas)).
El proyecto está en desarrollo activo, con la última versión 0.12 que se lanzó en septiembre.
Para saber de qué es capaz el paquete, vea Vecinos más cercanos , Bosque aleatorio (en Métodos de conjunto) y Árboles de decisión para usar los ejemplos que dio.
Desafortunadamente, no hay GUI a menos que desee dedicar tiempo a construir uno, pero recomendaría el IDE de iPython como un excelente entorno de secuencias de comandos interactivas, incluidas las parcelas en línea con matplotlib en la consola QT.
fuente
Una buena visión general de las técnicas de aprendizaje automático en R es la vista de tareas de aprendizaje automático . Ofrece una gran cantidad de algoritmos diferentes, recomendados por los expertos.
fuente
Su pregunta supone que los algoritmos de aprendizaje automático para la clasificación de terrenos son de alguna manera distintos del software utilizado para otras aplicaciones de aprendizaje automático. Hay algunas aplicaciones que requieren un tratamiento especial debido a características inusuales, pero no sé por qué sé que el uso del suelo necesita un tratamiento especial. Si los datos de uso de la tierra se pueden poner en una forma estándar delimitada por comas, las herramientas existentes como R deberían funcionar bien. Ahora puede haber o no software de uso del suelo que use modelos descubiertos a partir de técnicas de aprendizaje automático, pero esa es una pregunta diferente.
Editado después de la primera respuesta. -> La mayoría de los paquetes principales para el aprendizaje automático tienen algunas herramientas para la visualización espacial, aunque, por supuesto, pueden no satisfacer sus necesidades particulares. Por ejemplo, ¿está familiarizado con la biblioteca sp para R que está destinada a la visualización de datos espaciales? Veamos si puedo encontrar un enlace apropiado que dé el sabor de lo que puedes hacer con él.
http://rwiki.sciviews.org/doku.php?id=tips:spatial-data:spatial_data_visualization Para obtener una lista más extensa de herramientas útiles para el análisis espacial en R, puede consultar http: //cran.r- project.org/web/views/Spatial.html ya que esto incluye herramientas para geoestadística, análisis ecológico y similares.
fuente
¿Has echado un vistazo a eCognition? Con su nueva versión (8.9) proporcionan el algoritmo de bosques aleatorios dentro de un entorno GUI. Puede crear árboles de proceso agradables e incluir características de objeto.
fuente
Hay un grupo de la Universidad de Duke que ha desarrollado algunas herramientas de script interesantes para ArcGIS, incluidos modelos de bosque aleatorios.
Herramientas de ecología geoespacial marina
fuente
También puede hacer la clasificación de tierras con el complemento DTclassifier (clasificador de árbol de decisión) para QGIS . Proporciona una interfaz simple para la clasificación de datos ráster utilizando árboles de decisión, para realizar dentro de QGIS.
fuente