Preguntas etiquetadas con hadoop

Hadoop es un proyecto de código abierto de Apache que proporciona software para computación distribuida confiable y escalable. El núcleo consta de un sistema de archivos distribuido (HDFS) y un administrador de recursos (YARN). Varios otros proyectos de código abierto, como Apache Hive, utilizan Apache Hadoop como capa de persistencia.

185
¿Cuándo usar Hadoop, HBase, Hive y Pig?

¿Cuáles son los beneficios de usar Hadoop o HBase o Hive ? Según tengo entendido, HBase evita el uso de map-reduce y tiene un almacenamiento orientado a columnas sobre HDFS. Hive es una interfaz tipo sql para Hadoop y HBase . También me gustaría saber cómo se compara Hive con Pig...

130
Diferencia entre HBase y Hadoop / HDFS

Esta es una pregunta ingenua, pero soy nuevo en el paradigma NoSQL y no sé mucho al respecto. Entonces, si alguien puede ayudarme a comprender claramente la diferencia entre HBase y Hadoop, o si da algunos consejos que podrían ayudarme a comprender la diferencia. Hasta ahora, hice un poco de...

124
Encadenamiento de múltiples trabajos de MapReduce en Hadoop

En muchas situaciones de la vida real en las que aplica MapReduce, los algoritmos finales terminan siendo varios pasos de MapReduce. es decir, Mapa1, Reducir1, Mapa2, Reducir2, etc. Entonces tiene la salida de la última reducción que se necesita como entrada para el siguiente mapa. Los datos...

122
El nodo de nombre está en modo seguro. No puedo irme

root# bin/hadoop fs -mkdir t mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/t. Name node is in safe mode. no puedo crear nada en hdfs yo hice root# bin/hadoop fs -safemode leave Pero mostrando safemode: Unknown command ¿Cuál es el...

110
¿Diferencia entre tablas internas y tablas externas de Hive?

¿Alguien puede decirme la diferencia entre la tabla externa y las tablas internas de Hive? Sé que la diferencia surge cuando se cae la mesa. No entiendo lo que quiere decir con los datos y los metadatos se eliminan en las tablas internas y solo los metadatos se eliminan en las tablas externas....

108
Error al ubicar el binario winutils en la ruta binaria hadoop

Recibo el siguiente error al iniciar namenode para la última versión de hadoop-2.2. No encontré el archivo exe de winutils en la carpeta bin hadoop. Intenté debajo de los comandos $ bin/hdfs namenode -format $ sbin/yarn-daemon.sh start resourcemanager ERROR [main] util.Shell...

96
hadoop No FileSystem para el esquema: archivo

Estoy tratando de ejecutar un simple NaiveBayesClassiferusando hadoop, obteniendo este error Exception in thread "main" java.io.IOException: No FileSystem for scheme: file at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:1375) at