Preguntas etiquetadas con hadoop

92
Avro contra Parquet

Estoy planeando usar uno de los formatos de archivo hadoop para mi proyecto relacionado con hadoop. Yo entiendo de parquet es eficaz para la consulta y Avro basada en la columna para barrido completo o cuando necesitamos todos los datos de las columnas! Antes de continuar y elegir uno de los...

87
Parquet vs ORC vs ORC con Snappy

Estoy realizando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que afirman que Parquet es mejor en complejidad de tiempo /...