Preguntas etiquetadas con hive

87
Parquet vs ORC vs ORC con Snappy

Estoy realizando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que afirman que Parquet es mejor en complejidad de tiempo /...

82
Diferencia entre INNER JOIN y LEFT SEMI JOIN

¿Cuál es la diferencia entre an INNER JOINy LEFT SEMI JOIN? En el escenario siguiente, ¿por qué obtengo dos resultados diferentes? El INNER JOINconjunto de resultados es mucho mayor. ¿Alguien puede explicarlo? Estoy tratando de obtener los nombres table_1que solo aparecen en table_2. SELECT...