Preguntas etiquetadas con distributed-computing

376
Explicando Apache ZooKeeper

Estoy tratando de entender ZooKeeper, cómo funciona y qué hace. ¿Hay alguna aplicación que sea comparable a ZooKeeper? Si lo sabes, ¿cómo describirías ZooKeeper a un laico? He intentado apache wiki, zookeeper sourceforge ... pero todavía no puedo relacionarme con él. Acabo de leer a través de...

254
Spark - repartition () vs coalesce ()

De acuerdo con Learning Spark Tenga en cuenta que repartir sus datos es una operación bastante costosa. Spark también tiene una versión optimizada de repartition()llamadas coalesce()que permite evitar el movimiento de datos, pero solo si está disminuyendo el número de particiones RDD. Una...