Estoy usando pyspark (Python 2.7.9 / Spark 1.3.1) y tengo un GroupObject de marco de datos que necesito filtrar y ordenar en orden descendente. Tratando de lograrlo a través de este código.
group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False)
Pero arroja el siguiente error.
sort() got an unexpected keyword argument 'ascending'
python
apache-spark
dataframe
pyspark
apache-spark-sql
rclakmal
fuente
fuente
En pyspark 2.4.4
1) group_by_dataframe.count().filter("`count` >= 10").orderBy('count', ascending=False) 2) from pyspark.sql.functions import desc group_by_dataframe.count().filter("`count` >= 10").orderBy('count').sort(desc('count'))
No es necesario importar en 1) y 1) es corto y fácil de leer,
así que prefiero 1) sobre 2)
fuente
también puede usar groupBy y orderBy de la siguiente manera
dataFrameWay = df.groupBy("firstName").count().withColumnRenamed("count","distinct_name").sort(desc("count"))
fuente