📅  最后修改于: 2023-12-03 15:39:09.955000             🧑  作者: Mango
在 Spark 中,可以使用 sortByKey()
方法对 (key, value)
对组成的 RDD 进行排序。这个方法把 RDD 按照键值进行排序,返回一个新的 RDD。
# 创建一个 (key, value) 的 RDD
data = [('k1', 2), ('k2', 4), ('k4', 1), ('k3', 3)]
rdd = sc.parallelize(data)
# 对 RDD 进行排序
sorted_rdd = rdd.sortByKey()
# 显示排序后的结果
print('排序后的结果:')
for key, value in sorted_rdd.collect():
print(key, value)
排序后的结果:
k1 2
k2 4
k3 3
k4 1
从上面的结果可以看出,按照键值排序后,RDD 的值已经按照 key 的顺序排好。
sortByKey(ascending=False)
方法。以上就是对 RDD 进行排序的介绍,希望对大家有所帮助。