📌  相关文章
📜  返回分组项目的 RDD. - Python 代码示例

📅  最后修改于: 2022-03-11 14:45:32.565000             🧑  作者: Mango

代码示例1
rdd = sc.parallelize([1, 1, 2, 3, 5, 8])
result = rdd.groupBy(lambda x: x % 2).collect()
sorted([(x, sorted(y)) for (x,y) in result])
# [(0, [2, 8]), (1, [1, 1, 3, 5])]