📌  相关文章
📜  将 RDD 中每个键的值分组到一个序列中. - Python 代码示例

📅  最后修改于: 2022-03-11 14:45:08.701000             🧑  作者: Mango

代码示例1
rdd = sc.parallelize([("a", 1), ("b", 1), ("a", 1)])
sorted(rdd.groupByKey().mapValues(len).collect())
# [('a', 2), ('b', 1)]
sorted(rdd.groupByKey().mapValues(list).collect())
# [('a', [1, 1]), ('b', [1])]