📜  Apache Spark计数功能

📅  最后修改于: 2020-12-27 02:41:59             🧑  作者: Mango

火花计数功能

在Spark中,Count函数返回数据集中存在的元素数。

计数函数示例

在此示例中,我们计算数据集中存在的元素数。

  • 使用并行化集合创建RDD。
scala> val data = sc.parallelize(List(1,2,3,4,5))
  • 现在,我们可以使用以下命令读取生成的结果。
scala> data.collect

  • 应用count()函数对元素数量进行计数。
scala> val countfunc = data.count()

在这里,我们得到了期望的输出。