📜  讨论PySpark

📅  最后修改于: 2020-11-06 05:18:37             🧑  作者: Mango


Apache Spark用Scala编程语言编写。为了支持带有Spark的Python ,Apache Spark社区发布了一个工具PySpark。使用PySpark,您还可以使用Python编程语言来处理RDD。正是由于有了一个名为Py4j的库,他们才能够实现这一目标。这是一个入门教程,涵盖了数据驱动文档的基础知识,并说明了如何处理其各种组件和子组件。