pyspark 用户定义函数多输入 - 任何代码示例

📌 相关文章

用户在 c 中定义函数 - 任何代码示例
用户在 c 中定义函数 (1)
用户定义函数 sql 代码示例
Python用户定义函数
Python用户定义函数(1)
用户定义函数 sql (1)
C++ 用户输入 - C++ 代码示例
用户输入 c++ 代码示例
js 中的用户输入 - 任何代码示例
C++中用户定义函数的类型(1)
C++中用户定义函数的类型
输入与函数 - 任何代码示例
Java中的用户定义包
Java中的用户定义包(1)
c 定义 - 任何代码示例
本机定义 - 任何代码示例
PostgreSQL – 用户定义函数
PostgreSQL – 用户定义函数(1)
用户定义 - C 编程语言代码示例
C++ 用户输入 - C++ (1)
用户输入 c++ (1)
VBA-用户定义函数
VBA-用户定义函数(1)
MATLAB中的用户定义函数(1)
MATLAB中的用户定义函数
输入文件定义类型 - 任何代码示例
pyspark 中的类型 - 任何代码示例
选择 n 行 pyspark - 任何代码示例
pyspark 选择列 - 任何代码示例

📜 pyspark 用户定义函数多输入 - 任何代码示例

📅 最后修改于: 2022-03-11 15:00:26.048000 🧑 作者: Mango

代码示例1

>>> from pyspark.sql.types import IntegerType
>>> from pyspark.sql.functions import udf, array
>>> sum_cols = udf(lambda arr: sum(arr), IntegerType())
>>> spark.createDataFrame([(101, 1, 16)], ['ID', 'A', 'B']) \
...     .withColumn('Result', sum_cols(array('A', 'B'))).show()
+---+---+---+------+
| ID|  A|  B|Result|
+---+---+---+------+
|101|  1| 16|    17|
+---+---+---+------+

>>> spark.createDataFrame([(101, 1, 16, 8)], ['ID', 'A', 'B', 'C'])\
...     .withColumn('Result', sum_cols(array('A', 'B', 'C'))).show()
+---+---+---+---+------+
| ID|  A|  B|  C|Result|
+---+---+---+---+------+
|101|  1| 16|  8|    25|
+---+---+---+---+------+