📅  最后修改于: 2023-12-03 14:51:49.081000             🧑  作者: Mango
在 PySpark 中,要以表格格式显示 DataFrame 数据,可以使用一些方法和库来实现。下面将介绍几种常用的方法和工具来显示 DataFrame 数据。
import pandas as pd
pdf = dataframe.toPandas()
markdown_table = pd.DataFrame.to_markdown(pdf)
这样就可以得到一个 Markdown 格式的表格字符串 markdown_table
。
pip install prettytable
from prettytable import PrettyTable
table = PrettyTable(dataframe.columns)
for row in dataframe.collect():
table.add_row(row)
markdown_table = table.get_string()
pip install tabulate
tabulate()
函数将 DataFrame 数据转换为表格。from tabulate import tabulate
table = tabulate(dataframe.collect(), headers=dataframe.columns, tablefmt='pipe')
这样就可以得到一个 Markdown 格式的表格字符串 table
,其中的 tablefmt='pipe'
表示使用 Markdown 的表格格式。
以上是几种常用的方法来以表格格式显示 PySpark DataFrame 数据的介绍。你可以根据自己的需求选择适合的方法来显示 DataFrame 数据。