如何从 Pandas DataFrame 创建直方图?
直方图是显示度量变量间隔中值的频率的图形。这些间隔被称为“箱”,它们的宽度都相同。
我们可以使用 df.hist()函数从 panda 的数据帧创建直方图。
语法:
DataFrame.hist(column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, backend=None, legend=False, **kwargs)
示例 1:创建基本直方图(各个列的直方图)
我们使用 df.hist() 和 plot.show() 来显示直方图。
使用的 CSV 文件: gene_expression.csv
Python3
# import libraries and packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# reading the CSV file
df = pd.read_csv('gene_expression.csv')
# displaying the DataFrame
print(df)
# creating a basic histogram
df.hist()
plt.show()
Python3
# import libraries and packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# reading the CSV file
df = pd.read_csv('gene_expression.csv')
# displaying the DataFrame
print(df)
# creating a basic histogram
df.hist(by='Cancer Present', figsize=[12, 8], bins=15)
plt.show()
输出:
示例 2:创建修改后的直方图(按组绘制直方图)
在这个例子中,我们向 hist 方法添加了额外的参数。我们更改了无花果的大小,将箱数指定为 15,并给出了参数,以确保创建每个癌症组的直方图。
Python3
# import libraries and packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# reading the CSV file
df = pd.read_csv('gene_expression.csv')
# displaying the DataFrame
print(df)
# creating a basic histogram
df.hist(by='Cancer Present', figsize=[12, 8], bins=15)
plt.show()
输出: