📅  最后修改于: 2023-12-03 15:38:47.107000             🧑  作者: Mango
在某些情况下,我们需要打印表格中的重复行以便于数据分析。本篇文章将介绍如何通过编写Python代码打印表格中的重复行。
pandas
模块import pandas as pd
我们可以定义一个包含数据的表格,这里用一个包含重复行的表格作为示例:
data = {'Name': ['John', 'Sam', 'John', 'Mary', 'Sam'], 'Age': [28, 32, 28, 21, 34], 'City': ['New York', 'Chicago', 'San Francisco', 'Los Angeles', 'Seattle']}
df = pd.DataFrame(data)
print(df)
表格的输出如下:
Name Age City
0 John 28 New York
1 Sam 32 Chicago
2 John 28 San Francisco
3 Mary 21 Los Angeles
4 Sam 34 Seattle
为了打印表格中的重复行,我们需要使用duplicated
函数。该函数会返回一个布尔型的序列,用于判断每一行是否为重复行。我们可以将该序列作为过滤器用于过滤出重复行,然后打印出来。
duplicated_rows = df[df.duplicated()]
print(duplicated_rows)
输出结果如下:
Name Age City
2 John 28 San Francisco
4 Sam 34 Seattle
通过上述操作,我们成功地打印出了表格中的重复行。这样的操作不仅使数据分析更加高效,还可以帮助我们找出数据中潜在的问题,提供更好的业务参考。
# 如何打印表格中的重复行?
在某些情况下,我们需要打印表格中的重复行以便于数据分析。本篇文章将介绍如何通过编写Python代码打印表格中的重复行。
## 步骤
1. 导入`pandas`模块
```python
import pandas as pd
```
2. 定义表格
我们可以定义一个包含数据的表格,这里用一个包含重复行的表格作为示例:
```python
data = {'Name': ['John', 'Sam', 'John', 'Mary', 'Sam'], 'Age': [28, 32, 28, 21, 34], 'City': ['New York', 'Chicago', 'San Francisco', 'Los Angeles', 'Seattle']}
df = pd.DataFrame(data)
print(df)
```
表格的输出如下:
```
Name Age City
0 John 28 New York
1 Sam 32 Chicago
2 John 28 San Francisco
3 Mary 21 Los Angeles
4 Sam 34 Seattle
```
3. 打印重复行
为了打印表格中的重复行,我们需要使用`duplicated`函数。该函数会返回一个布尔型的序列,用于判断每一行是否为重复行。我们可以将该序列作为过滤器用于过滤出重复行,然后打印出来。
```python
duplicated_rows = df[df.duplicated()]
print(duplicated_rows)
```
输出结果如下:
```
Name Age City
2 John 28 San Francisco
4 Sam 34 Seattle
```
## 结论
通过上述操作,我们成功地打印出了表格中的重复行。这样的操作不仅使数据分析更加高效,还可以帮助我们找出数据中潜在的问题,提供更好的业务参考。
```python
import pandas as pd
data = {'Name': ['John', 'Sam', 'John', 'Mary', 'Sam'], 'Age': [28, 32, 28, 21, 34], 'City': ['New York', 'Chicago', 'San Francisco', 'Los Angeles', 'Seattle']}
df = pd.DataFrame(data)
print(df)
duplicated_rows = df[df.duplicated()]
print(duplicated_rows)
```