📜  处理 Pandas DataFrame 中的行和列

📅  最后修改于: 2022-05-13 01:54:38.172000             🧑  作者: Mango

处理 Pandas DataFrame 中的行和列

数据框是一种二维数据结构,即数据以表格的方式在行和列中对齐。我们可以对行/列执行基本操作,例如选择、删除、添加和重命名。在本文中,我们使用的是nba.csv文件。

处理列

为了处理列,我们对列执行基本操作,例如选择、删除、添加和重命名。

列选择:
为了在 Pandas DataFrame 中选择一列,我们可以通过列名调用它们来访问这些列。

# Import pandas package
import pandas as pd
  
# Define a dictionary containing employee data
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Age':[27, 24, 22, 32],
        'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
        'Qualification':['Msc', 'MA', 'MCA', 'Phd']}
  
# Convert the dictionary into DataFrame 
df = pd.DataFrame(data)
  
# select two columns
print(df[['Name', 'Qualification']])

输出:

有关更多示例,请参阅如何在 pandas 数据框中选择多个列列添加:
为了在 Pandas DataFrame 中添加列,我们可以将新列表声明为列并添加到现有 DataFrame 中。

# Import pandas package 
import pandas as pd
  
# Define a dictionary containing Students data
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Height': [5.1, 6.2, 5.1, 5.2],
        'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}
  
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
  
# Declare a list that is to be converted into a column
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']
  
# Using 'Address' as the column name
# and equating it to the list
df['Address'] = address
  
# Observe the result
print(df)

输出:

有关更多示例,请参阅在 Pandas 中向现有 DataFrame 添加新列列删除:
为了删除 Pandas DataFrame 中的列,我们可以使用drop()方法。通过删除具有列名的列来删除列。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
  
# display
print(data)

输出:
如输出图像所示,新输出没有传递的列。这些值被删除,因为轴设置为等于 1,并且由于 inplace 为 True,因此在原始数据框中进行了更改。删除列之前的数据框-
删除列后的数据框-

有关更多示例,请参阅使用 Pandas.drop() 从 DataFrame 中删除列

处理行:

为了处理行,我们可以对行执行基本的操作,例如选择、删除、添加和重命名。

行选择:
Pandas 提供了一种从数据框中检索行的独特方法。 DataFrame.loc[]方法用于从 Pandas DataFrame 中检索行。也可以通过将整数位置传递给 iloc[]函数来选择行。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
  
  
print(first, "\n\n\n", second)

输出:
如输出图像所示,由于两次都只有一个参数,因此返回了两个系列。

有关更多示例,请参阅 Pandas 使用 .loc[] 提取行行加法:
为了在 Pandas DataFrame 中添加一行,我们可以将旧数据框与新数据框连接起来。

# importing pandas module 
import pandas as pd 
    
# making data frame 
df = pd.read_csv("nba.csv", index_col ="Name") 
  
df.head(10)
  
new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
                        'Position':'PG', 'Age':33, 'Height':'6-2',
                        'Weight':189, 'College':'MIT', 'Salary':99999},
                                                            index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

输出:添加行之前的数据框-
添加行后的数据框-
有关更多示例,请参阅在 pandas DataFrame 顶部添加一行行删除:
为了删除 Pandas DataFrame 中的一行,我们可以使用 drop() 方法。通过按索引标签删除行来删除行。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
                            "R.J. Hunter"], inplace = True)
  
# display
data

输出:
如输出图像所示,新输出没有传递的值。由于 inplace 为 True,因此删除了这些值并在原始数据框中进行了更改。删除值之前的数据帧-
删除值后的数据帧-

有关更多示例,请参阅使用 Pandas.drop() 从 DataFrame 中删除行与列相关的问题:

  • 如何在 Pandas 数据框中获取列名
  • 如何重命名 Pandas DataFrame 中的列
  • 如何在 Pandas Dataframe 中删除一列或多列
  • 从 Pandas DataFrame 中的列中获取唯一值
  • 如何在 Pandas 数据框中小写列名
  • 将大写应用于 Pandas 数据框中的列
  • 大写熊猫数据框中列的第一个字母
  • 从 Pandas DataFrame 中的特定列获取 n 最大值
  • 从 Pandas DataFrame 中的特定列获取 n 最小值
  • 在 Pandas 中将列转换为行名/索引

与行相关的问题:

  • 将函数应用于 Pandas DataFrame 中的每一行
  • 如何在 Pandas 数据框中获取行名