📅  最后修改于: 2023-12-03 15:39:38.496000             🧑  作者: Mango
数据框(Data Frame)是 Python 中一种非常常用的数据结构,它类似于 Excel 中的表格,可以理解为是由多个 Series 拼接而成的二维数据结构。数据框可以用于数据清洗、数据分析等方面。本文将介绍如何在 Python 中创建数据框。
Python 中创建数据框最简单的方法是使用 pandas 库中的 DataFrame 函数。DataFrame 函数可以接受 Series 对象、二维数组、字典、元组等多种数据结构作为输入,返回一个数据框。下面分别介绍几种常见的方法:
import pandas as pd
# 从字典创建数据框
data = {'name': ['Amy', 'Bob', 'Cathy', 'David'], 'age': [18, 20, 19, 21], 'gender': ['F', 'M', 'F', 'M']}
df = pd.DataFrame(data)
print(df)
输出:
name age gender
0 Amy 18 F
1 Bob 20 M
2 Cathy 19 F
3 David 21 M
import pandas as pd
import numpy as np
# 从二维数组创建数据框
data = np.array([['Amy', 18, 'F'], ['Bob', 20, 'M'], ['Cathy', 19, 'F'], ['David', 21, 'M']])
df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)
输出:
name age gender
0 Amy 18 F
1 Bob 20 M
2 Cathy 19 F
3 David 21 M
import pandas as pd
# 从 csv 文件读取数据创建数据框
df = pd.read_csv('data.csv')
print(df)
import pandas as pd
# 从字典创建数据框
data = {'name': ['Amy', 'Bob', 'Cathy', 'David'], 'age': [18, 20, 19, 21], 'gender': ['F', 'M', 'F', 'M']}
df = pd.DataFrame(data)
# 添加一列
df['id'] = [1, 2, 3, 4]
# 添加一行
df.loc[4] = ['Eva', 22, 'F', 5]
print(df)
输出:
name age gender id
0 Amy 18 F 1
1 Bob 20 M 2
2 Cathy 19 F 3
3 David 21 M 4
4 Eva 22 F 5
本文介绍了 Python 中如何创建数据框,包括从字典、二维数组、csv 文件读取、添加数据到现有数据框中等多种方法。Pandas 提供了丰富的操作数据框的函数和方法,可以满足各种数据处理、数据分析等需求。