📅  最后修改于: 2020-10-29 03:02:18             🧑  作者: Mango
在Pandas中,DataFrame有多种有用的数据操作,如下所示:
行和列选择
我们可以通过传递行和列的名称来选择DataFrame的任何行和列。当您从DataFrame中选择它时,它将变为一维并被视为Series。
筛选资料
我们可以通过在DataFrame中提供一些布尔表达式来过滤数据。
注意:如果我们要将布尔结果传递给DataFrame,则它将显示所有结果。
空值
当没有数据提供给项目时,可能会出现Null值。各个列可能不包含通常表示为NaN的值。在Pandas 中,有几个有用的功能可用于检测,删除和替换数据框中的空值。这些功能如下:
isnull():isnull()的主要任务是在任何行具有空值的情况下返回真值。
notnull():与isull()函数相反,它返回非空值的真值。
dropna():此方法分析并删除空值的行/列。
fillna():它允许用户将NaN值替换为其他一些值。
replace():这是一个非常丰富的函数,用于替换字符串,正则表达式,系列,字典等。
interpolate():这是一个非常强大的函数,可填充DataFrame或系列中的空值。
字符串运算
Pandas 提供了一组字符串函数,可对字符串数据进行操作,并忽略丢失/ NaN值。使用.str可以执行不同的字符串操作。选项。这些功能如下:
lower():它将系列或索引的任何字符串转换为小写字母。
upper():它将系列或索引的任何字符串转换为大写字母。
strip():此函数有助于从Series / index中的每个字符串中剥离包含新行的空格。
split(”):这是一个使用给定模式分割字符串的函数。
cat(sep =”):使用给定的分隔符连接系列/索引元素。
contains(pattern):如果元素中存在子字符串,则返回True,否则返回False。
replace(a,b):将值a替换为值b。
repeat(value):将每个元素重复指定的次数。
count(pattern):它返回每个元素中图案外观的计数。
startswith(pattern):如果系列中的所有元素均以模式开头,则返回True。
endswith(pattern):如果系列中的所有元素都以模式结尾,则返回True。
find(pattern):用于返回模式的第一个匹配项。
findall(pattern):返回所有出现的模式的列表。
swapcase:用于交换大小写的大小写。
islower():如果“系列/索引”字符串中的所有字符均为小写,则返回True。否则,它返回False。
isupper():如果“系列/索引”字符串中的所有字符均为大写,则返回True。否则,它返回False。
isnumeric():如果“系列/索引”字符串中的所有字符均为数字,则返回True。否则,它返回False。
计数值
此操作用于使用’value_counts()’选项对出现的总数进行计数。
情节
Pandas 使用matplotlib库绘制图形。 .plot()方法允许您绘制数据图。
.plot()函数针对每一列绘制索引。
您也可以将参数传递给plot()函数以绘制特定的列。