使用字符串数据在 Pandas 中构造 DataFrame
正如我们所知,数据有各种形状和大小。它们通常来自具有不同格式的各种不同来源。对于有抱负的数据科学家来说,了解数据的方式非常重要,即加载和存储以各种格式存在的数据。
我们有一些字符串格式的数据,讨论将这些数据加载到 pandas 数据框中的方法。
解决方案 #1:实现此目的的一种方法是使用StringIO()
函数。它将充当包装器,并有助于使用pd.read_csv()
函数读取数据。
# importing pandas as pd
import pandas as pd
# import the StrinIO function
# from io module
from io import StringIO
# wrap the string data in StringIO function
StringData = StringIO("""Date;Event;Cost
10/2/2011;Music;10000
11/2/2011;Poetry;12000
12/2/2011;Theatre;5000
13/2/2011;Comedy;8000
""")
# let's read the data using the Pandas
# read_csv() function
df = pd.read_csv(StringData, sep =";")
# Print the dataframe
print(df)
输出 :
正如我们在输出中看到的那样,我们已经成功地将字符串格式的给定数据读入了 Pandas DataFrame。解决方案 2:另一个绝妙的方法是使用 pandas pd.read_clipboard()
函数。
# importing pandas as pd
import pandas as pd
# This is our string data
StringData ="""Date;Event;Cost
10/2/2011;Music;10000
11/2/2011;Poetry;12000
12/2/2011;Theatre;5000
13/2/2011;Comedy;8000
"""
# Now we copy the data to our clipboard.
输出 :
这是我们将数据复制到剪贴板后的样子。
现在我们将使用 pandas pd.read_clipboard()
函数将数据读入 DataFrame
# Read data
df = pd.read_clipboard(sep = ';')
# Print the DataFrame
print(df)
输出 :