📅  最后修改于: 2023-12-03 15:34:11.236000             🧑  作者: Mango
ndjson
是 newline delimited JSON
的简称,即每行为一个 JSON
对象的字符串。在处理大数据集时,常用 ndjson
格式进行数据的存储和传输。本文将介绍如何使用 Python 导入 ndjson
数据。
我们可以使用 pandas
库的 read_json()
函数来方便地导入 ndjson
数据。示例代码如下:
import pandas as pd
df = pd.read_json('data.ndjson', lines=True)
上述代码中,read_json()
函数的第一个参数为 ndjson
文件路径,第二个参数 lines
设置为 True
表示每行为一个 JSON
对象,需要分行读入。
我们来看一个简单的示例。假设我们有如下的 ndjson
文件:
{"name": "Alice", "age": 20}
{"name": "Bob", "age": 25}
{"name": "Charlie", "age": 30}
我们可以使用以下代码将其导入为 pandas.DataFrame
:
import pandas as pd
df = pd.read_json('example.ndjson', lines=True)
print(df)
输出如下:
name age
0 Alice 20
1 Bob 25
2 Charlie 30
本文介绍了如何使用 Python 导入 ndjson
数据。使用 Pandas 的 read_json()
函数即可轻松实现。