📜  python 导入 ndjson 数据 - Python (1)

📅  最后修改于: 2023-12-03 15:34:11.236000             🧑  作者: Mango

Python导入ndjson数据

简介

ndjsonnewline delimited JSON 的简称,即每行为一个 JSON 对象的字符串。在处理大数据集时,常用 ndjson 格式进行数据的存储和传输。本文将介绍如何使用 Python 导入 ndjson 数据。

导入ndjson

我们可以使用 pandas 库的 read_json() 函数来方便地导入 ndjson 数据。示例代码如下:

import pandas as pd

df = pd.read_json('data.ndjson', lines=True)

上述代码中,read_json() 函数的第一个参数为 ndjson 文件路径,第二个参数 lines 设置为 True 表示每行为一个 JSON 对象,需要分行读入。

示例

我们来看一个简单的示例。假设我们有如下的 ndjson 文件:

{"name": "Alice", "age": 20}
{"name": "Bob", "age": 25}
{"name": "Charlie", "age": 30}

我们可以使用以下代码将其导入为 pandas.DataFrame

import pandas as pd

df = pd.read_json('example.ndjson', lines=True)

print(df)

输出如下:

       name  age
0     Alice   20
1       Bob   25
2  Charlie   30
总结

本文介绍了如何使用 Python 导入 ndjson 数据。使用 Pandas 的 read_json() 函数即可轻松实现。