📅  最后修改于: 2023-12-03 15:09:06.410000             🧑  作者: Mango
在 AWS 胶水作业中,我们可以使用 Python 代码来读取 S3 存储桶中的 JSON 文件。下面是一个示例代码:
import json
import boto3
# 创建 S3 客户端
s3 = boto3.client('s3')
# 指定要读取的 JSON 文件的 S3 存储桶和键
bucket = 'my-bucket'
key = 'path/to/my-file.json'
# 从 S3 存储桶中下载 JSON 文件
response = s3.get_object(Bucket=bucket, Key=key)
# 读取 JSON 文件的内容
content = response['Body'].read().decode('utf-8')
# 将 JSON 文件的内容解析为 Python 对象
data = json.loads(content)
# 打印 Python 对象
print(data)
在这个示例代码中,我们首先创建了一个 S3 客户端,然后指定了要读取的 JSON 文件的 S3 存储桶和键。接着,我们使用 boto3
库中的 get_object
方法从 S3 存储桶中下载了该文件,并使用 json
库中的 loads
方法将其内容解析为 Python 对象。最后,我们输出了 Python 对象的内容。
使用这个示例代码,你可以将 S3 存储桶中的任意 JSON 文件读取到 AWS 胶水作业中,并对其进行处理。如果需要,你还可以根据具体的业务需求来对代码进行定制化。