Boto3 - 在S3中以递归方式将文件从一个文件夹复制到另一个文件夹

时间:2017-12-06 12:31:27

标签: python amazon-web-services boto3

我的S3存储桶中有太多文件采用不同的文件格式。所以我想从所有具有 .JSON 扩展名的子文件夹复制到另一个文件夹。

当前结构:

S3://mybucket/f1/file.JPG

S3://mybucket/f1/newfile.JSON

S3://mybucket/f2/Oldfile.JSON

应将(JSON FILES)复制到文件夹Arrange:

S3://mybucket/arrange/newfile.JSON
S3://mybucket/arrange/Oldfile.JSON

我试过了(但是没有JSON过滤器)From stackoverflow

import os
import boto3
old_bucket_name = 'SRC'
old_prefix = 'A/B/C/'
new_bucket_name = 'TGT'
new_prefix = 'L/M/N/'
s3 = boto3.resource('s3')
old_bucket = s3.Bucket(old_bucket_name )
new_bucket = s3.Bucket(new_bucket_name )

for obj in old_bucket.objects.filter(Prefix=old_prefix):
    old_source = { 'Bucket': old_bucket_name,
                   'Key': obj.key}
    # replace the prefix
    new_key = obj.key.replace(old_prefix, new_prefix)
    new_obj = new_bucket.Object(new_key)
    new_obj.copy(old_source)

1 个答案:

答案 0 :(得分:0)

您可以为JSON文件保留一个过滤器,如下所示:

for obj in old_bucket.objects.filter(Prefix=old_prefix):
    if obj.key.endswith('.JSON'):
        old_source = { 'Bucket': old_bucket_name,
                   'Key': obj.key}
        # replace the prefix
        new_key = obj.key.replace(old_prefix, new_prefix)
        new_obj = new_bucket.Object(new_key)
        new_obj.copy(old_source)