मेरा s3 keys
उपयोगिता फ़ंक्शन अनिवार्य रूप से @ Hephaestus के उत्तर का अनुकूलित संस्करण है:
import boto3
s3_paginator = boto3.client('s3').get_paginator('list_objects_v2')
def keys(bucket_name, prefix='/', delimiter='/', start_after=''):
prefix = prefix[1:] if prefix.startswith(delimiter) else prefix
start_after = (start_after or prefix) if prefix.endswith(delimiter) else start_after
for page in s3_paginator.paginate(Bucket=bucket_name, Prefix=prefix, StartAfter=start_after):
for content in page.get('Contents', ()):
yield content['Key']
मेरे परीक्षणों में (बोटो 3 1.9.84), यह समकक्ष (लेकिन सरल) कोड की तुलना में काफी तेज है:
import boto3
def keys(bucket_name, prefix='/', delimiter='/'):
prefix = prefix[1:] if prefix.startswith(delimiter) else prefix
bucket = boto3.resource('s3').Bucket(bucket_name)
return (_.key for _ in bucket.objects.filter(Prefix=prefix))
जैसा कि S3 UTF-8 बाइनरी सॉर्ट किए गए परिणामों की गारंटी देता है , start_after
पहले फ़ंक्शन में एक अनुकूलन जोड़ा गया है।