क्या पायथन स्क्रिप्ट से POST का उपयोग करके एक फ़ाइल भेजने का एक तरीका है?
क्या पायथन स्क्रिप्ट से POST का उपयोग करके एक फ़ाइल भेजने का एक तरीका है?
जवाबों:
प्रेषक: https://requests.readthedocs.io/en/latest/user/quickstart/#post-a-multipart-encoded-file
अनुरोधों को मल्टीपार्ट-एन्कोडेड फ़ाइलों को अपलोड करना बहुत आसान है:
with open('report.xls', 'rb') as f:
r = requests.post('http://httpbin.org/post', files={'report.xls': f})
बस। मैं मजाक नहीं कर रहा हूं - यह कोड की एक पंक्ति है। फाइल भेज दी गई। चलो देखते है:
>>> r.text
{
"origin": "179.13.100.4",
"files": {
"report.xls": "<censored...binary...data>"
},
"form": {},
"url": "http://httpbin.org/post",
"args": {},
"headers": {
"Content-Length": "3196",
"Accept-Encoding": "identity, deflate, compress, gzip",
"Accept": "*/*",
"User-Agent": "python-requests/0.8.0",
"Host": "httpbin.org:80",
"Content-Type": "multipart/form-data; boundary=127.0.0.1.502.21746.1321131593.786.1"
},
"data": ""
}
with open('report.xls', 'rb') as f: r = requests.post('http://httpbin.org/post', files={'report.xls': f})
इसके बजाय करना चाहते हैं , इसलिए यह फ़ाइल को खोलने के बाद फिर से बंद कर देता है।
हाँ। आप urllib2
मॉड्यूल का उपयोग करेंगे , और multipart/form-data
सामग्री प्रकार का उपयोग कर सांकेतिक शब्दों में बदलना । आपको शुरू करने के लिए कुछ नमूना कोड यहां दिए गए हैं - यह केवल फ़ाइल अपलोड करने से थोड़ा अधिक है, लेकिन आपको इसके माध्यम से पढ़ने और यह देखने में सक्षम होना चाहिए कि यह कैसे काम करता है:
user_agent = "image uploader"
default_message = "Image $current of $total"
import logging
import os
from os.path import abspath, isabs, isdir, isfile, join
import random
import string
import sys
import mimetypes
import urllib2
import httplib
import time
import re
def random_string (length):
return ''.join (random.choice (string.letters) for ii in range (length + 1))
def encode_multipart_data (data, files):
boundary = random_string (30)
def get_content_type (filename):
return mimetypes.guess_type (filename)[0] or 'application/octet-stream'
def encode_field (field_name):
return ('--' + boundary,
'Content-Disposition: form-data; name="%s"' % field_name,
'', str (data [field_name]))
def encode_file (field_name):
filename = files [field_name]
return ('--' + boundary,
'Content-Disposition: form-data; name="%s"; filename="%s"' % (field_name, filename),
'Content-Type: %s' % get_content_type(filename),
'', open (filename, 'rb').read ())
lines = []
for name in data:
lines.extend (encode_field (name))
for name in files:
lines.extend (encode_file (name))
lines.extend (('--%s--' % boundary, ''))
body = '\r\n'.join (lines)
headers = {'content-type': 'multipart/form-data; boundary=' + boundary,
'content-length': str (len (body))}
return body, headers
def send_post (url, data, files):
req = urllib2.Request (url)
connection = httplib.HTTPConnection (req.get_host ())
connection.request ('POST', req.get_selector (),
*encode_multipart_data (data, files))
response = connection.getresponse ()
logging.debug ('response = %s', response.read ())
logging.debug ('Code: %s %s', response.status, response.reason)
def make_upload_file (server, thread, delay = 15, message = None,
username = None, email = None, password = None):
delay = max (int (delay or '0'), 15)
def upload_file (path, current, total):
assert isabs (path)
assert isfile (path)
logging.debug ('Uploading %r to %r', path, server)
message_template = string.Template (message or default_message)
data = {'MAX_FILE_SIZE': '3145728',
'sub': '',
'mode': 'regist',
'com': message_template.safe_substitute (current = current, total = total),
'resto': thread,
'name': username or '',
'email': email or '',
'pwd': password or random_string (20),}
files = {'upfile': path}
send_post (server, data, files)
logging.info ('Uploaded %r', path)
rand_delay = random.randint (delay, delay + 5)
logging.debug ('Sleeping for %.2f seconds------------------------------\n\n', rand_delay)
time.sleep (rand_delay)
return upload_file
def upload_directory (path, upload_file):
assert isabs (path)
assert isdir (path)
matching_filenames = []
file_matcher = re.compile (r'\.(?:jpe?g|gif|png)$', re.IGNORECASE)
for dirpath, dirnames, filenames in os.walk (path):
for name in filenames:
file_path = join (dirpath, name)
logging.debug ('Testing file_path %r', file_path)
if file_matcher.search (file_path):
matching_filenames.append (file_path)
else:
logging.info ('Ignoring non-image file %r', path)
total_count = len (matching_filenames)
for index, file_path in enumerate (matching_filenames):
upload_file (file_path, index + 1, total_count)
def run_upload (options, paths):
upload_file = make_upload_file (**options)
for arg in paths:
path = abspath (arg)
if isdir (path):
upload_directory (path, upload_file)
elif isfile (path):
upload_file (path)
else:
logging.error ('No such path: %r' % path)
logging.info ('Done!')
फ़ाइल ऑब्जेक्ट पर सीधे urlopen का उपयोग करने से रोकने वाली एकमात्र तथ्य यह है कि अंतर्निहित फ़ाइल ऑब्जेक्ट में एक लेन परिभाषा का अभाव है । एक सरल तरीका एक उपवर्ग बनाना है, जो सही फ़ाइल के साथ urlopen प्रदान करता है। मैंने नीचे फ़ाइल में कंटेंट-टाइप हेडर को भी संशोधित किया है।
import os
import urllib2
class EnhancedFile(file):
def __init__(self, *args, **keyws):
file.__init__(self, *args, **keyws)
def __len__(self):
return int(os.fstat(self.fileno())[6])
theFile = EnhancedFile('a.xml', 'r')
theUrl = "http://example.com/abcde"
theHeaders= {'Content-Type': 'text/xml'}
theRequest = urllib2.Request(theUrl, theFile, theHeaders)
response = urllib2.urlopen(theRequest)
theFile.close()
for line in response:
print line
अजगर अनुरोधों की तरह लगता है कि बहुत बड़ी बहु-भाग फ़ाइलों को संभालता नहीं है।
प्रलेखन आपको देखने की सलाह देता है requests-toolbelt
।
यहाँ उनके दस्तावेज से प्रासंगिक पृष्ठ है।
क्रिस एटली का पोस्टर लाइब्रेरी वास्तव में इसके लिए अच्छी तरह से काम करता है (विशेषकर सुविधा समारोह poster.encode.multipart_encode()
)। एक बोनस के रूप में, यह पूरी फाइल को मेमोरी में लोड किए बिना बड़ी फ़ाइलों की स्ट्रीमिंग का समर्थन करता है। पायथन समस्या 3244 भी देखें ।
मैं django बाकी एपीआई और मेरे लिए काम कर रहा हूं:
def test_upload_file(self):
filename = "/Users/Ranvijay/tests/test_price_matrix.csv"
data = {'file': open(filename, 'rb')}
client = APIClient()
# client.credentials(HTTP_AUTHORIZATION='Token ' + token.key)
response = client.post(reverse('price-matrix-csv'), data, format='multipart')
print response
self.assertEqual(response.status_code, status.HTTP_200_OK)
close()
एक फ़ाइल के लिए भूल गए ।
आप उदाहरणों के साथ , plpl2 पर एक नज़र रखना चाहते हैं । मुझे लगता है कि बिल्ट-इन HTTP मॉड्यूल का उपयोग करने की तुलना में CANplib2 का उपयोग अधिक संक्षिप्त है।
requests
इसके बजाय सिफारिश करूंगा ।
def visit_v2(device_code, camera_code):
image1 = MultipartParam.from_file("files", "/home/yuzx/1.txt")
image2 = MultipartParam.from_file("files", "/home/yuzx/2.txt")
datagen, headers = multipart_encode([('device_code', device_code), ('position', 3), ('person_data', person_data), image1, image2])
print "".join(datagen)
if server_port == 80:
port_str = ""
else:
port_str = ":%s" % (server_port,)
url_str = "http://" + server_ip + port_str + "/adopen/device/visit_v2"
headers['nothing'] = 'nothing'
request = urllib2.Request(url_str, datagen, headers)
try:
response = urllib2.urlopen(request)
resp = response.read()
print "http_status =", response.code
result = json.loads(resp)
print resp
return result
except urllib2.HTTPError, e:
print "http_status =", e.code
print e.read()