पायथन स्क्रिप्ट से POST का उपयोग करके फ़ाइल भेजें


जवाबों:


214

प्रेषक: https://requests.readthedocs.io/en/latest/user/quickstart/#post-a-multipart-encoded-file

अनुरोधों को मल्टीपार्ट-एन्कोडेड फ़ाइलों को अपलोड करना बहुत आसान है:

with open('report.xls', 'rb') as f:
    r = requests.post('http://httpbin.org/post', files={'report.xls': f})

बस। मैं मजाक नहीं कर रहा हूं - यह कोड की एक पंक्ति है। फाइल भेज दी गई। चलो देखते है:

>>> r.text
{
  "origin": "179.13.100.4",
  "files": {
    "report.xls": "<censored...binary...data>"
  },
  "form": {},
  "url": "http://httpbin.org/post",
  "args": {},
  "headers": {
    "Content-Length": "3196",
    "Accept-Encoding": "identity, deflate, compress, gzip",
    "Accept": "*/*",
    "User-Agent": "python-requests/0.8.0",
    "Host": "httpbin.org:80",
    "Content-Type": "multipart/form-data; boundary=127.0.0.1.502.21746.1321131593.786.1"
  },
  "data": ""
}

2
अगर फ़ाइल का आकार ~ 1.5 MB से कम है, तो मैं एक ही चीज़ और उसके ठीक काम कर रहा हूँ। और इसके एक त्रुटि फेंक .. कृपया यहाँ देखो ।
निकस जैन

1
जो करने की कोशिश कर रहा है वह कुछ साइट पर लॉगिन का उपयोग करके अनुरोध कर रहा है जो मैंने सफलतापूर्वक किया है, लेकिन अब मैं लॉगिन करने के बाद एक वीडियो अपलोड करना चाहता हूं और सबमिट करने से पहले फॉर्म को एक अलग फ़ील्ड भरना होगा। तो मुझे उन मूल्यों जैसे वीडियो विवरण, वीडियो शीर्षक आदि को कैसे पारित करना चाहिए
तारगुरुंग

15
आप शायद with open('report.xls', 'rb') as f: r = requests.post('http://httpbin.org/post', files={'report.xls': f})इसके बजाय करना चाहते हैं , इसलिए यह फ़ाइल को खोलने के बाद फिर से बंद कर देता है।
हज़ुले

3
है ना? कब से अनुरोध भेजना इतना सरल है?
palsch

1
फ़ाइल को बंद करने के लिए संदर्भ प्रबंधक का उपयोग करने के Hjulle के सुझाव को शामिल करने के लिए इस उत्तर को अपडेट किया जाना चाहिए।
बेमोरन

28

हाँ। आप urllib2मॉड्यूल का उपयोग करेंगे , और multipart/form-dataसामग्री प्रकार का उपयोग कर सांकेतिक शब्दों में बदलना । आपको शुरू करने के लिए कुछ नमूना कोड यहां दिए गए हैं - यह केवल फ़ाइल अपलोड करने से थोड़ा अधिक है, लेकिन आपको इसके माध्यम से पढ़ने और यह देखने में सक्षम होना चाहिए कि यह कैसे काम करता है:

user_agent = "image uploader"
default_message = "Image $current of $total"

import logging
import os
from os.path import abspath, isabs, isdir, isfile, join
import random
import string
import sys
import mimetypes
import urllib2
import httplib
import time
import re

def random_string (length):
    return ''.join (random.choice (string.letters) for ii in range (length + 1))

def encode_multipart_data (data, files):
    boundary = random_string (30)

    def get_content_type (filename):
        return mimetypes.guess_type (filename)[0] or 'application/octet-stream'

    def encode_field (field_name):
        return ('--' + boundary,
                'Content-Disposition: form-data; name="%s"' % field_name,
                '', str (data [field_name]))

    def encode_file (field_name):
        filename = files [field_name]
        return ('--' + boundary,
                'Content-Disposition: form-data; name="%s"; filename="%s"' % (field_name, filename),
                'Content-Type: %s' % get_content_type(filename),
                '', open (filename, 'rb').read ())

    lines = []
    for name in data:
        lines.extend (encode_field (name))
    for name in files:
        lines.extend (encode_file (name))
    lines.extend (('--%s--' % boundary, ''))
    body = '\r\n'.join (lines)

    headers = {'content-type': 'multipart/form-data; boundary=' + boundary,
               'content-length': str (len (body))}

    return body, headers

def send_post (url, data, files):
    req = urllib2.Request (url)
    connection = httplib.HTTPConnection (req.get_host ())
    connection.request ('POST', req.get_selector (),
                        *encode_multipart_data (data, files))
    response = connection.getresponse ()
    logging.debug ('response = %s', response.read ())
    logging.debug ('Code: %s %s', response.status, response.reason)

def make_upload_file (server, thread, delay = 15, message = None,
                      username = None, email = None, password = None):

    delay = max (int (delay or '0'), 15)

    def upload_file (path, current, total):
        assert isabs (path)
        assert isfile (path)

        logging.debug ('Uploading %r to %r', path, server)
        message_template = string.Template (message or default_message)

        data = {'MAX_FILE_SIZE': '3145728',
                'sub': '',
                'mode': 'regist',
                'com': message_template.safe_substitute (current = current, total = total),
                'resto': thread,
                'name': username or '',
                'email': email or '',
                'pwd': password or random_string (20),}
        files = {'upfile': path}

        send_post (server, data, files)

        logging.info ('Uploaded %r', path)
        rand_delay = random.randint (delay, delay + 5)
        logging.debug ('Sleeping for %.2f seconds------------------------------\n\n', rand_delay)
        time.sleep (rand_delay)

    return upload_file

def upload_directory (path, upload_file):
    assert isabs (path)
    assert isdir (path)

    matching_filenames = []
    file_matcher = re.compile (r'\.(?:jpe?g|gif|png)$', re.IGNORECASE)

    for dirpath, dirnames, filenames in os.walk (path):
        for name in filenames:
            file_path = join (dirpath, name)
            logging.debug ('Testing file_path %r', file_path)
            if file_matcher.search (file_path):
                matching_filenames.append (file_path)
            else:
                logging.info ('Ignoring non-image file %r', path)

    total_count = len (matching_filenames)
    for index, file_path in enumerate (matching_filenames):
        upload_file (file_path, index + 1, total_count)

def run_upload (options, paths):
    upload_file = make_upload_file (**options)

    for arg in paths:
        path = abspath (arg)
        if isdir (path):
            upload_directory (path, upload_file)
        elif isfile (path):
            upload_file (path)
        else:
            logging.error ('No such path: %r' % path)

    logging.info ('Done!')

1
अजगर 2.6.6 पर मुझे विंडोज पर इस कोड का उपयोग करते समय मल्टीपार्ट की सीमा पार्सिंग में एक त्रुटि मिल रही थी। मुझे इसके लिए string.letters से string.ascii_letters में बदलना था क्योंकि इस पर काम करने के लिए stackoverflow.com/questions/2823316/… पर चर्चा की गई थी । सीमा पर आवश्यकता पर यहां चर्चा की गई है: stackoverflow.com/questions/147451/…
amit

कॉल रन_अपलोड ({'सर्वर': '', 'थ्रेड': ''}, पथ = ['/ पथ / से / फ़ाइल। txt']) इस लाइन में त्रुटि का कारण बनता है: अपलोड_फाइल (पथ) क्योंकि "अपलोड फ़ाइल" की आवश्यकता होती है 3 मापदंडों तो मैं इसे इस लाइन upload_file (पथ, 1, 1) के साथ बदल देता हूं
रेडियन

4

फ़ाइल ऑब्जेक्ट पर सीधे urlopen का उपयोग करने से रोकने वाली एकमात्र तथ्य यह है कि अंतर्निहित फ़ाइल ऑब्जेक्ट में एक लेन परिभाषा का अभाव है । एक सरल तरीका एक उपवर्ग बनाना है, जो सही फ़ाइल के साथ urlopen प्रदान करता है। मैंने नीचे फ़ाइल में कंटेंट-टाइप हेडर को भी संशोधित किया है।

import os
import urllib2
class EnhancedFile(file):
    def __init__(self, *args, **keyws):
        file.__init__(self, *args, **keyws)

    def __len__(self):
        return int(os.fstat(self.fileno())[6])

theFile = EnhancedFile('a.xml', 'r')
theUrl = "http://example.com/abcde"
theHeaders= {'Content-Type': 'text/xml'}

theRequest = urllib2.Request(theUrl, theFile, theHeaders)

response = urllib2.urlopen(theRequest)

theFile.close()


for line in response:
    print line

@robert मैं Python2.7 में आपके कोड का परीक्षण करता हूं, लेकिन यह काम नहीं करता है। urlopen (अनुरोध (theUrl, theFile, ...) केवल फ़ाइल की सामग्री को एक सामान्य पोस्ट के रूप में एन्कोड करता है, लेकिन सही फ़ॉर्म फ़ील्ड निर्दिष्ट नहीं कर सकता है। मैं वेरिएंट urlopen (theUrl, urlencode ({'serveride_field_name': EnhancedFile ('my_file.txt'))) भी आज़माता हूं, यह एक फ़ाइल अपलोड करता है लेकिन (निश्चित रूप से) गलत सामग्री के साथ <खुली फ़ाइल 'my_file.txt'; मोड 'आर' 0x00D6B718> पर। क्या मैं कुछ भुल गया?
रायलू

जवाब के लिए धन्यवाद । उपरोक्त कोड का उपयोग करके मैंने वेबसर्वर में PUT अनुरोध का उपयोग करके 2.2 जीबी कच्ची छवि फ़ाइल स्थानांतरित की थी।
अक्षय पाटिल

4

अजगर अनुरोधों की तरह लगता है कि बहुत बड़ी बहु-भाग फ़ाइलों को संभालता नहीं है।

प्रलेखन आपको देखने की सलाह देता है requests-toolbelt

यहाँ उनके दस्तावेज से प्रासंगिक पृष्ठ है।


2

क्रिस एटली का पोस्टर लाइब्रेरी वास्तव में इसके लिए अच्छी तरह से काम करता है (विशेषकर सुविधा समारोह poster.encode.multipart_encode())। एक बोनस के रूप में, यह पूरी फाइल को मेमोरी में लोड किए बिना बड़ी फ़ाइलों की स्ट्रीमिंग का समर्थन करता है। पायथन समस्या 3244 भी देखें ।


2

मैं django बाकी एपीआई और मेरे लिए काम कर रहा हूं:

def test_upload_file(self):
        filename = "/Users/Ranvijay/tests/test_price_matrix.csv"
        data = {'file': open(filename, 'rb')}
        client = APIClient()
        # client.credentials(HTTP_AUTHORIZATION='Token ' + token.key)
        response = client.post(reverse('price-matrix-csv'), data, format='multipart')

        print response
        self.assertEqual(response.status_code, status.HTTP_200_OK)

1
यह कोड एक मेमोरी लीक को प्रदान करता है - आप close()एक फ़ाइल के लिए भूल गए ।
मुख्यमंत्री

0

आप उदाहरणों के साथ , plpl2 पर एक नज़र रखना चाहते हैं । मुझे लगता है कि बिल्ट-इन HTTP मॉड्यूल का उपयोग करने की तुलना में CANplib2 का उपयोग अधिक संक्षिप्त है।


2
ऐसे कोई उदाहरण नहीं हैं जो बताते हैं कि फ़ाइल अपलोड से कैसे निपटना है।
dland

लिंक पुराना है + कोई इनलाइन उदाहरण नहीं है।
jlr

3
तब से यह github.com/httplib2/httplib2 पर चला गया है । दूसरी ओर, आजकल मैं शायद requestsइसके बजाय सिफारिश करूंगा ।
pdc

0
def visit_v2(device_code, camera_code):
    image1 = MultipartParam.from_file("files", "/home/yuzx/1.txt")
    image2 = MultipartParam.from_file("files", "/home/yuzx/2.txt")
    datagen, headers = multipart_encode([('device_code', device_code), ('position', 3), ('person_data', person_data), image1, image2])
    print "".join(datagen)
    if server_port == 80:
        port_str = ""
    else:
        port_str = ":%s" % (server_port,)
    url_str = "http://" + server_ip + port_str + "/adopen/device/visit_v2"
    headers['nothing'] = 'nothing'
    request = urllib2.Request(url_str, datagen, headers)
    try:
        response = urllib2.urlopen(request)
        resp = response.read()
        print "http_status =", response.code
        result = json.loads(resp)
        print resp
        return result
    except urllib2.HTTPError, e:
        print "http_status =", e.code
        print e.read()
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.