अजगर में एक उपप्रकार।आईपीई पर गैर-अवरुद्ध पढ़ना


506

मैं उपप्रोसेस मॉड्यूल का उपयोग कर रहा हूं एक सबप्रोसेस शुरू करने और इसे आउटपुट स्ट्रीम (स्टडआउट) से कनेक्ट करने के लिए। मैं अपने स्टडआउट पर गैर-अवरुद्ध रीडिंग को निष्पादित करने में सक्षम होना चाहता हूं। क्या गैर-अवरोधक बनाने या जाँचने का एक तरीका है कि क्या मैं आह्वान करने से पहले धारा पर डेटा है .readline? मैं चाहता हूं कि यह पोर्टेबल या कम से कम विंडोज और लिनक्स के तहत काम करे।

यहां बताया गया है कि मैं इसे अभी के लिए कैसे करूं ( .readlineयदि कोई डेटा उपलब्ध नहीं है तो यह अवरुद्ध है):

p = subprocess.Popen('myprogram.exe', stdout = subprocess.PIPE)
output_str = p.stdout.readline()

14
(Google से आ रहा है?) सभी PIPE तब गतिरोध करेंगे जब PIPEs के बफर में से एक भर जाता है और पढ़ा नहीं जाता है। जैसे stderout भरा हुआ है जब stdout गतिरोध। कभी नहीं एक पीआईपीई पास करें जिसे आपने पढ़ने का इरादा नहीं किया है।
नासर अल-वोहबी

@ NasserAl-Wohaibi क्या इसका मतलब यह है कि हमेशा फ़ाइलों को बनाना बेहतर है?
चार्ली पार्कर

किसी चीज़ को समझने के लिए मैं उत्सुक हूँ कि इसकी पहली जगह में अवरोध क्यों है ... मैं पूछ रहा हूँ क्योंकि मैंने टिप्पणी देखी है:To avoid deadlocks: careful to: add \n to output, flush output, use readline() rather than read()
चार्ली पार्कर

यह "डिज़ाइन द्वारा" है, इनपुट प्राप्त करने की प्रतीक्षा कर रहा है।
मथिउ पैग

जवाबों:


403

fcntl, select, asyncprocइस मामले में मदद नहीं करेगा।

ऑपरेटिंग सिस्टम की परवाह किए बिना ब्लॉक किए बिना स्ट्रीम पढ़ने का एक विश्वसनीय तरीका है Queue.get_nowait():

import sys
from subprocess import PIPE, Popen
from threading  import Thread

try:
    from queue import Queue, Empty
except ImportError:
    from Queue import Queue, Empty  # python 2.x

ON_POSIX = 'posix' in sys.builtin_module_names

def enqueue_output(out, queue):
    for line in iter(out.readline, b''):
        queue.put(line)
    out.close()

p = Popen(['myprogram.exe'], stdout=PIPE, bufsize=1, close_fds=ON_POSIX)
q = Queue()
t = Thread(target=enqueue_output, args=(p.stdout, q))
t.daemon = True # thread dies with the program
t.start()

# ... do other things here

# read line without blocking
try:  line = q.get_nowait() # or q.get(timeout=.1)
except Empty:
    print('no output yet')
else: # got line
    # ... do something with line

6
हां यह मेरे लिए काम करता है, मैंने हालांकि बहुत कुछ हटा दिया। इसमें अच्छे अभ्यास शामिल हैं, लेकिन हमेशा आवश्यक नहीं। पायथन 3.x 2.X कंप्रेशर्स और क्लोज़_फीड्स को छोड़ा जा सकता है, यह अभी भी काम करेगा। लेकिन बस इस बात से अवगत रहें कि सब कुछ क्या करता है और इसे आँख बंद करके कॉपी न करें, भले ही यह सिर्फ काम करता हो! (वास्तव में सबसे आसान उपाय एक धागे का उपयोग करना है और एक रीडलाइन करना है जैसा कि एसईबी ने किया था, क्यूई डेटा प्राप्त करने का सिर्फ एक आसान तरीका है, अन्य हैं, धागे जवाब हैं!)
अकी

3
थ्रेड के अंदर, थ्रेड को out.readlineब्लॉक करने के लिए कॉल , और मुख्य थ्रेड, और मुझे इंतजार करना होगा जब तक कि सब कुछ जारी रखने से पहले रीडलाइन रिटर्न न हो जाए। उस के आसपास कोई आसान तरीका? (मैं अपनी प्रक्रिया से कई पंक्तियाँ पढ़ रहा हूँ, जो एक और .py फ़ाइल है जो DB और चीज़ें कर रही है)
जस्टिन

3
@Justin: 'out.readline' मुख्य धागे को ब्लॉक नहीं करता है जिसे दूसरे धागे में निष्पादित किया जाता है।
जुलाई

4
क्या होगा अगर मैं उपप्रोसेस को बंद करने में विफल रहता हूं, जैसे। अपवादों के कारण? स्टडआउट-रीडर थ्रेड मर नहीं जाएगा और अजगर लटक जाएगा, भले ही मुख्य धागा बाहर निकल जाए, है ना? इसके आसपास कोई कैसे काम कर सकता है? अजगर 2.x धागे को मारने का समर्थन नहीं करता है, क्या बुरा है, उन्हें बाधित करने का समर्थन नहीं करता है। :( (स्पष्ट रूप से किसी को यह सुनिश्चित करने के लिए अपवादों को संभालना चाहिए कि सबप्रोसेस बंद हो गया है, लेकिन सिर्फ इस स्थिति में आप क्या कर सकते हैं?)
n611x007

3
मैंने पैकेज में इसके कुछ अनुकूल रैपर बनाए हैं shelljob pypi.python.org/pypi/shelljob
edA-qa mort-ora-y

77

मुझे अक्सर एक समान समस्या थी; पायथन कार्यक्रम जो मैं अक्सर लिखता हूं, कमांड लाइन (स्टड) से उपयोगकर्ता इनपुट को स्वीकार करते हुए कुछ प्राथमिक कार्यक्षमता को निष्पादित करने की क्षमता होनी चाहिए। केवल उपयोगकर्ता इनपुट हैंडलिंग कार्यक्षमता को किसी अन्य थ्रेड में डालने से समस्या का समाधान नहीं होता है क्योंकि readline()ब्लॉक और कोई टाइमआउट नहीं है। यदि प्राथमिक कार्यक्षमता पूरी हो गई है और आगे उपयोगकर्ता इनपुट के लिए प्रतीक्षा करने की कोई आवश्यकता नहीं है, तो मैं आमतौर पर अपने प्रोग्राम से बाहर निकलना चाहता हूं, लेकिन ऐसा नहीं हो सकता क्योंकि readline()अभी भी एक पंक्ति के इंतजार में दूसरे धागे में अवरुद्ध है। इस समस्या का एक हल मुझे पता है कि स्टेक को fcntl मॉड्यूल का उपयोग करके एक गैर-अवरुद्ध फ़ाइल बनाना है:

import fcntl
import os
import sys

# make stdin a non-blocking file
fd = sys.stdin.fileno()
fl = fcntl.fcntl(fd, fcntl.F_GETFL)
fcntl.fcntl(fd, fcntl.F_SETFL, fl | os.O_NONBLOCK)

# user input handling thread
while mainThreadIsRunning:
      try: input = sys.stdin.readline()
      except: continue
      handleInput(input)

मेरी राय में यह इस समस्या को हल करने के लिए चुनिंदा या सिग्नल मॉड्यूल का उपयोग करने से थोड़ा साफ है, लेकिन फिर यह केवल UNIX पर काम करता है ...


1
डॉक्स के अनुसार, fcntl () फ़ाइल डिस्क्रिप्टर या ऑब्जेक्ट .fileno () विधि को प्राप्त कर सकता है।
डेनिलसन सा मैया

10
जेसी का जवाब सही नहीं है। गुइडो के अनुसार, रीडलाइन नॉन-ब्लॉकिंग मोड के साथ सही ढंग से काम नहीं करता है, और यह पायथन 3000 से पहले नहीं होगा। Bugs.python.org/issue1175#msg56041 यदि आप फ़ाइल को गैर-ब्लॉकिंग मोड में सेट करने के लिए fcntl का उपयोग करना चाहते हैं, आपको निम्न-स्तरीय os.read () का उपयोग करना होगा और लाइनों को स्वयं अलग करना होगा। उच्च-स्तरीय कॉल के साथ fcntl को मिलाने से लाइन बफ़रिंग करने वाले को परेशानी हो रही है।
anonn 16:55

2
पाइथन में रीडलाइन का उपयोग गलत लगता है। देखें anonnn का जवाब stackoverflow.com/questions/375427/…
इकोब

10
कृपया, व्यस्त छोरों का उपयोग न करें। डेटा का इंतजार करने के लिए समय-सीमा के साथ पोल () का उपयोग करें।
इवो ​​डनिहेलका

@ सेंटफैनो को किस buffer_sizeरूप में परिभाषित किया गया है?
बिल्ली

39

पायथन 3.4 अतुल्यकालिक IO - मॉड्यूल के लिए नए अनंतिम एपीआई का परिचय देता है ।asyncio

दृष्टिकोण twisted@Bryan वार्ड द्वारा -based जवाब के समान है - एक प्रोटोकॉल को परिभाषित करें और डेटा तैयार होते ही इसके तरीकों को कहा जाता है:

#!/usr/bin/env python3
import asyncio
import os

class SubprocessProtocol(asyncio.SubprocessProtocol):
    def pipe_data_received(self, fd, data):
        if fd == 1: # got stdout data (bytes)
            print(data)

    def connection_lost(self, exc):
        loop.stop() # end loop.run_forever()

if os.name == 'nt':
    loop = asyncio.ProactorEventLoop() # for subprocess' pipes on Windows
    asyncio.set_event_loop(loop)
else:
    loop = asyncio.get_event_loop()
try:
    loop.run_until_complete(loop.subprocess_exec(SubprocessProtocol, 
        "myprogram.exe", "arg1", "arg2"))
    loop.run_forever()
finally:
    loop.close()

डॉक्स में "सबप्रोसेस" देखें ।

एक उच्च-स्तरीय इंटरफ़ेस है asyncio.create_subprocess_exec()जो Processऑब्जेक्ट्स को लौटाता है जो StreamReader.readline()कोरुटीन ( async/ awaitPython 3.5+ सिंटैक्स के साथ ) का उपयोग करके अतुल्यकालिक रूप से एक पंक्ति पढ़ने की अनुमति देता है :

#!/usr/bin/env python3.5
import asyncio
import locale
import sys
from asyncio.subprocess import PIPE
from contextlib import closing

async def readline_and_kill(*args):
    # start child process
    process = await asyncio.create_subprocess_exec(*args, stdout=PIPE)

    # read line (sequence of bytes ending with b'\n') asynchronously
    async for line in process.stdout:
        print("got line:", line.decode(locale.getpreferredencoding(False)))
        break
    process.kill()
    return await process.wait() # wait for the child process to exit


if sys.platform == "win32":
    loop = asyncio.ProactorEventLoop()
    asyncio.set_event_loop(loop)
else:
    loop = asyncio.get_event_loop()

with closing(loop):
    sys.exit(loop.run_until_complete(readline_and_kill(
        "myprogram.exe", "arg1", "arg2")))

readline_and_kill() निम्नलिखित कार्य करता है:

  • उपप्रकार शुरू करें, एक पाइप में इसके स्टडआउट को पुनर्निर्देशित करें
  • सबप्रोसेसर की एक पंक्ति को असिंक्रोनस रूप से पढ़ें
  • उपप्रजाति को मार डालो
  • इसके निकलने की प्रतीक्षा करें

यदि आवश्यक हो तो प्रत्येक चरण टाइमआउट सेकंड तक सीमित हो सकता है।


जब मैं इस तरह के अजगर 3.4 कॉरटाइन का उपयोग करके कुछ कोशिश करता हूं, तो पूरी स्क्रिप्ट चलने के बाद मुझे केवल आउटपुट मिलता है। जैसे ही सबप्रोसेस प्रिंट करता है, मैं आउटपुट की एक लाइन प्रिंट करना चाहता हूं। यहाँ मुझे क्या मिला है: pastebin.com/qPssFGep
flutefreak7

1
@ flutefreak7: बफ़रिंग मुद्दे वर्तमान प्रश्न से संबंधित नहीं हैं। संभव समाधान के लिए लिंक का पालन करें।
JFS

धन्यवाद! मेरी स्क्रिप्ट के लिए समस्या का हल केवल print(text, flush=True)इतना है कि मुद्रित पाठ तुरंत वॉकर कॉल करने के लिए उपलब्ध होगा का उपयोग करके हल किया readline। जब मैंने इसे फोरट्रान-आधारित निष्पादन योग्य के साथ परीक्षण किया, तो मैं वास्तव में लपेटना / देखना चाहता हूं, यह आउटपुट नहीं है, इसलिए यह अपेक्षा के अनुरूप व्यवहार करता है।
flutefreak7

क्या सबप्रोसेस को जारी रखने और आगे पढ़ने / लिखने के संचालन की अनुमति देना संभव है। readline_and_kill, आपकी दूसरी लिपि में, इस तरह से बहुत काम करता subprocess.comunicateहै कि यह एक पढ़ने / लिखने के ऑपरेशन के बाद की प्रक्रिया को समाप्त कर देता है। मैं यह भी देखता हूं कि आप एक एकल पाइप का उपयोग कर रहे हैं stdout, जो उपप्रोसेस नॉन-ब्लॉकिंग के रूप में संभालता है। दोनों का उपयोग करने की कोशिश कर रहा हूंstdout और stderr मुझे लगता है कि मैं अंत तक अवरुद्ध कर रहा हूं
कैरेल

@ उत्तर में कोड का उपयोग करें जैसा कि स्पष्ट रूप से उत्तर में वर्णित है। यदि वांछित है तो अन्य व्यवहार को लागू करना संभव है। यदि उपयोग किया जाता है तो दोनों पाइप समान रूप से नॉनब्लॉकिंग हैं, यहां एक उदाहरण है कि दोनों पाइपों को समवर्ती कैसे पढ़ें
JFS

19

Asyncproc मॉड्यूल आज़माएं । उदाहरण के लिए:

import os
from asyncproc import Process
myProc = Process("myprogram.app")

while True:
    # check to see if process has ended
    poll = myProc.wait(os.WNOHANG)
    if poll != None:
        break
    # print any new output
    out = myProc.read()
    if out != "":
        print out

मॉड्यूल S.Lott द्वारा सुझाए गए सभी थ्रेडिंग का ध्यान रखता है।


1
बिल्कुल प्रतिभाशाली। कच्चे उपप्रोसेस मॉड्यूल की तुलना में बहुत आसान है। उबंटू पर मेरे लिए पूरी तरह से काम करता है।
12

12
asyncproc खिड़कियों पर काम नहीं करता है, और खिड़कियां os.WNOHANG का समर्थन नहीं करती हैं :-(
ब्रायन ओकले

26
asyncproc जीपीएल है, जो आगे इसके उपयोग को सीमित करता है :-(
ब्रायन ओकले

धन्यवाद। एक छोटी सी बात: ऐसा लगता है कि asyncproc.py में 8 स्थानों के साथ टैब की जगह जाने का तरीका है :)
benjaoming

ऐसा नहीं लगता कि आप उस प्रक्रिया का रिटर्न कोड प्राप्त कर सकते हैं जिसे आपने asyncproc मॉड्यूल के माध्यम से लॉन्च किया था; केवल आउटपुट जो इसे उत्पन्न करता है।
ग्रेनाई

17

आप इसे ट्विस्टेड में आसानी से कर सकते हैं । आपके मौजूदा कोड आधार के आधार पर, यह उपयोग करने के लिए इतना आसान नहीं हो सकता है, लेकिन यदि आप एक मुड़ आवेदन का निर्माण कर रहे हैं, तो इस तरह की चीजें लगभग तुच्छ हो जाती हैं। आप एक ProcessProtocolवर्ग बनाते हैं , और outReceived()विधि को ओवरराइड करते हैं । ट्विस्टेड (उपयोग किए गए रिएक्टर के आधार पर) आमतौर पर select()कॉलबैक के साथ एक बड़ा लूप होता है जो विभिन्न फाइल डिस्क्रिप्टर (अक्सर नेटवर्क सॉकेट) से डेटा को संभालने के लिए स्थापित होता है। तो outReceived()विधि बस से आने वाले डेटा को संभालने के लिए एक कॉलबैक स्थापित कर रही है STDOUT। इस व्यवहार को प्रदर्शित करने वाला एक सरल उदाहरण इस प्रकार है:

from twisted.internet import protocol, reactor

class MyProcessProtocol(protocol.ProcessProtocol):

    def outReceived(self, data):
        print data

proc = MyProcessProtocol()
reactor.spawnProcess(proc, './myprogram', ['./myprogram', 'arg1', 'arg2', 'arg3'])
reactor.run()

मुड़ प्रलेखन इस पर कुछ अच्छी जानकारी है।

यदि आप अपने पूरे एप्लिकेशन को ट्विस्टेड के आसपास बनाते हैं, तो यह अन्य प्रक्रियाओं के साथ अतुल्यकालिक संचार करता है, स्थानीय या रिमोट, वास्तव में इस तरह सुरुचिपूर्ण। दूसरी ओर, यदि आपका प्रोग्राम ट्विस्टेड के शीर्ष पर नहीं बनाया गया है, तो यह वास्तव में उतना उपयोगी नहीं है। उम्मीद है कि यह अन्य पाठकों के लिए उपयोगी हो सकता है, भले ही यह आपके विशेष आवेदन के लिए लागू न हो।


अच्छा नहीं। डॉक्स केselect अनुसार फाइल डिस्क्रिप्टर के साथ खिड़कियों पर काम नहीं करना चाहिए
n611x007

2
@ नक्सा मुझे नहीं लगता कि select()वह जिस बात का जिक्र कर रहा है, वही आप हैं। मैं यह मान रहा हूं क्योंकि Twistedविंडोज़ पर काम करता है ...
notbad.jpeg


1
"ट्विस्टेड (प्रयुक्त रिएक्टर पर निर्भर करता है) आमतौर पर सिर्फ एक बड़ा चयन () लूप होता है" का अर्थ है कि चुनने के लिए कई रिएक्टर हैं। select()एक Unixes और यूनिक्स पसंद पर सबसे पोर्टेबल एक है, लेकिन वहाँ भी दो रिएक्टरों विंडोज के लिए उपलब्ध हैं: twistedmatrix.com/documents/current/core/howto/...
clacke

14

चयन करें और पढ़ें (1) का उपयोग करें।

import subprocess     #no new requirements
def readAllSoFar(proc, retVal=''): 
  while (select.select([proc.stdout],[],[],0)[0]!=[]):   
    retVal+=proc.stdout.read(1)
  return retVal
p = subprocess.Popen(['/bin/ls'], stdout=subprocess.PIPE)
while not p.poll():
  print (readAllSoFar(p))

रीडलाइन के लिए () - जैसे:

lines = ['']
while not p.poll():
  lines = readAllSoFar(p, lines[-1]).split('\n')
  for a in range(len(lines)-1):
    print a
lines = readAllSoFar(p, lines[-1]).split('\n')
for a in range(len(lines)-1):
  print a

6
अच्छा नहीं। डॉक्स केselect अनुसार फाइल डिस्क्रिप्टर के साथ खिड़कियों पर काम नहीं करना चाहिए
n611x007

हे भगवान। मेगाबाइट पढ़ें, या संभवत: एक समय में एक चरित्र गीगाबाइट ... वह सबसे बुरा विचार है जिसे मैंने लंबे समय में देखा है ... उल्लेख करने के लिए अनावश्यक, यह कोड काम नहीं करता है, क्योंकि proc.stdout.read()तर्क कितना भी छोटा क्यों न हो एक अवरुद्ध कॉल।
wvxvw

OSError: [WinError 10093] Either the application has not called WSAStartup, or WSAStartup failed
nmz787

8

एक समाधान यह है कि आप अपनी प्रक्रिया को पढ़ने के लिए एक अन्य प्रक्रिया करें, या टाइमआउट के साथ प्रक्रिया का एक धागा बनाएं।

यहाँ एक टाइमआउट फ़ंक्शन का थ्रेडेड संस्करण है:

http://code.activestate.com/recipes/473878/

हालाँकि, क्या आपको स्टडआउट पढ़ने की ज़रूरत है क्योंकि यह अंदर आ रहा है? एक अन्य समाधान आउटपुट को किसी फ़ाइल में डंप करने और p.wait () का उपयोग करने के लिए प्रक्रिया समाप्त होने तक प्रतीक्षा कर सकता है

f = open('myprogram_output.txt','w')
p = subprocess.Popen('myprogram.exe', stdout=f)
p.wait()
f.close()


str = open('myprogram_output.txt','r').read()

ऐसा लगता है कि पुनरावृत्ति का धागा समय समाप्त होने के बाद बाहर नहीं निकलेगा और इसे मारना उप-प्रजाति को मारने में सक्षम होने पर निर्भर करता है (sg। अन्यथा इस संबंध में असंबंधित) यह पढ़ता है (एक ऐसी चीज जिसे आप करने में सक्षम होना चाहिए, लेकिन सिर्फ मामले में आप नहीं कर सकते ..) ।
n611x007

7

डिस्क्लेमर: यह केवल बवंडर के लिए काम करता है

आप इसे fd को नॉनब्लॉकिंग सेट करके कर सकते हैं और फिर कॉलबैक रजिस्टर करने के लिए ioloop का उपयोग कर सकते हैं। मैंने इसे एक अंडे में पैक किया है जिसे tornado_subprocess कहा जाता है और आप इसे PyPI के माध्यम से स्थापित कर सकते हैं:

easy_install tornado_subprocess

अब आप ऐसा कुछ कर सकते हैं:

import tornado_subprocess
import tornado.ioloop

    def print_res( status, stdout, stderr ) :
    print status, stdout, stderr
    if status == 0:
        print "OK:"
        print stdout
    else:
        print "ERROR:"
        print stderr

t = tornado_subprocess.Subprocess( print_res, timeout=30, args=[ "cat", "/etc/passwd" ] )
t.start()
tornado.ioloop.IOLoop.instance().start()

आप इसे RequestHandler के साथ भी उपयोग कर सकते हैं

class MyHandler(tornado.web.RequestHandler):
    def on_done(self, status, stdout, stderr):
        self.write( stdout )
        self.finish()

    @tornado.web.asynchronous
    def get(self):
        t = tornado_subprocess.Subprocess( self.on_done, timeout=30, args=[ "cat", "/etc/passwd" ] )
        t.start()

अच्छी सुविधा के लिए धन्यवाद! बस स्पष्ट करने के लिए, हम केवल threading.Threadनई गैर-अवरुद्ध प्रक्रियाओं को बनाने के लिए उपयोग क्यों नहीं कर सकते हैं? मैंने इसे on_messageटोर्नेडो वेबसोकेट उदाहरण में इस्तेमाल किया , और इसने काम ठीक किया।
VisioN

1
थ्रेडिंग ज्यादातर बवंडर में हतोत्साहित किया जाता है। वे छोटे, छोटे चल रहे कार्यों के लिए ठीक हैं। आप इसके बारे में यहाँ पढ़ सकते हैं: stackoverflow.com/questions/7846323/tornado-web-and-threads github.com/facebook/tornado/wiki/Threading-and-concurrency
Vasasin Toroman

@VukasinToroman तुम सच में मुझे इस के साथ यहाँ बचा लिया। Tornado_subprocess मॉड्यूल :) के लिए बहुत बहुत धन्यवाद :)
जेम्स जेंट्स

क्या यह विंडोज़ पर काम करता है? (ध्यान दें कि select, फाइल डिस्क्रिप्टर के साथ, नहीं करता है )
n611x007 7:13

यह lib selectकॉल का उपयोग नहीं करता है । मैंने विंडोज के तहत इसकी कोशिश नहीं की है, लेकिन शायद आप परेशानी में पड़ जाएंगे क्योंकि fcntlमॉड्यूल का उपयोग कर रहा है। तो संक्षेप में: नहीं यह शायद विंडोज के तहत काम नहीं करेगा।
वुकसिन टॉरमन

6

मौजूदा समाधान मेरे लिए काम नहीं किया (नीचे विवरण)। आखिरकार जो काम किया गया वह रीड (1) ( इस उत्तर पर आधारित) का उपयोग करके रीडलाइन को लागू करना था । बाद वाला ब्लॉक नहीं करता है:

from subprocess import Popen, PIPE
from threading import Thread
def process_output(myprocess): #output-consuming thread
    nextline = None
    buf = ''
    while True:
        #--- extract line using read(1)
        out = myprocess.stdout.read(1)
        if out == '' and myprocess.poll() != None: break
        if out != '':
            buf += out
            if out == '\n':
                nextline = buf
                buf = ''
        if not nextline: continue
        line = nextline
        nextline = None

        #--- do whatever you want with line here
        print 'Line is:', line
    myprocess.stdout.close()

myprocess = Popen('myprogram.exe', stdout=PIPE) #output-producing process
p1 = Thread(target=process_output, args=(dcmpid,)) #output-consuming thread
p1.daemon = True
p1.start()

#--- do whatever here and then kill process and thread if needed
if myprocess.poll() == None: #kill process; will automatically stop thread
    myprocess.kill()
    myprocess.wait()
if p1 and p1.is_alive(): #wait for thread to finish
    p1.join()

मौजूदा समाधान क्यों काम नहीं किया:

  1. समाधान जिन्हें रीडलाइन की आवश्यकता होती है (कतार आधारित सहित) हमेशा ब्लॉक करते हैं। रीडलाइन निष्पादित करने वाले थ्रेड को मारना मुश्किल (असंभव) है। यह केवल तब मारा जाता है जब इसे बनाने वाली प्रक्रिया खत्म हो जाती है, लेकिन तब नहीं जब उत्पादन-उत्पादन प्रक्रिया को मार दिया जाता है।
  2. उच्च-स्तरीय रीडलाइन कॉल के साथ निम्न-स्तरीय fcntl को मिलाना ठीक से काम नहीं कर सकता क्योंकि aonnn ने बताया है।
  3. Select.poll () का उपयोग करना साफ है, लेकिन अजगर डॉक्स के अनुसार विंडोज पर काम नहीं करता है।
  4. तृतीय-पक्ष पुस्तकालयों का उपयोग करना इस कार्य के लिए अधिक लगता है और अतिरिक्त निर्भरता जोड़ता है।

1
1. q.get_nowait()मेरे जवाब से , कभी भी ब्लॉक नहीं करना चाहिए, यही इसका उपयोग करने का बिंदु है। 2. वह थ्रेड जो EOF पर रीडलाइन ( enqueue_output()फ़ंक्शन ) को निष्पादित करता है , उदाहरण के लिए, आउटपुट-प्रोडक्शन प्रक्रिया के मारे जाने के मामले सहित। यदि आप मानते हैं कि ऐसा नहीं है; कृपया, एक पूर्ण न्यूनतम कोड उदाहरण प्रदान करें जो अन्यथा दिखाता है (शायद एक नए प्रश्न के रूप में )।
jfs

1
@sebastian मैंने न्यूनतम उदाहरण के साथ आने में एक घंटे या उससे अधिक समय बिताया। अंत में मुझे सहमत होना चाहिए कि आपका जवाब सभी मामलों को संभालता है। मुझे लगता है कि यह मेरे लिए पहले काम नहीं करता था क्योंकि जब मैं आउटपुट-प्रोडक्शन प्रक्रिया को मारने की कोशिश कर रहा था, तो यह पहले से ही मार डाला गया था और एक हार्ड-टू-डीबग त्रुटि दी थी। घंटा अच्छी तरह से व्यतीत किया गया था, क्योंकि न्यूनतम उदाहरण के साथ आने पर, मैं एक सरल समाधान के साथ आ सकता था।
विक्रम पुदी

आप भी सरल समाधान पोस्ट कर सकते हैं? :) (अगर यह सेबस्टियन से अलग है)
n611x007

@ खतरे think ९: मुझे लगता है dcmpid = myprocess
वीआईएफआई

पढ़े जाने के बाद () कॉलिंग के दौरान (सिर्फ ट्रू के बाद): खाली स्ट्रिंग कभी नहीं होगी क्योंकि आप 1. स्ट्रिंग की लंबाई के साथ कम से कम स्ट्रिंग / बाइट्स
पढ़ते हैं

6

यहाँ मेरा कोड है, जिसका उपयोग आंशिक लाइनों सहित सबप्रोसेस ASAP से हर आउटपुट को पकड़ने के लिए किया जाता है। यह एक ही समय में पंप करता है और लगभग सही क्रम में stdout और stderr।

परीक्षण किया और सही ढंग से पायथन 2.7 लिनक्स और खिड़कियों पर काम किया।

#!/usr/bin/python
#
# Runner with stdout/stderr catcher
#
from sys import argv
from subprocess import Popen, PIPE
import os, io
from threading import Thread
import Queue
def __main__():
    if (len(argv) > 1) and (argv[-1] == "-sub-"):
        import time, sys
        print "Application runned!"
        time.sleep(2)
        print "Slept 2 second"
        time.sleep(1)
        print "Slept 1 additional second",
        time.sleep(2)
        sys.stderr.write("Stderr output after 5 seconds")
        print "Eol on stdin"
        sys.stderr.write("Eol on stderr\n")
        time.sleep(1)
        print "Wow, we have end of work!",
    else:
        os.environ["PYTHONUNBUFFERED"]="1"
        try:
            p = Popen( argv + ["-sub-"],
                       bufsize=0, # line-buffered
                       stdin=PIPE, stdout=PIPE, stderr=PIPE )
        except WindowsError, W:
            if W.winerror==193:
                p = Popen( argv + ["-sub-"],
                           shell=True, # Try to run via shell
                           bufsize=0, # line-buffered
                           stdin=PIPE, stdout=PIPE, stderr=PIPE )
            else:
                raise
        inp = Queue.Queue()
        sout = io.open(p.stdout.fileno(), 'rb', closefd=False)
        serr = io.open(p.stderr.fileno(), 'rb', closefd=False)
        def Pump(stream, category):
            queue = Queue.Queue()
            def rdr():
                while True:
                    buf = stream.read1(8192)
                    if len(buf)>0:
                        queue.put( buf )
                    else:
                        queue.put( None )
                        return
            def clct():
                active = True
                while active:
                    r = queue.get()
                    try:
                        while True:
                            r1 = queue.get(timeout=0.005)
                            if r1 is None:
                                active = False
                                break
                            else:
                                r += r1
                    except Queue.Empty:
                        pass
                    inp.put( (category, r) )
            for tgt in [rdr, clct]:
                th = Thread(target=tgt)
                th.setDaemon(True)
                th.start()
        Pump(sout, 'stdout')
        Pump(serr, 'stderr')

        while p.poll() is None:
            # App still working
            try:
                chan,line = inp.get(timeout = 1.0)
                if chan=='stdout':
                    print "STDOUT>>", line, "<?<"
                elif chan=='stderr':
                    print " ERROR==", line, "=?="
            except Queue.Empty:
                pass
        print "Finish"

if __name__ == '__main__':
    __main__()

कुछ जवाबों में से एक जो आपको सामान को पढ़ने की अनुमति देता है जो जरूरी नहीं कि एक नई पंक्ति के साथ समाप्त हो।
टोटाम

5

मैं कुछ उपप्रकारों को पढ़ने के लिए इस समस्या को जोड़ता हूं। स्टॉपआउट। यहाँ मेरा गैर अवरुद्ध पढ़ना समाधान है:

import fcntl

def non_block_read(output):
    fd = output.fileno()
    fl = fcntl.fcntl(fd, fcntl.F_GETFL)
    fcntl.fcntl(fd, fcntl.F_SETFL, fl | os.O_NONBLOCK)
    try:
        return output.read()
    except:
        return ""

# Use example
from subprocess import *
sb = Popen("echo test && sleep 1000", shell=True, stdout=PIPE)
sb.kill()

# sb.stdout.read() # <-- This will block
non_block_read(sb.stdout)
'test\n'

5
डॉक्स के अनुसार fcntl विंडोज़ पर काम नहीं करता है ।
n611x007

msvcrt.kbhit()इसके बजाय @anatolytechtonik का उपयोग करें
बिल्ली

4

नॉन-ब्लॉकिंग रीड के इस संस्करण में विशेष मॉड्यूल की आवश्यकता नहीं होती है और यह लिनक्स डिस्ट्रोस के बहुमत पर आउट-ऑफ-द-बॉक्स काम करेगा।

import os
import sys
import time
import fcntl
import subprocess

def async_read(fd):
    # set non-blocking flag while preserving old flags
    fl = fcntl.fcntl(fd, fcntl.F_GETFL)
    fcntl.fcntl(fd, fcntl.F_SETFL, fl | os.O_NONBLOCK)
    # read char until EOF hit
    while True:
        try:
            ch = os.read(fd.fileno(), 1)
            # EOF
            if not ch: break                                                                                                                                                              
            sys.stdout.write(ch)
        except OSError:
            # waiting for data be available on fd
            pass

def shell(args, async=True):
    # merge stderr and stdout
    proc = subprocess.Popen(args, shell=False, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
    if async: async_read(proc.stdout)
    sout, serr = proc.communicate()
    return (sout, serr)

if __name__ == '__main__':
    cmd = 'ping 8.8.8.8'
    sout, serr = shell(cmd.split())

3

यहाँ धागे के आधार पर एक सरल समाधान दिया गया है:

  • लिनक्स और विंडोज (पर निर्भर नहीं select) दोनों पर काम करता है ।
  • दोनों stdoutऔर stderrasynchronouly पढ़ता है ।
  • मनमाने ढंग से प्रतीक्षा समय (सीपीयू के अनुकूल) के साथ सक्रिय मतदान पर भरोसा नहीं करता है।
  • उपयोग नहीं करता है asyncio(जो अन्य पुस्तकालयों के साथ संघर्ष कर सकता है)।
  • बच्चे की प्रक्रिया समाप्त होने तक चलता है।

printer.py

import time
import sys

sys.stdout.write("Hello\n")
sys.stdout.flush()
time.sleep(1)
sys.stdout.write("World!\n")
sys.stdout.flush()
time.sleep(1)
sys.stderr.write("That's an error\n")
sys.stderr.flush()
time.sleep(2)
sys.stdout.write("Actually, I'm fine\n")
sys.stdout.flush()
time.sleep(1)

reader.py

import queue
import subprocess
import sys
import threading


def enqueue_stream(stream, queue, type):
    for line in iter(stream.readline, b''):
        queue.put(str(type) + line.decode('utf-8'))
    stream.close()


def enqueue_process(process, queue):
    process.wait()
    queue.put('x')


p = subprocess.Popen('python printer.py', stdout=subprocess.PIPE, stderr=subprocess.PIPE)
q = queue.Queue()
to = threading.Thread(target=enqueue_stream, args=(p.stdout, q, 1))
te = threading.Thread(target=enqueue_stream, args=(p.stderr, q, 2))
tp = threading.Thread(target=enqueue_process, args=(p, q))
te.start()
to.start()
tp.start()

while True:
    line = q.get()
    if line[0] == 'x':
        break
    if line[0] == '2':  # stderr
        sys.stdout.write("\033[0;31m")  # ANSI red color
    sys.stdout.write(line[1:])
    if line[0] == '2':
        sys.stdout.write("\033[0m")  # reset ANSI code
    sys.stdout.flush()

tp.join()
to.join()
te.join()

2

इस उत्तर को यहाँ जोड़ने के बाद से यह विंडोज और यूनिक्स पर गैर-अवरुद्ध पाइप सेट करने की क्षमता प्रदान करता है।

सभी ctypesविवरण @ Techtonik के उत्तर के लिए धन्यवाद हैं ।

यूनिक्स और विंडोज सिस्टम दोनों पर इस्तेमाल किया जाने वाला थोड़ा संशोधित संस्करण है।

  • पायथन 3 संगत (केवल मामूली बदलाव की आवश्यकता)
  • इसमें पॉज़िक्स संस्करण शामिल है, और इसके लिए उपयोग करने के लिए अपवाद को परिभाषित करता है।

इस तरह से आप यूनिक्स और विंडोज कोड के लिए समान फ़ंक्शन और अपवाद का उपयोग कर सकते हैं।

# pipe_non_blocking.py (module)
"""
Example use:

    p = subprocess.Popen(
            command,
            stdout=subprocess.PIPE,
            )

    pipe_non_blocking_set(p.stdout.fileno())

    try:
        data = os.read(p.stdout.fileno(), 1)
    except PortableBlockingIOError as ex:
        if not pipe_non_blocking_is_error_blocking(ex):
            raise ex
"""


__all__ = (
    "pipe_non_blocking_set",
    "pipe_non_blocking_is_error_blocking",
    "PortableBlockingIOError",
    )

import os


if os.name == "nt":
    def pipe_non_blocking_set(fd):
        # Constant could define globally but avoid polluting the name-space
        # thanks to: /programming/34504970
        import msvcrt

        from ctypes import windll, byref, wintypes, WinError, POINTER
        from ctypes.wintypes import HANDLE, DWORD, BOOL

        LPDWORD = POINTER(DWORD)

        PIPE_NOWAIT = wintypes.DWORD(0x00000001)

        def pipe_no_wait(pipefd):
            SetNamedPipeHandleState = windll.kernel32.SetNamedPipeHandleState
            SetNamedPipeHandleState.argtypes = [HANDLE, LPDWORD, LPDWORD, LPDWORD]
            SetNamedPipeHandleState.restype = BOOL

            h = msvcrt.get_osfhandle(pipefd)

            res = windll.kernel32.SetNamedPipeHandleState(h, byref(PIPE_NOWAIT), None, None)
            if res == 0:
                print(WinError())
                return False
            return True

        return pipe_no_wait(fd)

    def pipe_non_blocking_is_error_blocking(ex):
        if not isinstance(ex, PortableBlockingIOError):
            return False
        from ctypes import GetLastError
        ERROR_NO_DATA = 232

        return (GetLastError() == ERROR_NO_DATA)

    PortableBlockingIOError = OSError
else:
    def pipe_non_blocking_set(fd):
        import fcntl
        fl = fcntl.fcntl(fd, fcntl.F_GETFL)
        fcntl.fcntl(fd, fcntl.F_SETFL, fl | os.O_NONBLOCK)
        return True

    def pipe_non_blocking_is_error_blocking(ex):
        if not isinstance(ex, PortableBlockingIOError):
            return False
        return True

    PortableBlockingIOError = BlockingIOError

अधूरे डेटा को पढ़ने से बचने के लिए, मैंने अपना खुद का रीडलाइन जनरेटर लिखना बंद कर दिया (जो प्रत्येक पंक्ति के लिए बाइट स्ट्रिंग देता है)।

इसका एक जनरेटर तो आप उदाहरण के लिए कर सकते हैं ...

def non_blocking_readlines(f, chunk=1024):
    """
    Iterate over lines, yielding b'' when nothings left
    or when new data is not yet available.

    stdout_iter = iter(non_blocking_readlines(process.stdout))

    line = next(stdout_iter)  # will be a line or b''.
    """
    import os

    from .pipe_non_blocking import (
            pipe_non_blocking_set,
            pipe_non_blocking_is_error_blocking,
            PortableBlockingIOError,
            )

    fd = f.fileno()
    pipe_non_blocking_set(fd)

    blocks = []

    while True:
        try:
            data = os.read(fd, chunk)
            if not data:
                # case were reading finishes with no trailing newline
                yield b''.join(blocks)
                blocks.clear()
        except PortableBlockingIOError as ex:
            if not pipe_non_blocking_is_error_blocking(ex):
                raise ex

            yield b''
            continue

        while True:
            n = data.find(b'\n')
            if n == -1:
                break

            yield b''.join(blocks) + data[:n + 1]
            data = data[n + 1:]
            blocks.clear()
        blocks.append(data)

(1) यह टिप्पणी इंगित करती है कि पायथन 2 पर readline()गैर-अवरुद्ध पाइप (जैसे कि सेट का उपयोग करना fcntl) के साथ काम नहीं करता है - क्या आपको लगता है कि यह अब सही नहीं है? (मेरे उत्तर में लिंक ( fcntl) है जो समान जानकारी प्रदान करता है लेकिन यह अब हटा दिया गया लगता है)। (२) देखें कि कैसे multiprocessing.connection.Pipeउपयोग होता हैSetNamedPipeHandleState
जेएफ

मैंने केवल पायथन 3 पर यह परीक्षण किया। लेकिन इस जानकारी को भी देखा और उम्मीद है कि यह वैध रहेगा। मैंने रीडलाइन की जगह का उपयोग करने के लिए अपना कोड भी लिखा है, मैंने इसे शामिल करने के लिए अपना उत्तर अपडेट कर दिया है।
ideasman42

2

मेरे पास मूल प्रश्नकर्ता की समस्या है, लेकिन धागे को आमंत्रित करने की इच्छा नहीं थी। मैंने पाइप से एक डायरेक्ट रीड (), और मेरे अपने बफर-हैंडलर को लाइन रीड्स (हालांकि, मेरी उप-प्रक्रिया - पिंग - हमेशा पूर्ण लाइनों <एक सिस्टम पेज साइज़ लिखा) के साथ मिलाया। मैं केवल एक gobject- पंजीकृत io घड़ी में पढ़ने से व्यस्त-प्रतीक्षा से बचता हूं। इन दिनों मैं आमतौर पर थ्रेड्स से बचने के लिए एक Gobject MainLoop के भीतर कोड चलाता हूं।

def set_up_ping(ip, w):
# run the sub-process
# watch the resultant pipe
p = subprocess.Popen(['/bin/ping', ip], stdout=subprocess.PIPE)
# make stdout a non-blocking file
fl = fcntl.fcntl(p.stdout, fcntl.F_GETFL)
fcntl.fcntl(p.stdout, fcntl.F_SETFL, fl | os.O_NONBLOCK)
stdout_gid = gobject.io_add_watch(p.stdout, gobject.IO_IN, w)
return stdout_gid # for shutting down

द्रष्टा है

def watch(f, *other):
print 'reading',f.read()
return True

और मुख्य कार्यक्रम एक पिंग सेट करता है और फिर gobject मेल लूप को कॉल करता है।

def main():
set_up_ping('192.168.1.8', watch)
# discard gid as unused here
gobject.MainLoop().run()

अन्य कोई भी कार्य gobject में कॉलबैक से जुड़ा हुआ है।


2

आधुनिक पायथन में चीजें बहुत बेहतर हैं।

यहाँ एक सरल बाल कार्यक्रम है, "hello.py":

#!/usr/bin/env python3

while True:
    i = input()
    if i == "quit":
        break
    print(f"hello {i}")

और इसके साथ बातचीत करने के लिए एक कार्यक्रम:

import asyncio


async def main():
    proc = await asyncio.subprocess.create_subprocess_exec(
        "./hello.py", stdin=asyncio.subprocess.PIPE, stdout=asyncio.subprocess.PIPE
    )
    proc.stdin.write(b"bob\n")
    print(await proc.stdout.read(1024))
    proc.stdin.write(b"alice\n")
    print(await proc.stdout.read(1024))
    proc.stdin.write(b"quit\n")
    await proc.wait()


asyncio.run(main())

यह प्रिंट करता है:

b'hello bob\n'
b'hello alice\n'

ध्यान दें कि वास्तविक पैटर्न, जो पिछले सभी उत्तरों में से लगभग सभी के द्वारा है, यहाँ और संबंधित प्रश्नों में, बच्चे के स्टडआउट फ़ाइल विवरणक को गैर-अवरुद्ध करने के लिए सेट करना है और फिर उसे किसी प्रकार के चुनिंदा लूप में प्रदूषित करना है। इन दिनों, ज़ाहिर है, कि पाश asyncio द्वारा प्रदान की जाती है।


1

चुनिंदा मॉड्यूल आप यह निर्धारित जहां अगले उपयोगी इनपुट है मदद करता है।

हालांकि, आप हमेशा अलग थ्रेड के साथ खुश रहते हैं। एक अवरुद्ध स्टड को पढ़ता है, दूसरा वह करता है जहाँ आप ब्लॉक नहीं करना चाहते हैं।


11
मुझे लगता है कि यह उत्तर दो कारणों से अनपेक्षित है: (ए) चयनित मॉड्यूल विंडोज के तहत पाइपों पर काम नहीं करेगा (जैसा कि स्पष्ट रूप से लिंक दिया गया है), जो पोर्टेबल समाधान के लिए ओपी के इरादों को पराजित करता है। (बी) अतुल्यकालिक धागे माता-पिता और बच्चे की प्रक्रिया के बीच एक तुल्यकालिक संवाद की अनुमति नहीं देते हैं। क्या होगा अगर माता-पिता की प्रक्रिया बच्चे से पढ़ी अगली पंक्ति के अनुसार अगली कार्रवाई को भेजना चाहती है ?!
थॉमस जूल

4
चयन भी उपयोगी नहीं है कि चयन के बाद भी पायथन रीड्स ब्लॉक हो जाएगा, क्योंकि इसमें मानक सी शब्दार्थ नहीं है और आंशिक डेटा वापस नहीं आएगा।
हेल्मुट ग्रोने

बच्चे के आउटपुट से पढ़ने के लिए एक अलग थ्रेड्स ने मेरी समस्या को हल कर दिया जो इस तरह से था। यदि आपको समकालिक बातचीत की आवश्यकता है, तो मुझे लगता है कि आप इस समाधान का उपयोग नहीं कर सकते हैं (जब तक कि आपको यह पता नहीं है कि उम्मीद करने के लिए आउटपुट क्या है)। मैंने इस उत्तर को स्वीकार किया होगा
एमिलियानो

1

धागा और कतार क्यों परेशान कर रहा है? रीडलाइन (), बफ़रड्रेडर .read1 () वॉन्ट ब्लॉक के विपरीत \ r \ n की प्रतीक्षा कर रहा है, अगर कोई आउटपुट आ रहा है तो यह ASAP को वापस कर देता है।

#!/usr/bin/python
from subprocess import Popen, PIPE, STDOUT
import io

def __main__():
    try:
        p = Popen( ["ping", "-n", "3", "127.0.0.1"], stdin=PIPE, stdout=PIPE, stderr=STDOUT )
    except: print("Popen failed"); quit()
    sout = io.open(p.stdout.fileno(), 'rb', closefd=False)
    while True:
        buf = sout.read1(1024)
        if len(buf) == 0: break
        print buf,

if __name__ == '__main__':
    __main__()

अगर इसमें कुछ कमी नहीं है तो क्या यह ASAP को लौटाएगा? यदि ऐसा नहीं है तो यह अवरुद्ध है।
मैथ्यू पैग

@ MathieuPagé सही है। read1ब्लॉक करेगा यदि पहले अंतर्निहित रीड ब्लॉक, जो तब होता है जब पाइप अभी भी खुला है लेकिन कोई इनपुट उपलब्ध नहीं है।
जैक ओ'कॉनर

1

मेरे मामले में मुझे एक लॉगिंग मॉड्यूल की आवश्यकता थी जो पृष्ठभूमि अनुप्रयोगों से आउटपुट को पकड़ता है और इसे संवर्धित करता है (समय-टिकट, रंग, आदि को जोड़ते हुए)।

मैं एक पृष्ठभूमि थ्रेड के साथ समाप्त हुआ जो वास्तविक I / O करता है। निम्नलिखित कोड केवल POSIX प्लेटफार्मों के लिए है। मैंने गैर जरूरी हिस्से छीन लिए।

यदि कोई लंबे समय तक इस जानवर का उपयोग करने जा रहा है तो खुले विवरणों को प्रबंधित करने पर विचार करें। मेरे मामले में यह कोई बड़ी समस्या नहीं थी।

# -*- python -*-
import fcntl
import threading
import sys, os, errno
import subprocess

class Logger(threading.Thread):
    def __init__(self, *modules):
        threading.Thread.__init__(self)
        try:
            from select import epoll, EPOLLIN
            self.__poll = epoll()
            self.__evt = EPOLLIN
            self.__to = -1
        except:
            from select import poll, POLLIN
            print 'epoll is not available'
            self.__poll = poll()
            self.__evt = POLLIN
            self.__to = 100
        self.__fds = {}
        self.daemon = True
        self.start()

    def run(self):
        while True:
            events = self.__poll.poll(self.__to)
            for fd, ev in events:
                if (ev&self.__evt) != self.__evt:
                    continue
                try:
                    self.__fds[fd].run()
                except Exception, e:
                    print e

    def add(self, fd, log):
        assert not self.__fds.has_key(fd)
        self.__fds[fd] = log
        self.__poll.register(fd, self.__evt)

class log:
    logger = Logger()

    def __init__(self, name):
        self.__name = name
        self.__piped = False

    def fileno(self):
        if self.__piped:
            return self.write
        self.read, self.write = os.pipe()
        fl = fcntl.fcntl(self.read, fcntl.F_GETFL)
        fcntl.fcntl(self.read, fcntl.F_SETFL, fl | os.O_NONBLOCK)
        self.fdRead = os.fdopen(self.read)
        self.logger.add(self.read, self)
        self.__piped = True
        return self.write

    def __run(self, line):
        self.chat(line, nl=False)

    def run(self):
        while True:
            try: line = self.fdRead.readline()
            except IOError, exc:
                if exc.errno == errno.EAGAIN:
                    return
                raise
            self.__run(line)

    def chat(self, line, nl=True):
        if nl: nl = '\n'
        else: nl = ''
        sys.stdout.write('[%s] %s%s' % (self.__name, line, nl))

def system(command, param=[], cwd=None, env=None, input=None, output=None):
    args = [command] + param
    p = subprocess.Popen(args, cwd=cwd, stdout=output, stderr=output, stdin=input, env=env, bufsize=0)
    p.wait()

ls = log('ls')
ls.chat('go')
system("ls", ['-l', '/'], output=ls)

date = log('date')
date.chat('go')
system("date", output=date)

1

मेरी समस्या थोड़ी अलग है क्योंकि मैं एक रनिंग प्रक्रिया से स्टडआउट और स्टादर दोनों को इकट्ठा करना चाहता था, लेकिन आखिरकार जैसा कि मैं एक विजेट में आउटपुट को उत्पन्न करना चाहता था।

मैं क्यूज़ या अतिरिक्त थ्रेड्स का उपयोग करते हुए कई प्रस्तावित वर्कअराउंड का सहारा नहीं लेना चाहता था क्योंकि उन्हें इस तरह के एक सामान्य कार्य को करने के लिए आवश्यक नहीं होना चाहिए जैसे कि एक अन्य स्क्रिप्ट को चलाने और इसके आउटपुट को इकट्ठा करना।

प्रस्तावित समाधान और अजगर डॉक्स पढ़ने के बाद मैंने नीचे दिए गए कार्यान्वयन के साथ अपना मुद्दा हल किया। हां, यह केवल POSIX के लिए काम करता है जैसा कि मैं उपयोग कर रहा हूंselect फ़ंक्शन कॉल ।

मैं सहमत हूं कि डॉक्स भ्रमित कर रहे हैं और कार्यान्वयन इस तरह के एक सामान्य स्क्रिप्टिंग कार्य के लिए अजीब है। मेरा मानना ​​है कि अजगर के पुराने संस्करणों के लिए अलग-अलग चूक हैंPopen -अलग स्पष्टीकरण हैं और अलग-अलग स्पष्टीकरण हैं ताकि बहुत भ्रम पैदा हो। यह पायथन 2.7.12 और 3.5.2 दोनों के लिए अच्छा काम करता है।

कुंजी को bufsize=1बफ़रिंग के लिए सेट करना था और फिर universal_newlines=Trueबाइनरी के बजाय टेक्स्ट फ़ाइल के रूप में संसाधित करना था जो सेटिंग करते समय डिफ़ॉल्ट बन जाता है bufsize=1

class workerThread(QThread):
   def __init__(self, cmd):
      QThread.__init__(self)
      self.cmd = cmd
      self.result = None           ## return code
      self.error = None            ## flag indicates an error
      self.errorstr = ""           ## info message about the error

   def __del__(self):
      self.wait()
      DEBUG("Thread removed")

   def run(self):
      cmd_list = self.cmd.split(" ")   
      try:
         cmd = subprocess.Popen(cmd_list, bufsize=1, stdin=None
                                        , universal_newlines=True
                                        , stderr=subprocess.PIPE
                                        , stdout=subprocess.PIPE)
      except OSError:
         self.error = 1
         self.errorstr = "Failed to execute " + self.cmd
         ERROR(self.errorstr)
      finally:
         VERBOSE("task started...")
      import select
      while True:
         try:
            r,w,x = select.select([cmd.stdout, cmd.stderr],[],[])
            if cmd.stderr in r:
               line = cmd.stderr.readline()
               if line != "":
                  line = line.strip()
                  self.emit(SIGNAL("update_error(QString)"), line)
            if cmd.stdout in r:
               line = cmd.stdout.readline()
               if line == "":
                  break
               line = line.strip()
               self.emit(SIGNAL("update_output(QString)"), line)
         except IOError:
            pass
      cmd.wait()
      self.result = cmd.returncode
      if self.result < 0:
         self.error = 1
         self.errorstr = "Task terminated by signal " + str(self.result)
         ERROR(self.errorstr)
         return
      if self.result:
         self.error = 1
         self.errorstr = "exit code " + str(self.result)
         ERROR(self.errorstr)
         return
      return

ERROR, DEBUG और VERBOSE केवल मैक्रोज़ हैं जो टर्मिनल में आउटपुट प्रिंट करते हैं।

यह समाधान IMHO 99.99% प्रभावी है क्योंकि यह अभी भी अवरुद्ध readlineफ़ंक्शन का उपयोग करता है , इसलिए हम मानते हैं कि उप प्रक्रिया अच्छी है और पूर्ण लाइनों को आउटपुट करती है।

मैं समाधान में सुधार के लिए प्रतिक्रिया का स्वागत करता हूं क्योंकि मैं अभी भी अजगर के लिए नया हूं।


इस विशेष मामले में, आप पॉपेन कंस्ट्रक्टर में stderr = subprocess.STDOUT सेट कर सकते हैं, और cmd.stdout.readline () से सभी आउटपुट प्राप्त कर सकते हैं।
आरोन

अच्छा स्पष्ट उदाहरण है। Select.select () के साथ समस्या हो रही थी लेकिन इसने मेरे लिए इसे हल कर दिया।
maharvey67


0

जेएफ सेबेस्टियन के उत्तर और कई अन्य स्रोतों से काम करते हुए, मैंने एक साधारण उपप्रबंधक प्रबंधक को एक साथ रखा है। यह नॉन-ब्लॉकिंग रीडिंग प्रदान करता है, साथ ही समानांतर में कई प्रक्रियाएं चला रहा है। यह किसी भी ओएस-विशिष्ट कॉल का उपयोग नहीं करता है (जो मुझे पता है) और इस प्रकार कहीं भी काम करना चाहिए।

यह पीपीआई से उपलब्ध है, इसलिए बस pip install shelljob। उदाहरण और पूर्ण डॉक्स के लिए प्रोजेक्ट पेज देखें ।


0

संपादित करें: यह कार्यान्वयन अभी भी अवरुद्ध है। इसके बजाय JFSebastian के उत्तर का उपयोग करें ।

मैंने शीर्ष उत्तर की कोशिश की , लेकिन थ्रेड कोड का अतिरिक्त जोखिम और रखरखाव चिंताजनक था।

Io मॉड्यूल के माध्यम से खोज (और 2.6 तक सीमित), मुझे बफ़रडेडर मिला। यह मेरा थ्रेडलेस, नॉन-ब्लॉकिंग सॉल्यूशन है।

import io
from subprocess import PIPE, Popen

p = Popen(['myprogram.exe'], stdout=PIPE)

SLEEP_DELAY = 0.001

# Create an io.BufferedReader on the file descriptor for stdout
with io.open(p.stdout.fileno(), 'rb', closefd=False) as buffer:
  while p.poll() == None:
      time.sleep(SLEEP_DELAY)
      while '\n' in bufferedStdout.peek(bufferedStdout.buffer_size):
          line = buffer.readline()
          # do stuff with the line

  # Handle any remaining output after the process has ended
  while buffer.peek():
    line = buffer.readline()
    # do stuff with the line

क्या आपने कोशिश की है for line in iter(p.stdout.readline, ""): # do stuff with the line? यह आपके कोड के ब्लॉक होने पर थ्रेडलेस (सिंगल थ्रेड) और ब्लॉक होता है।
jfs

@ jf-sebastian हाँ, मैं अंततः आपके उत्तर पर लौट आया। मेरा कार्यान्वयन अभी भी कभी-कभी अवरुद्ध होता है। मैं इस मार्ग से नीचे नहीं जाने के लिए दूसरों को चेतावनी देने के लिए अपने उत्तर को संपादित करूँगा।
रोम

0

मैंने हाल ही में एक ही समस्या पर ठोकर खाई है, मुझे गैर-ब्लॉकिंग मोड में स्ट्रीम (सबप्रोसेस में टेल रन) से समय पर एक लाइन पढ़ने की आवश्यकता है मैं अगली समस्याओं से बचना चाहता था: सीपीयू को जलाना नहीं, एक बाइट द्वारा स्ट्रीम नहीं पढ़ना ( रीडलाइन की तरह), आदि

यहाँ मेरा कार्यान्वयन है https://gist.github.com/grubberr/5501e1a9760c3eab5e0a यह विंडोज़ (पोल) का समर्थन नहीं करता है, EOF को न संभालें, लेकिन यह मेरे लिए अच्छा काम करता है


धागा आधारित जवाब है नहीं cpu जला (आप मनमाने ढंग से निर्दिष्ट कर सकते हैं timeoutअपने समाधान के रूप में) और .readline()पढ़ता अधिक एक समय में एक से बाइट ( bufsize=1साधन लाइन -buffered (केवल लिखने के लिए प्रासंगिक))। आपको और क्या समस्याएं मिली हैं? लिंक-केवल उत्तर बहुत उपयोगी नहीं हैं।
jfs

0

यह सबप्रोसेस में इंटरएक्टिव कमांड चलाने के लिए एक उदाहरण है, और छद्म टर्मिनल का उपयोग करके स्टडआउट इंटरैक्टिव है। आप इसका उल्लेख कर सकते हैं: https://stackoverflow.com/a/43012138/3555925

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import os
import sys
import select
import termios
import tty
import pty
from subprocess import Popen

command = 'bash'
# command = 'docker run -it --rm centos /bin/bash'.split()

# save original tty setting then set it to raw mode
old_tty = termios.tcgetattr(sys.stdin)
tty.setraw(sys.stdin.fileno())

# open pseudo-terminal to interact with subprocess
master_fd, slave_fd = pty.openpty()

# use os.setsid() make it run in a new process group, or bash job control will not be enabled
p = Popen(command,
          preexec_fn=os.setsid,
          stdin=slave_fd,
          stdout=slave_fd,
          stderr=slave_fd,
          universal_newlines=True)

while p.poll() is None:
    r, w, e = select.select([sys.stdin, master_fd], [], [])
    if sys.stdin in r:
        d = os.read(sys.stdin.fileno(), 10240)
        os.write(master_fd, d)
    elif master_fd in r:
        o = os.read(master_fd, 10240)
        if o:
            os.write(sys.stdout.fileno(), o)

# restore tty settings back
termios.tcsetattr(sys.stdin, termios.TCSADRAIN, old_tty)

0

यह समाधान selectIO स्ट्रीम से "किसी भी उपलब्ध डेटा को पढ़ने" के लिए मॉड्यूल का उपयोग करता है। यह फ़ंक्शन प्रारंभ में डेटा उपलब्ध होने तक अवरुद्ध करता है, लेकिन फिर केवल उपलब्ध डेटा को पढ़ता है और आगे ब्लॉक नहीं करता है।

इस तथ्य को देखते हुए कि यह selectमॉड्यूल का उपयोग करता है , यह केवल यूनिक्स पर काम करता है।

कोड पूरी तरह से PEP8- अनुरूप है।

import select


def read_available(input_stream, max_bytes=None):
    """
    Blocks until any data is available, then all available data is then read and returned.
    This function returns an empty string when end of stream is reached.

    Args:
        input_stream: The stream to read from.
        max_bytes (int|None): The maximum number of bytes to read. This function may return fewer bytes than this.

    Returns:
        str
    """
    # Prepare local variables
    input_streams = [input_stream]
    empty_list = []
    read_buffer = ""

    # Initially block for input using 'select'
    if len(select.select(input_streams, empty_list, empty_list)[0]) > 0:

        # Poll read-readiness using 'select'
        def select_func():
            return len(select.select(input_streams, empty_list, empty_list, 0)[0]) > 0

        # Create while function based on parameters
        if max_bytes is not None:
            def while_func():
                return (len(read_buffer) < max_bytes) and select_func()
        else:
            while_func = select_func

        while True:
            # Read single byte at a time
            read_data = input_stream.read(1)
            if len(read_data) == 0:
                # End of stream
                break
            # Append byte to string buffer
            read_buffer += read_data
            # Check if more data is available
            if not while_func():
                break

    # Return read buffer
    return read_buffer

0

मुझे जेसी द्वारा बताई गई समस्या का भी सामना करना पड़ा और ब्रैडली , एंडी और अन्य ने "चुनिंदा" का उपयोग करके इसे हल किया लेकिन व्यस्त लूप से बचने के लिए अवरुद्ध मोड में। यह नकली डंठल के रूप में डमी पाइप का उपयोग करता है। ब्लॉक का चयन करें और स्टड या पाइप के तैयार होने की प्रतीक्षा करें। जब एक कुंजी को दबाया जाता है, तो स्टाइन सिलेक्ट को अनब्लॉक करता है और कुंजी मान को रीड (1) के साथ पुनः प्राप्त किया जा सकता है। जब एक अलग धागा पाइप को लिखता है तो पाइप चयन को अनब्लॉक करता है और इसे एक संकेत के रूप में लिया जा सकता है कि स्टड की आवश्यकता खत्म हो गई है। यहाँ कुछ संदर्भ कोड है:

import sys
import os
from select import select

# -------------------------------------------------------------------------    
# Set the pipe (fake stdin) to simulate a final key stroke
# which will unblock the select statement
readEnd, writeEnd = os.pipe()
readFile = os.fdopen(readEnd)
writeFile = os.fdopen(writeEnd, "w")

# -------------------------------------------------------------------------
def getKey():

    # Wait for stdin or pipe (fake stdin) to be ready
    dr,dw,de = select([sys.__stdin__, readFile], [], [])

    # If stdin is the one ready then read it and return value
    if sys.__stdin__ in dr:
        return sys.__stdin__.read(1)   # For Windows use ----> getch() from module msvcrt

    # Must finish
    else:
        return None

# -------------------------------------------------------------------------
def breakStdinRead():
    writeFile.write(' ')
    writeFile.flush()

# -------------------------------------------------------------------------
# MAIN CODE

# Get key stroke
key = getKey()

# Keyboard input
if key:
    # ... do your stuff with the key value

# Faked keystroke
else:
    # ... use of stdin finished

# -------------------------------------------------------------------------
# OTHER THREAD CODE

breakStdinRead()

नोट: विंडोज में यह काम करने के लिए पाइप को सॉकेट से बदलना चाहिए। मैंने इसे अभी तक आज़माया नहीं है, लेकिन इसे प्रलेखन के अनुसार काम करना चाहिए।
gonzaedu61

0

Wexpect का प्रयास करें , जो कि pexpect का विंडो विकल्प है ।

import wexpect

p = wexpect.spawn('myprogram.exe')
p.stdout.readline('.')               // regex pattern of any character
output_str = p.after()

0

यूनिक्स जैसी प्रणालियों और पायथन 3.5+ पर ऐसा ही है, os.set_blockingजो वास्तव में यही कहता है।

import os
import time
import subprocess

cmd = 'python3', '-c', 'import time; [(print(i), time.sleep(1)) for i in range(5)]'
p = subprocess.Popen(cmd, stdout=subprocess.PIPE)
os.set_blocking(p.stdout.fileno(), False)
start = time.time()
while True:
    # first iteration always produces empty byte string in non-blocking mode
    for i in range(2):    
        line = p.stdout.readline()
        print(i, line)
        time.sleep(0.5)
    if time.time() > start + 5:
        break
p.terminate()

यह आउटपुट:

1 b''
2 b'0\n'
1 b''
2 b'1\n'
1 b''
2 b'2\n'
1 b''
2 b'3\n'
1 b''
2 b'4\n'

os.set_blockingटिप्पणी के साथ :

0 b'0\n'
1 b'1\n'
0 b'2\n'
1 b'3\n'
0 b'4\n'
1 b''

-2

यहाँ एक मॉड्यूल है जो गैर-अवरुद्ध रीडिंग का समर्थन करता है और पृष्ठभूमि अजगर में लिखता है:

https://pypi.python.org/pypi/python-nonblock

एक कार्य प्रदान करता है,

नॉनब्लॉक_्रेडर, जो स्ट्रीम से डेटा पढ़ेगा, यदि उपलब्ध हो, अन्यथा एक खाली स्ट्रिंग लौटाएं (या यदि कोई स्ट्रीम दूसरी तरफ बंद है और सभी संभव डेटा पढ़ा गया है)

आप अजगर-सबप्रोसेस 2 मॉड्यूल पर भी विचार कर सकते हैं,

https://pypi.python.org/pypi/python-subprocess2

जो उपप्रोसेस मॉड्यूल में जोड़ता है। तो "subprocess.Popen" से लौटाए गए ऑब्जेक्ट पर एक अतिरिक्त विधि, runInBackground जोड़ा जाता है। यह एक धागा शुरू करता है और एक वस्तु को लौटाता है जो स्वचालित रूप से पॉपुलेटेड हो जाएगा क्योंकि स्टडआउट / स्टडर को सामान लिखा जाता है, आपके मुख्य धागे को अवरुद्ध किए बिना।

का आनंद लें!


मैं इस नॉनब्लॉक मॉड्यूल को आज़माना चाहता हूं , लेकिन मैं कुछ लिनक्स प्रक्रियाओं में अपेक्षाकृत नया हूं। वास्तव में मैं इन दिनचर्या को कैसे स्थापित करूं? मैं रास्पबेरी पी के लिए डेबियन लिनक्स का स्वाद, रास्पियन जेसी चला रहा हूं। मैंने 'sudo apt-get install nonblock' और python-nonblock की कोशिश की और दोनों को एक त्रुटि मिली - नहीं मिली। मैंने इस साइट से जिप फाइल को pypi.python.org/pypi/python-nonblock से डाउनलोड किया है , लेकिन यह नहीं जानता कि इसके साथ क्या करना है। धन्यवाद .... RDK
RDK
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.