दो बार स्ट्रीम पढ़ें


127

आप एक ही इनपुटस्ट्रीम को दो बार कैसे पढ़ते हैं? क्या इसे किसी तरह कॉपी करना संभव है?

मुझे वेब से एक छवि प्राप्त करने की आवश्यकता है, इसे स्थानीय रूप से सहेजें और फिर सहेजी गई छवि को वापस करें। मैंने केवल यह सोचा कि डाउनलोड की गई सामग्री के लिए एक नई स्ट्रीम शुरू करने के बजाय उसी स्ट्रीम का उपयोग करना अधिक तेज़ होगा और फिर इसे फिर से पढ़ें।


1
शायद चिह्न और रीसेट का उपयोग करें
व्योवस्कैल शिलकिन

जवाबों:


113

आप org.apache.commons.io.IOUtils.copyInputStream की सामग्री को बाइट सरणी में कॉपी करने के लिए उपयोग कर सकते हैं , और फिर बार-बार ByteArrayInputStream का उपयोग करके बाइट सरणी से पढ़ सकते हैं। उदाहरण के लिए:

ByteArrayOutputStream baos = new ByteArrayOutputStream();
org.apache.commons.io.IOUtils.copy(in, baos);
byte[] bytes = baos.toByteArray();

// either
while (needToReadAgain) {
    ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
    yourReadMethodHere(bais);
}

// or
ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
while (needToReadAgain) {
    bais.reset();
    yourReadMethodHere(bais);
}

1
मुझे लगता है कि यह एकमात्र वैध समाधान है क्योंकि सभी प्रकारों के लिए चिह्न समर्थित नहीं है।
वार्पजीत

3
@Paul Grime: IOUtils.toByeArray आंतरिक रूप से कॉपी विधि को भी अंदर से कॉल करता है।
अंकित

4
जैसा कि @Ankit कहते हैं, यह समाधान मेरे लिए मान्य नहीं है, क्योंकि इनपुट आंतरिक रूप से पढ़ा जाता है और इसका पुन: उपयोग नहीं किया जा सकता है।
Xtreme बाइकर

30
मुझे पता है कि यह टिप्पणी समय से बाहर है, लेकिन, यहां पहले विकल्प में, यदि आप इनपुटस्ट्रीम को बाइट सरणी के रूप में पढ़ते हैं, तो क्या इसका मतलब यह नहीं है कि आप सभी डेटा को मेमोरी में लोड कर रहे हैं? जो एक बड़ी समस्या हो सकती है यदि आप बड़ी फ़ाइलों की तरह कुछ लोड कर रहे हैं?
jaxkodex

2
एक कॉल में बाइट सरणी प्राप्त करने के लिए IOUtils.toByteArray (InputStream) का उपयोग किया जा सकता है।
उपयोगी

30

इनपुटस्ट्रीम कहां से आ रही है, इसके आधार पर, आप इसे रीसेट करने में सक्षम नहीं हो सकते हैं। आप अगर जांच कर सकते हैं mark()और reset()का उपयोग कर समर्थन कर रहे markSupported()

यदि ऐसा है, तो आप reset()शुरुआत में वापस आने के लिए InputStream पर कॉल कर सकते हैं । यदि नहीं, तो आपको फिर से स्रोत से InputStream पढ़ने की आवश्यकता है।


1
InputStream 'मार्क' का समर्थन नहीं करता है - आप आईएस पर निशान लगा सकते हैं, लेकिन यह कुछ नहीं करता है। इसी तरह, आईएस पर रीसेट कॉल करना एक अपवाद को फेंक देगा।
अयाहुस्का

4
@ayahuasca InputStreamउपवर्गों का BufferedInputStreamसमर्थन 'निशान' करता है
दिमित्री बोगदानोविच

10

यदि आपका InputStreamसमर्थन चिह्न का उपयोग कर रहा है, तो आप mark()अपना इनपुटस्ट्रीम और फिर reset()यह कर सकते हैं । यदि आपका InputStremनिशान का समर्थन नहीं करता है java.io.BufferedInputStream, तो आप वर्ग का उपयोग कर सकते हैं , इसलिए आप अपनी स्ट्रीम को BufferedInputStreamइस तरह से एम्बेड कर सकते हैं

    InputStream bufferdInputStream = new BufferedInputStream(yourInputStream);
    bufferdInputStream.mark(some_value);
    //read your bufferdInputStream 
    bufferdInputStream.reset();
    //read it again

1
एक बफर इनपुट स्ट्रीम केवल बफर साइज़ को वापस चिह्नित कर सकती है, इसलिए यदि स्रोत फिट नहीं होता है, तो आप शुरुआत में वापस नहीं जा सकते।
एल। ब्लैंक

@ L.Blanc माफ करना, लेकिन यह सही नहीं लगता। एक नज़र डालें BufferedInputStream.fill(), "ग्रो बफर" खंड है, जहां नए बफर आकार की तुलना केवल marklimitऔर के लिए की जाती है MAX_BUFFER_SIZE
यूजीन 82

8

आप PushbackInputStream के साथ इनपुट स्ट्रीम लपेट सकते हैं। PushbackInputStream अपठित करने की अनुमति देता है (" राइट बैक ") बाइट्स जो पहले से ही पढ़े गए थे, इसलिए आप इस तरह कर सकते हैं:

public class StreamTest {
  public static void main(String[] args) throws IOException {
    byte[] bytes = new byte[] { 1, 2, 3, 4, 5, 6, 7, 8, 9 };

    InputStream originalStream = new ByteArrayInputStream(bytes);

    byte[] readBytes = getBytes(originalStream, 3);
    printBytes(readBytes); // prints: 1 2 3

    readBytes = getBytes(originalStream, 3);
    printBytes(readBytes); // prints: 4 5 6

    // now let's wrap it with PushBackInputStream

    originalStream = new ByteArrayInputStream(bytes);

    InputStream wrappedStream = new PushbackInputStream(originalStream, 10); // 10 means that maximnum 10 characters can be "written back" to the stream

    readBytes = getBytes(wrappedStream, 3);
    printBytes(readBytes); // prints 1 2 3

    ((PushbackInputStream) wrappedStream).unread(readBytes, 0, readBytes.length);

    readBytes = getBytes(wrappedStream, 3);
    printBytes(readBytes); // prints 1 2 3


  }

  private static byte[] getBytes(InputStream is, int howManyBytes) throws IOException {
    System.out.print("Reading stream: ");

    byte[] buf = new byte[howManyBytes];

    int next = 0;
    for (int i = 0; i < howManyBytes; i++) {
      next = is.read();
      if (next > 0) {
        buf[i] = (byte) next;
      }
    }
    return buf;
  }

  private static void printBytes(byte[] buffer) throws IOException {
    System.out.print("Reading stream: ");

    for (int i = 0; i < buffer.length; i++) {
      System.out.print(buffer[i] + " ");
    }
    System.out.println();
  }


}

कृपया ध्यान दें कि PushbackInputStream बाइट्स के आंतरिक बफर को संग्रहीत करता है इसलिए यह वास्तव में मेमोरी में एक बफर बनाता है जो बाइट्स को "वापस लिखा गया" रखता है।

इस दृष्टिकोण को जानने के बाद हम आगे जा सकते हैं और इसे FilterInputStream के साथ जोड़ सकते हैं। FilterInputStream एक प्रतिनिधि के रूप में मूल इनपुट स्ट्रीम संग्रहीत करता है। यह नई कक्षा परिभाषा बनाने की अनुमति देता है जो मूल डेटा को " अपठित " करने की अनुमति देता है । इस वर्ग की परिभाषा निम्नलिखित है:

public class TryReadInputStream extends FilterInputStream {
  private final int maxPushbackBufferSize;

  /**
  * Creates a <code>FilterInputStream</code>
  * by assigning the  argument <code>in</code>
  * to the field <code>this.in</code> so as
  * to remember it for later use.
  *
  * @param in the underlying input stream, or <code>null</code> if
  *           this instance is to be created without an underlying stream.
  */
  public TryReadInputStream(InputStream in, int maxPushbackBufferSize) {
    super(new PushbackInputStream(in, maxPushbackBufferSize));
    this.maxPushbackBufferSize = maxPushbackBufferSize;
  }

  /**
   * Reads from input stream the <code>length</code> of bytes to given buffer. The read bytes are still avilable
   * in the stream
   *
   * @param buffer the destination buffer to which read the data
   * @param offset  the start offset in the destination <code>buffer</code>
   * @aram length how many bytes to read from the stream to buff. Length needs to be less than
   *        <code>maxPushbackBufferSize</code> or IOException will be thrown
   *
   * @return number of bytes read
   * @throws java.io.IOException in case length is
   */
  public int tryRead(byte[] buffer, int offset, int length) throws IOException {
    validateMaxLength(length);

    // NOTE: below reading byte by byte instead of "int bytesRead = is.read(firstBytes, 0, maxBytesOfResponseToLog);"
    // because read() guarantees to read a byte

    int bytesRead = 0;

    int nextByte = 0;

    for (int i = 0; (i < length) && (nextByte >= 0); i++) {
      nextByte = read();
      if (nextByte >= 0) {
        buffer[offset + bytesRead++] = (byte) nextByte;
      }
    }

    if (bytesRead > 0) {
      ((PushbackInputStream) in).unread(buffer, offset, bytesRead);
    }

    return bytesRead;

  }

  public byte[] tryRead(int maxBytesToRead) throws IOException {
    validateMaxLength(maxBytesToRead);

    ByteArrayOutputStream baos = new ByteArrayOutputStream(); // as ByteArrayOutputStream to dynamically allocate internal bytes array instead of allocating possibly large buffer (if maxBytesToRead is large)

    // NOTE: below reading byte by byte instead of "int bytesRead = is.read(firstBytes, 0, maxBytesOfResponseToLog);"
    // because read() guarantees to read a byte

    int nextByte = 0;

    for (int i = 0; (i < maxBytesToRead) && (nextByte >= 0); i++) {
      nextByte = read();
      if (nextByte >= 0) {
        baos.write((byte) nextByte);
      }
    }

    byte[] buffer = baos.toByteArray();

    if (buffer.length > 0) {
      ((PushbackInputStream) in).unread(buffer, 0, buffer.length);
    }

    return buffer;

  }

  private void validateMaxLength(int length) throws IOException {
    if (length > maxPushbackBufferSize) {
      throw new IOException(
        "Trying to read more bytes than maxBytesToRead. Max bytes: " + maxPushbackBufferSize + ". Trying to read: " +
        length);
    }
  }

}

इस वर्ग के दो तरीके हैं। मौजूदा बफ़र में पढ़ने के लिए एक (डिफिनिटेशन public int read(byte b[], int off, int len)इनपुटस्ट्रीम क्लास की कॉलिंग के अनुरूप है )। दूसरा जो नया बफर लौटाता है (यह अधिक प्रभावी हो सकता है यदि बफर का आकार अज्ञात है)।

अब देखते हैं कि हमारी कक्षा क्या है:

public class StreamTest2 {
  public static void main(String[] args) throws IOException {
    byte[] bytes = new byte[] { 1, 2, 3, 4, 5, 6, 7, 8, 9 };

    InputStream originalStream = new ByteArrayInputStream(bytes);

    byte[] readBytes = getBytes(originalStream, 3);
    printBytes(readBytes); // prints: 1 2 3

    readBytes = getBytes(originalStream, 3);
    printBytes(readBytes); // prints: 4 5 6

    // now let's use our TryReadInputStream

    originalStream = new ByteArrayInputStream(bytes);

    InputStream wrappedStream = new TryReadInputStream(originalStream, 10);

    readBytes = ((TryReadInputStream) wrappedStream).tryRead(3); // NOTE: no manual call to "unread"(!) because TryReadInputStream handles this internally
    printBytes(readBytes); // prints 1 2 3

    readBytes = ((TryReadInputStream) wrappedStream).tryRead(3); 
    printBytes(readBytes); // prints 1 2 3

    readBytes = ((TryReadInputStream) wrappedStream).tryRead(3);
    printBytes(readBytes); // prints 1 2 3

    // we can also call normal read which will actually read the bytes without "writing them back"
    readBytes = getBytes(wrappedStream, 3);
    printBytes(readBytes); // prints 1 2 3

    readBytes = getBytes(wrappedStream, 3);
    printBytes(readBytes); // prints 4 5 6

    readBytes = ((TryReadInputStream) wrappedStream).tryRead(3); // now we can try read next bytes
    printBytes(readBytes); // prints 7 8 9

    readBytes = ((TryReadInputStream) wrappedStream).tryRead(3); 
    printBytes(readBytes); // prints 7 8 9


  }



}

5

आप के एक कार्यान्वयन उपयोग कर रहे हैं InputStream, तो आप का परिणाम जाँच कर सकते हैं InputStream#markSupported()कि आपको बता या नहीं, आप विधि का उपयोग कर सकते हैं mark()/ reset()

यदि आप पढ़ते समय स्ट्रीम को चिह्नित कर सकते हैं, तो reset()शुरू करने के लिए वापस जाने के लिए कॉल करें ।

यदि आप नहीं कर सकते हैं तो आपको फिर से एक स्ट्रीम खोलना होगा।

एक और उपाय यह होगा कि इनपुटस्ट्रीम को बाइट ऐरे में परिवर्तित किया जाए, फिर एरे पर अधिक से अधिक समय के लिए जरूरत पड़ने पर पुनरावृति करें। आप इस पोस्ट में कई समाधान पा सकते हैं इनपुट इनपुटस्ट्रीम को जावा में बाइट सरणी में 3 पार्टी लिबास का उपयोग करके या नहीं। सावधानी, यदि पठन सामग्री बहुत बड़ी है, तो आप कुछ स्मृति समस्याओं का अनुभव कर सकते हैं।

अंत में, यदि आपकी आवश्यकता छवि पढ़ने की है, तो उपयोग करें:

BufferedImage image = ImageIO.read(new URL("http://www.example.com/images/toto.jpg"));

उपयोग ImageIO#read(java.net.URL)करने से आप कैश का उपयोग कर सकते हैं।


1
उपयोग करते समय चेतावनी का एक शब्द ImageIO#read(java.net.URL): कुछ वेबसर्वर और सीडीएन नंगे कॉल को अस्वीकार कर सकते हैं (अर्थात उपयोगकर्ता एजेंट के बिना जो सर्वर को विश्वास दिलाता है कि कॉल वेब ब्राउज़र से आता है) ImageIO#read। उस स्थिति में, URLConnection.openConnection()उपयोगकर्ता एजेंट को उस कनेक्शन पर सेट करने के लिए + ImageIO.read (InputStream) का उपयोग करके, अधिकांश समय, चाल चलेगी।
क्लिंट ईस्टवुड

InputStreamएक इंटरफेस नहीं है
ब्राइस

3

कैसा रहेगा:

if (stream.markSupported() == false) {

        // lets replace the stream object
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        IOUtils.copy(stream, baos);
        stream.close();
        stream = new ByteArrayInputStream(baos.toByteArray());
        // now the stream should support 'mark' and 'reset'

    }

5
यह एक भयानक विचार है। आपने पूरी स्ट्रीम सामग्री को स्मृति में रख दिया।
नील्स डौकेट

3

मेमोरी में सभी डेटा को लोड करने से बचने के लिएInputStream दो में विभाजन के लिए , और फिर उन्हें स्वतंत्र रूप से संसाधित करें:

  1. OutputStreamठीक है, की एक जोड़ी बनाएँ :PipedOutputStream
  2. प्रत्येक PipedOutputStream को PipedInputStream से कनेक्ट करें, ये PipedInputStreamलौटे हैं InputStream
  3. सोर्सिंग InputStream को केवल बनाए गए से कनेक्ट करें OutputStream। इसलिए, सब कुछ इसे सोर्सिंग से पढ़ा InputStream, दोनों में लिखा जाएगा OutputStream। इसे लागू करने की आवश्यकता नहीं है, क्योंकि यह पहले से ही किया गया है TeeInputStream(commons.io)।
  4. एक अलग धागे के भीतर पूरे सोर्सिंग इनपुटस्ट्रीम को पढ़ें, और स्पष्ट रूप से इनपुट डेटा को लक्ष्य इनपुटस्ट्रीम में स्थानांतरित किया जाता है।

    public static final List<InputStream> splitInputStream(InputStream input) 
        throws IOException 
    { 
        Objects.requireNonNull(input);      
    
        PipedOutputStream pipedOut01 = new PipedOutputStream();
        PipedOutputStream pipedOut02 = new PipedOutputStream();
    
        List<InputStream> inputStreamList = new ArrayList<>();
        inputStreamList.add(new PipedInputStream(pipedOut01));
        inputStreamList.add(new PipedInputStream(pipedOut02));
    
        TeeOutputStream tout = new TeeOutputStream(pipedOut01, pipedOut02);
    
        TeeInputStream tin = new TeeInputStream(input, tout, true);
    
        Executors.newSingleThreadExecutor().submit(tin::readAllBytes);  
    
        return Collections.unmodifiableList(inputStreamList);
    }
    

भस्म होने के बाद इनपुटस्ट्रीम बंद करने के लिए जागरूक रहें, और चलने वाले धागे को बंद करें: TeeInputStream.readAllBytes()

मामले में, आपको इसेInputStream केवल दो के बजाय कई में विभाजित करने की आवश्यकता है । कोड को TeeOutputStreamअपने स्वयं के कार्यान्वयन के लिए वर्ग के पिछले टुकड़े में बदलें , जो कि एक एंप्लायज़ करेगा List<OutputStream>और OutputStreamइंटरफ़ेस को ओवरराइड करेगा :

public final class TeeListOutputStream extends OutputStream {
    private final List<? extends OutputStream> branchList;

    public TeeListOutputStream(final List<? extends OutputStream> branchList) {
        Objects.requireNonNull(branchList);
        this.branchList = branchList;
    }

    @Override
    public synchronized void write(final int b) throws IOException {
        for (OutputStream branch : branchList) {
            branch.write(b);
        }
    }

    @Override
    public void flush() throws IOException {
        for (OutputStream branch : branchList) {
            branch.flush();
        }
    }

    @Override
    public void close() throws IOException {
        for (OutputStream branch : branchList) {
            branch.close();
        }
    }
}

कृपया, क्या आप चरण 4 को थोड़ा और समझा सकते हैं? हमें मैन्युअल रूप से पढ़ना क्यों ट्रिगर करना है? क्यों किसी भी पढ़े हुए पाइपइंटरस्ट्रीम का स्रोत श्रोतस्ट्रीम की रीडिंग को ट्रिगर नहीं करता है? और हम ऐसा क्यों करते हैं?
मित्राल्वन Кулешов

2

इनपुटस्ट्रीम को बाइट्स में बदलें और फिर इसे सेवफाइल फंक्शन में पास करें जहाँ आप इनपुटस्ट्रीम में इकट्ठा होते हैं। मूल फ़ंक्शन में भी अन्य कार्यों के लिए उपयोग करने के लिए बाइट्स का उपयोग करें


5
मैं इस पर बुरा विचार कहता हूं, परिणामस्वरूप सरणी बहुत बड़ी हो सकती है और स्मृति के उपकरण को लूट लेगी।
केविन पार्कर

0

यदि कोई स्प्रिंग बूट ऐप में चल रहा है, और आप एक प्रतिक्रिया बॉडी पढ़ना चाहते हैं RestTemplate(यही वजह है कि मैं दो बार स्ट्रीम पढ़ना चाहता हूं), ऐसा करने का एक साफ (एर) तरीका है।

सबसे पहले, आपको StreamUtilsस्ट्रिंग को स्ट्रीम कॉपी करने के लिए स्प्रिंग का उपयोग करने की आवश्यकता है :

String text = StreamUtils.copyToString(response.getBody(), Charset.defaultCharset()))

लेकिन वह सब नहीं है। आपको एक अनुरोध कारखाने का उपयोग करने की भी आवश्यकता है जो आपके लिए स्ट्रीम को बफर कर सकता है, जैसे:

ClientHttpRequestFactory factory = new BufferingClientHttpRequestFactory(new SimpleClientHttpRequestFactory());
RestTemplate restTemplate = new RestTemplate(factory);

या, यदि आप कारखाने की फलियों का उपयोग कर रहे हैं, तो (यह कोटलिन है, लेकिन फिर भी):

@Bean
@Scope(ConfigurableBeanFactory.SCOPE_PROTOTYPE)
fun createRestTemplate(): RestTemplate = RestTemplateBuilder()
  .requestFactory { BufferingClientHttpRequestFactory(SimpleClientHttpRequestFactory()) }
  .additionalInterceptors(loggingInterceptor)
  .build()

स्रोत: https://objectpartners.com/2018/03/01/log-your-resttemplate-request-and-response-without-destroying-the-body/


0

यदि आप http कॉल करने के लिए RestTemplate का उपयोग कर रहे हैं तो बस एक इंटरसेप्टर जोड़ें। प्रतिक्रिया बॉडी को क्लायंटहॉटप्रोस्पेन्स के कार्यान्वयन द्वारा कैश किया जाता है। अब इनपुटस्ट्रीम को रिस्पोंस से उतने ही बार प्राप्त किया जा सकता है जितनी हमें जरूरत है

ClientHttpRequestInterceptor interceptor =  new ClientHttpRequestInterceptor() {

            @Override
            public ClientHttpResponse intercept(HttpRequest request, byte[] body,
                    ClientHttpRequestExecution execution) throws IOException {
                ClientHttpResponse  response = execution.execute(request, body);

                  // additional work before returning response
                  return response 
            }
        };

    // Add the interceptor to RestTemplate Instance 

         restTemplate.getInterceptors().add(interceptor); 
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.