क्या 5 जीबी की जेपीआर छवियों को डाउनलोड करने और / या सादे पाठ के 5 जीबी के रूप में आयात करने में उतना ही समय लगता है?


39

बस सोच रहा था, अभी के बाद से मैं अपने सभी चित्रों को एक सीडी से आयात कर रहा हूं जो मेरे पिताजी ने मेरे लिए जला दिया था। मैं उत्सुक था अगर 5 जीबी चित्रों ने इस तरह के स्थानान्तरण करते समय 5 जीबी पाठ के समान सटीक समय लिया। चूंकि अलग-अलग फ़ाइल स्वरूपों के साथ 'ओवरहेड' जुड़ा हो सकता है, भले ही वे संचयी रूप से एक ही आकार के हों ...

संपादित करें: यह वास्तव में एक सीडी-रोम नहीं बल्कि एक डीवीडी-आर है


11
5 गिग 5 गिग है जब तक कि नहीं।
Xavierjazz

2
उस के साथ बहस नहीं कर सकते ...
थॉमस Padron-McCarthy

35
कौन सा भारी है: एक टन ईंटें, या एक टन पंख?
ग्राहम बोरलैंड

1
एक स्पष्ट रूप से बुरे प्रश्न के रूप में इसे खारिज करने से पहले मेरा जवाब (और विभिन्न कारकों को अलग करने वाले अन्य अच्छे) देखें। 5GB 5GB हो सकता है, लेकिन जिस पाइप से डेटा यात्रा करता है उसकी शुद्धता पर फर्क पड़ता है।
डेविड स्ट्रैटन

1
@ ग्राहम: कौन सा भारी है, एक पाउंड पंख या एक पाउंड सोना? (उत्तर)
ब्लूराजा - डैनी पफ्लुगुफ़ेक्ट

जवाबों:


75

उत्तर है, यह निर्भर करता है"। निर्भर करता है कि आप "डाउनलोड" से क्या मतलब है।

यदि आप एक वेब साइट से डाउनलोड कर रहे हैं, तो कुछ साइटें स्वचालित रूप से "मक्खी पर" फ़ाइलों को संपीड़ित करती हैं, और पाठ बहुत अच्छी तरह से संपीड़ित करता है, जबकि जेपीईजी पहले से ही संकुचित है, इसलिए यह बिल्कुल भी संपीड़ित नहीं करेगा। इस मामले में, एक बड़ा अंतर होगा।

यदि आप केवल एक कंप्यूटर से दूसरे कंप्यूटर में फ़ाइलों की प्रतिलिपि बनाने के लिए कॉपी कमांड का उपयोग कर रहे हैं, तो इससे कोई अंतर नहीं पड़ेगा। हालाँकि, यदि आप किसी विशेष उपकरण को नियोजित कर रहे हैं, तो फिर, यह निर्भर करता है कि वह उपकरण स्वत: संपीड़न का उपयोग करता है या नहीं। जेपीईजी और पाठ के बीच एकमात्र अंतर फ़ाइलों को संपीड़ित करने की संभावना है।

फ़ाइल स्थानांतरण से संबंधित 'ओवरहेड' में कोई अंतर नहीं है, चाहे वह फ़ाइल कोई भी हो।


29
एक कॉपी के मामले में, यदि समग्र आकार समान है तो फाइलों की संख्या पर प्रभाव पड़ने की संभावना है क्योंकि फ़ाइल / फ़ोल्डर मेटाडेटा को स्थानांतरित करने में ओवरहेड है।
क्रिस नावा

2
@ क्रिस-नावा: हाँ, यह बहुत सच है। मैंने केवल एक ही आकार की फ़ाइलों पर विचार किया है, लेकिन आप इस बारीकियों को इंगित करने के लिए सही हैं।
हैमग

2
@DarkTemplar: इसमें मेटाडेटा शामिल है। ज्यादातर हमेशा। आमतौर पर मेटाडेटा की राशि "बाहर" संग्रहीत फ़ाइल बहुत सीमित है: फ़ाइल नाम, अनुमतियाँ और कुछ एक्सेस समय। कई फ़ाइल सिस्टम में फ़ाइल के बाहर "मनमाने ढंग से (यहां तक ​​कि बड़े) मेटा-डेटा" बाहर "स्टोर करने का विकल्प होता है, लेकिन इसका उपयोग शायद ही कभी किया जाता है।
जोकिम सॉर

4
स्थानांतरण तंत्र भी देरी का एक स्रोत हो सकता है। उदाहरण के लिए एसएमबी (विंडोज फाइल शेयरिंग) बड़ी संख्या में छोटी फाइलों को ट्रांसफर करने में बीएडी है, जबकि एनएफएस या एफटीपी एक ही फाइल सेट के लिए बहुत तेज है।
क्रिस नावा

4
मुझे आश्चर्य है कि किसी ने एंटी-वायरस को कुछ महत्वपूर्ण ओवरहेड में जोड़ने की संभावना का उल्लेख नहीं किया है। कई एंटी-वायरस एप्लिकेशन वायरस के लिए JPEG फ़ाइलों को स्कैन करते हैं, और टेक्स्ट दस्तावेज़ों को अनदेखा करते हैं। यह निश्चित रूप से योगदान कर सकता है यह कारक पर निर्भर करता है।
स्कॉट रिप्पी

17

5GB चित्रों के साथ आप कुछ हजार आकार की फ़ाइलों के बारे में बात करने की संभावना रखते हैं, प्रत्येक 3MB + कहते हैं। यदि आप 5GB पाठ फ़ाइलों को डाउनलोड करते हैं, तो आप आमतौर पर प्रत्येक फ़ाइल के बहुत छोटे होने की उम्मीद करेंगे। तो आप संभवतः परिमाण या दो अतिरिक्त फ़ाइलों (हजारों या लाखों फ़ाइलों के सैकड़ों) के आदेश के साथ काम कर रहे होंगे।

बहुत सारी छोटी फ़ाइलों की नकल करने से बड़ी फ़ाइलों में डेटा की समान मात्रा की प्रतिलिपि बनाने में अधिक समय लगता है। प्रत्येक व्यक्तिगत फ़ाइल बनाने में एक उचित ओवरहेड है।

एक बड़े पैमाने पर अंतर करने के लिए पर्याप्त नहीं है, लेकिन फिर भी एक अंतर है।


3
मुझे लगता है कि इससे बहुत फर्क पड़ सकता है। सौ 30K पाठ फ़ाइलों की प्रतिलिपि बनाना निश्चित रूप से एक 3MB फ़ाइल की प्रतिलिपि बनाने से अधिक समय ले सकता है, यह इस बात पर निर्भर करता है कि आप कहाँ और कहाँ से कॉपी कर रहे हैं।
स्टीवन नोटो

+1 असली मुद्दे को संबोधित करने के लिए। अब तक का सबसे अच्छा जवाब।
18

12

Ftp में "यह निर्भर करता है" ठीक विवरण में है।

ftp बाइनरी मोड सिर्फ एक सीधा स्थानांतरण है और इसमें 5GB का समय लगेगा।

यदि आप विंडोज से लिनक्स पर एक ftp टेक्स्ट ट्रांसफर (आश्चर्यजनक रूप से, सादे टेक्स्ट के लिए) के रूप में जा रहे हैं, तो ftp वास्तव में / r / n से / n और इसके विपरीत से लाइन एंडिंग्स को बदल देता है। स्ट्रीमिंग की जगह शायद थोड़ा ओवरहेड है, लेकिन 5GB टेक्स्ट के साथ, आपको डिस्क से लिखने के लिए डिस्क से लिन पर कम लिखना होगा क्योंकि आप प्रति वर्ण एक वर्ण छोड़ देते हैं, और लिन से जीतने के लिए अधिक जा रहा है क्योंकि आप एक वर्ण जोड़ते हैं प्रति पंक्ति।

तो, क्या यह लिनक्स पर 5GB है? या विंडोज?

एक रात के लिए पर्याप्त पैदल यात्रा, बिस्तर पर जाना!


हम एफ़टीपी कैसे पहुंचे? ओपी डीवीडी ड्राइव से एक स्थानीय ड्राइव पर कॉपी करता प्रतीत होता है?
andynormancx

शीर्षक से। 'देर रात को ट्वास और मैंने इस सवाल का जवाब दिया, न कि इसके नीचे के पैराग्राफ का। जैसा कि उनके शुरुआती पैराग्राफ में सबसे ज्यादा वोट देने वाला पोस्टर था। अब एक मीडिया से दूसरे मीडिया में कॉपी करने के लिए ...
फियास्को लैब्स

3

फ़ाइलों के साथ स्वयं से जुड़ा कोई ओवरहेड नहीं है, लेकिन कुछ स्टोरेज / ट्रांसफर सुविधाएं स्वचालित संपीड़न का समर्थन करती हैं, और इससे अंतर आ सकता है।

जब एक असम्पीडित ड्राइव करने के लिए डीवीडी से कॉपी, कोई अंतर नहीं है। संपीड़ित NTFS ड्राइव में कॉपी करते समय, पाठ JPEGs की तुलना में कम जगह लेगा।

जब संपीड़न का उपयोग करने वाले HTTP सर्वर से डाउनलोड किया जाता है, तो पाठ को डाउनलोड करने में कम समय लगेगा। लेकिन अगर सर्वर संपीड़न का उपयोग नहीं करता है, तो कोई अंतर नहीं होगा।

इसके अलावा, ओवरहेड के बारे में बात करते हुए, एक लाख छोटी फाइलें 5GB कुल आकार में अधिक [वास्तविक] स्थान लेगी और आमतौर पर एक एकल 5GB फ़ाइल की तुलना में कॉपी करने के लिए अधिक समय, क्योंकि 5GB में फ़ाइल नाम, दिनांक और अन्य मेटाडेटा को संग्रहीत करने के लिए आवश्यक स्थान शामिल नहीं है ।


3

इसका मतलब अन्य उत्तरों के अतिरिक्त है जो सम्पीडन आदि को संबोधित करते हैं, जो दक्षता और डाउनलोड समय को प्रभावित करने वाले कारकों के रूप में हैं।

एक बिंदु जिसका उल्लेख अभी तक नहीं किया गया है वह पैकेट दक्षता है। मुझे संदेह है कि अधिकांश लोग यहां तक ​​आ गए हैं, इसलिए यहां पृष्ठभूमि का एक संक्षिप्त सा है।

वेब सेवाओं का उपयोग करने से पहले, हम उनका उपयोग करने और अधिक "मानक" डेटाबेस कनेक्शन (जैसे ओलेडब, सिस्टम.डाटा.सक्कलकेंट, जेडडीबीसी, आदि) का उपयोग करने के बीच दक्षता में अंतर जानना चाहते थे। हमने अपने गुरु को अंतर को देखने के लिए पूरे नेटवर्क पर डेटा स्ट्रीम ट्रैक करने के लिए पैकेट स्निफ़र्स रखा था।

हमें उम्मीद थी कि अन्य प्रकार के कनेक्शन के द्विआधारी प्रारूप के कारण वेब सेवाओं का उपयोग करना कम कुशल होगा, और डेटा का वर्णन करने के लिए उपयोग किए गए एक्सएमएल टैग के अतिरिक्त ओवरहेड।

हमने जो पाया वह यह था कि वेब सेवाएँ कई मामलों में अधिक कुशल थीं, कम से कम हमारे नेटवर्क पर। अंतर यह था कि जब बाइनरी डेटा ट्रांसफर कर रहे थे, पैकेट के भीतर कुछ बाइट्स खाली थे, लेकिन टेक्स्ट डेटा भेजते समय, पैकेट का उपयोग अधिक कुशलता से किया गया था।

हमने इसे दिलचस्प पाया, और विभिन्न प्रकार की फ़ाइलों को स्थानांतरित करते समय इसे आज़माया, और पाया कि एक नियम के रूप में, नेटवर्क पर जाने वाला सादा पाठ हमेशा प्रत्येक पैकेट में उपलब्ध 100% बिट्स का उपयोग करता था, जहां बाइनरी ट्रांसफर में अक्सर अप्रयुक्त बिट्स होते थे। ऐसा क्यों है, मैं आपको नहीं बता सकता, लेकिन कई प्रयोगों ने इसे बोर कर दिया।

प्रश्न पर कई टिप्पणियां इसे स्पष्ट रूप से त्रुटिपूर्ण प्रश्न के रूप में खारिज करने के लिए लग रही थीं, लेकिन यह वास्तव में नहीं है। हालांकि डेटा की मात्रा समान रहती है, पाइप की दक्षता, साथ ही मायने रखती है।

क्योंकि मैं उन उपमाओं का विरोध नहीं कर सकता जो एक गैर-आईटी व्यक्ति समझेगा:

एक किराने की दुकान में एक फ्रीजर में एक एकल शेल्फ में अंतरिक्ष की मात्रा होती है, फिर भी आप एक शेल्फ पर आइसक्रीम के अधिक गैलन को फिट कर सकते हैं यदि कंटेनर आपके मुकाबले गोल हैं तो वे गोल होने के कारण बर्बाद हुए स्थान के कारण हो सकते हैं। कंटेनर। हमारे परीक्षण, हालांकि पहली बार में सहज ज्ञान युक्त थे, हमें बताया कि किसी भी किराने की दुकान के स्टॉकर ने हमें क्या बताया हो सकता है।


2
डेटाबेस क्या शामिल था? विभिन्न RDBMS दूसरों की तुलना में कम या ज्यादा "नेटवर्क कुशल" हैं। आपने कनेक्शन स्थापना या केवल डेटासेट डेटा से मापा है? मैं वास्तव में उत्सुक हूं।
फैब्रिकियो अराउजो

1

पारंपरिक ज्ञान कहता है कि 5GB 5GB है। हालाँकि, कुछ परिदृश्य ऐसे हैं जहाँ ये दोनों एक जैसे नहीं हैं; यह एक अंतर है कि फाइलों के डेटा को संरचित कैसे किया जाता है।

सबसे पहले, जेपीईजी को संपीड़ित किया जाता है। छवि को देखने के लिए, फ़ाइल को पहले असम्पीडित होना चाहिए, और इस तरह की छवियों के भारी बहुमत के लिए आपके पास ऐसा करने के लिए पूरी फ़ाइल होनी चाहिए। प्रगतिशील जेपीईजी हैं जो इसे लोड किए जाने के बाद एक पुनरावृत्त रूप से तेज तस्वीर प्रदान करते हैं, लेकिन वे शायद ही कभी ऐसे युग में उपयोग किए जाते हैं जहां DSL और अन्य उच्च गति कनेक्शन बहुत आम हैं। दूसरी ओर, पाठ कमोबेश सुव्यवस्थित है; जैसे ही आपके पास एक बाइट (या दो या चार, यूटीएफ एन्कोडिंग के आधार पर इस्तेमाल किया जाता है), आप उस चरित्र को दिखा सकते हैं। यहां तक ​​कि सबसे पुराना डेटा ट्रांसफर मैकेनिज्म टेक्स्ट को तेजी से लोड कर सकता है जितना आप इसे पढ़ सकते हैं। तो, 5GB JPEG में 5GB टेक्स्ट फ़ाइल की तुलना में कुछ प्रदर्शित करने में सक्षम होने में अधिक समय लगेगा।

दूसरा, इसलिए भी कि JPEGs संपीड़ित हैं, वे ब्राउज़र या फ़ाइल-ट्रांसफर प्रोग्राम / प्रोटोकॉल के साथ अच्छी तरह से काम नहीं करते हैं जो ट्रांसमिशन से पहले बड़ी मात्रा में डेटा को संपीड़ित करते हैं। आप इसे ज़िप फ़ाइल देख कर देख सकते हैं; जब तक दूसरी ज़िप प्रक्रिया को अधिक कॉम्पैक्ट करने (इसे धीमा करने) के लिए कॉन्फ़िगर नहीं किया गया था, आपको आकार में बहुत अंतर नहीं दिखाई देगा। इसका मतलब है कि इन उपकरणों में से एक का उपयोग करते समय, 5 जीबी 5 जीबी नहीं है; जेपीईजी अभी भी लगभग 5GB होने जा रहे हैं, लेकिन पाठ को संपीड़ित किया जा सकता है, शायद 1GB या उससे कम हो। यदि आप 5GB बिटमैप फ़ाइलों की तुलना 5GB सादे पाठ से कर रहे हैं तो तुलना बहुत करीब होगी।

हालाँकि, बस एनटीपी, एफ़टीपी या एचटीटीपी का उपयोग करते हुए एक कंप्यूटर से दूसरे कंप्यूटर पर 5 जीबी की फाइलें बिना किसी संपीड़न या "डोनलोड बूस्टर" तंत्र का उपयोग किए चलती हैं, कुल मिलाकर लगभग एक ही समय लगेगा; कोई भी अंतर प्रत्येक हस्तांतरण के दौरान किसी भी दूसरे स्थान पर नेटवर्क ट्रैफ़िक के स्तर में अंतर के परिणामस्वरूप होगा।


मैंने कभी भी जेपीएल के बारे में नहीं सुना है। क्या आप क्रमिक रूप से GIF / PNG के साथ प्रगतिशील JPG का सामना कर रहे हैं?
शराबी

"प्रोग्रेसिव जेपीईजी" वेरिएंट एक इंटरलेस्ड फॉर्मेट है, जो इंटरलेस्ड जीआईएफ / पीएनजी की तरह है। जेपीईजी के लिए "प्रगतिशील" शब्द आईएमओ को भ्रमित कर रहा है, क्योंकि "प्रगतिशील स्कैन", "720p (प्रगतिशील)" और "1080p" जैसे प्रसिद्ध शब्द हैं। उन सभी शब्दों से संकेत मिलता है कि एक पूरे फ्रेम को दो इंटरलेस्ड पासों के बजाय एक पास में पूरी तरह से तैयार किया गया है, जो "प्रगतिशील" जेपीईजी प्रदर्शन व्यवहार के बिल्कुल विपरीत है।
19

1
लेकिन यह नहीं है कि प्रगतिशील जेपीईजी कैसे काम करता है। यह GIF या PNG (या उस मामले के लिए डीवीडी वीडियो) की तरह एक interlaced / interleaved प्रारूप नहीं है, यह DCT ब्लॉकों का पुनरावृत्त शोधन है। इन-प्रोग्रेसिव प्रोग्रेसिव JPEG में पूर्ण पिक्सेल कवरेज है - यह केवल कम बिटरेट पर है। JPEG GIF या PNG जैसी स्कैनलाइन में चीजों से निपटता नहीं है, यह पिक्सेल के वर्ग समूहों के संग्रह के रूप में उनके साथ काम करता है।
शराबी

टमाटर, टमाटर। छवि को मूल रूप से पूर्ण छवि डेटा के एक सबसेट का उपयोग करके प्रदर्शित किया जाता है जो जल्दी में आता है, फिर इसे बाकी हिस्सों के साथ परिष्कृत किया जाता है। वह मेरी बात थी। चाहे वह लाइनें हों या ब्लॉक यह एक बहु-पास लोडिंग शैली है जैसा कि एक-पास के विपरीत है।
कीथ्स

यह न केवल एक मामूली शब्दावली अंतर है जैसा कि आप स्पष्ट रूप से करते हैं, लेकिन यह बिना किसी अच्छे कारण के एक ईंट की दीवार के तर्क में बदल रहा है। मैं केवल आपके उत्तर के लिए एक छोटे से संपादन का सुझाव देने की कोशिश कर रहा था, न कि एक पिसिंग मैच में जाने की कोशिश कर रहा था।
शराबी

0

ऑप्टिकल ड्राइव से 5 जीबी समान होना चाहिए - अगर जेपीजी या पाठ। नेट के माध्यम से स्थानांतरित, मुझे मॉडेम के समय को याद है, जो हार्डवेयर पर निर्भर करता था, एक बिलिन संपीड़न, ताकि पहले से ही संकुचित 5 जीबी जेपीजी आगे संपीड़ित न हो, लेकिन 5 जीबी के एक पाठ में सामान्य रूप से बहुत अधिक क्षमता होगी। संपीड़न।

तो यह हार्डड्राइव के लिए उपयोग क्यों नहीं किया जाता है? शायद आपको हार्डड्राइव पर बहुत अधिक तर्क की आवश्यकता होगी, हार्डड्राइव को बहुत अधिक गर्म करने के लिए संपीड़न बहुत कमजोर होता है, और यदि आवश्यक हो तो डेटा को स्पष्ट रूप से संपीड़ित करना बहुत आसान है? शायद यह कुछ ड्राइव के लिए मौजूद है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.