कुछ घर में भंडारण के बारे में सच्चाई है, या उद्यम भंडारण इतना महंगा क्यों है?
उपभोक्ता हार्ड ड्राइव अंतरिक्ष के बड़े संस्करणों की पेशकश करते हैं ताकि यहां तक कि सबसे समझदार उपयोगकर्ता * खांसी * स्ट्रीमिंग मीडिया * खांसी * कई टेराबाइट्स के संग्रह को स्टोर करने के लिए पर्याप्त खरीद सकें। वास्तव में, डिस्क की क्षमता अब कुछ दशकों से सिलिकॉन पर ट्रांजिस्टर की गिनती की तुलना में तेजी से बढ़ रही है।
'एंटरप्राइज' भंडारण कुछ अधिक जटिल मुद्दा है क्योंकि डेटा में प्रदर्शन और अखंडता आवश्यकताएं हैं जो कुछ हद तक अधिक भारी दृष्टिकोण को निर्देशित करती हैं। हार्डवेयर विफलता की स्थिति में डेटा की उपलब्धता की कुछ गारंटी होनी चाहिए और इसे बड़ी संख्या में उपयोगकर्ताओं के साथ साझा करना पड़ सकता है, जो एकल उपयोगकर्ता की तुलना में कई अधिक पढ़ने / लिखने के अनुरोध उत्पन्न करेगा।
इस समस्या का तकनीकी समाधान उपभोक्ता भंडारण समाधानों की तुलना में कई गुना अधिक महंगा हो सकता है। उन्हें शारीरिक रखरखाव की भी आवश्यकता होती है; बैकअप लिया जाना चाहिए और अक्सर ऑफ-साइट संग्रहीत किया जाता है ताकि आग डेटा को नष्ट न करें। यह प्रक्रिया चल रही लागत को जोड़ती है।
प्रदर्शन
आपके 1 टीबी उपभोक्ता या यहां तक कि पास-लाइन ड्राइव पर आपके पास सिर्फ एक सिर है। डिस्क 7200 RPM, या 120 क्रांतियों प्रति सेकंड पर घूमती है। इसका मतलब है कि आप सिद्धांत रूप में प्रति सेकंड सबसे अधिक 120 यादृच्छिक-पहुंच I / O संचालन प्राप्त कर सकते हैं * और व्यवहार में कुछ हद तक कम है। इस प्रकार, 1TB वॉल्यूम पर एक बड़ी फ़ाइल की प्रतिलिपि बनाना अपेक्षाकृत धीमा है।
14x 72GB डिस्क के साथ एक डिस्क ऐरे पर, आपके पास 15,000 आरपीएम या प्रति सेकंड लगभग 250 क्रांतियों पर जाने वाले डिस्क हैं (कहते हैं)। यह आपको सैद्धांतिक रूप से अधिकतम 3,500 यादृच्छिक I / O संचालन प्रति सेकंड * (फिर से, व्यवहार में कुछ हद तक कम) देता है। फाइल कॉपी के समान अन्य सभी चीजें कई गुना तेज होंगी।
*
डिस्क की प्रति क्रांति एक से अधिक रैंडम एक्सेस प्राप्त कर सकती है यदि रीड्स की ज्यामिति ड्राइव को हेड्स को स्थानांतरित करने की अनुमति देती है और डिस्क के एक क्रांति के भीतर उपलब्ध होने वाले सेक्टर को पढ़ती है। यदि डिस्क एक्सेस व्यापक रूप से छितरी हुई थी, तो आप संभवतः एक से कम औसत करेंगे। जहां एक डिस्क सरणी एक धारीदार (नीचे देखें) लेआउट में स्वरूपित होती है, आपको अधिकांश परिस्थितियों में डिस्क की प्रति क्रांति अधिकतम एक पट्टी पढ़ने को मिलेगी और (RAID नियंत्रक के आधार पर) संभवत: औसत से एक से कम।
7200 RPM 1TB ड्राइव संभवतः अनुक्रमिक I / O पर यथोचित रूप से त्वरित होगा। एक धारीदार योजना (RAID-0, RAID-5, RAID-10 आदि) में स्वरूपित डिस्क सरणियों को आमतौर पर डिस्क के प्रति क्रांति के एक पट्टी पर पढ़ा जा सकता है। 64K स्ट्राइप के साथ हम 15,000 RPM डिस्क से 64Kx250 = 16MB या प्रति सेकंड डेटा पढ़ सकते हैं। यह 14 डिस्क की एक सरणी पर लगभग 220 एमबी प्रति सेकंड का क्रमिक थ्रूपुट देता है, जो कि 150MB / सेकंड की तुलना में कागज पर इतना तेज नहीं है या आधुनिक 1TB SATA डिस्क के लिए उद्धृत है।
वीडियो स्ट्रीमिंग के लिए (उदाहरण के लिए), एक बड़े धारी के आकार के साथ RAID-0 में 4 एसएटीए डिस्क की एक सरणी (कुछ RAID नियंत्रक 1 एमबी तक स्ट्राइप आकार का समर्थन करेंगे) में काफी अनुक्रमिक थ्रूपुट है। यह उदाहरण सैद्धांतिक रूप से 480MB / सेकंड के बारे में स्ट्रीम कर सकता है, जो आराम से वास्तविक समय के असम्पीडित एचडी वीडियो संपादन करने के लिए पर्याप्त है। इस प्रकार, मैक पेशेवरों और इसी तरह के हार्डवेयर के मालिक एचडी वीडियो कंपोजिंग कार्य कर सकते हैं जिन्हें कुछ साल पहले प्रत्यक्ष-संलग्न फाइबर सरणी के साथ एक मशीन की आवश्यकता होती थी।
डिस्क सरणी का वास्तविक लाभ डेटाबेस के काम पर होता है, जो बड़ी संख्या में छोटे, बिखरे हुए I / O अनुरोधों की विशेषता है। इस तरह के वर्कलोड प्रदर्शन पर डिस्क के राउंड-एंड-राउंड और आगे-पीछे होने वाली धातु की बिट्स की भौतिक विलंबता से विवश होते हैं। इस मीट्रिक को IOPS (I / O संचालन प्रति सेकंड) के रूप में जाना जाता है। अधिक शारीरिक डिस्क आपके पास है - क्षमता की परवाह किए बिना - अधिक IOPS आप सैद्धांतिक रूप से कर सकते हैं। अधिक IOPS का अर्थ है प्रति सेकंड अधिक लेनदेन।
डेटा अखंडता
इसके अतिरिक्त अधिकांश RAID विन्यास आपको कुछ डेटा अतिरेक देते हैं - जिसकी परिभाषा के लिए एक से अधिक भौतिक डिस्क की आवश्यकता होती है। इस तरह की अतिरेक के साथ एक भंडारण योजना का संयोजन और ड्राइव की एक बड़ी संख्या एक प्रणाली को एक बड़े लेनदेन कार्यभार को मज़बूती से सेवा करने की क्षमता देती है।
डिस्क सरणियों के लिए बुनियादी ढांचा (और अधिक चरम मामले में SAN) वास्तव में बड़े पैमाने पर बाजार की वस्तु नहीं है। इसके अलावा यह उन बिट्स में से एक है जो वास्तव में, वास्तव में विफल नहीं हो सकते। निर्माण और छोटे बाजार संस्करणों के मानक का यह संयोजन सस्ता नहीं है।
बैकअप सहित कुल भंडारण लागत
व्यवहार में, 1TB डेटा बनाए रखने के लिए सबसे बड़ी लागत बैकअप और पुनर्प्राप्ति होने की संभावना है। एक टेप ड्राइव और बैकअप के पूर्ण दादाजी चक्र के लिए एसडीएलटी या अल्ट्रियम टेप के 34 सेट और पुनर्प्राप्ति संभवतः 1TB डिस्क सरणी से अधिक खर्च होंगे। ऑफ-साइट स्टोरेज की लागत और यहां तक कि एक ही टेप-मंकी की सैलरी जोड़ें और अचानक आपका 1TB डेटा इतना सस्ता नहीं है।
डिस्क की लागत अक्सर प्रमुख भंडारण लागतों के पदानुक्रम से काफी हद तक कम होती है। एक बैंक में मेरे पास SAN स्टोरेज के लिए काम करने का अवसर था, एक डेवलपमेंट सिस्टम के लिए £ 900 / GB और एक प्रोडक्शन सर्वर पर डिस्क के लिए £ 5,000 / GB की लागत थी। उद्यम विक्रेता कीमतों पर भी डिस्क की भौतिक लागत का एक छोटा सा हिस्सा था। एक और उदाहरण है कि मुझे पता है कि एक (अपेक्षाकृत) मामूली रूप से कॉन्फ़िगर किया गया आईबीएम शार्क सैन है जो उन्हें £ 1 मिलियन से अधिक में कहीं खर्च करता है। बस इस पर भौतिक संग्रहण लगभग £ 9 / गीगाबाइट पर, या आपके 1TB उपभोक्ता HDD के बराबर स्थान के लिए £ 9,000 का शुल्क लिया जाता है।