वास्तव में एक URE क्या है?

14

मैं हाल ही में RAID5 बनाम RAID6 में देख रहा हूँ और मैं देख रहा हूँ कि RAID5 URE रेटिंग्स और ड्राइव्स के बढ़ते आकार के कारण अब और सुरक्षित नहीं है। मूल रूप से, मैंने जो सामग्री पाई, उसमें से अधिकांश में कहा गया है कि RAID5 में, यदि आपके पास डिस्क विफलता है, तो आपके बाकी सरणी 12TB है, तो आपके पास URE से मिलने और अपना डेटा खोने का लगभग 100% मौका है।

12TB का आंकड़ा इस तथ्य से आता है कि डिस्क एक URE तक पहुंचने के लिए 10 ^ 14 बिट्स पर पढ़ी जाती है।

खैर, कुछ ऐसा है जो मुझे यहां नहीं मिलता। एक रीड सेक्टर में जाने वाले हेड द्वारा किया जाता है, जो रीडिंग को फेल कर सकता है वह या तो हेड की मृत्यु हो जाती है या सेक्टर की मृत्यु हो जाती है। यह भी हो सकता है कि रीडिंग किसी और कारण से काम न करे (मुझे नहीं पता, जैसे कंपन से सिर कूदता है ...)। इसलिए, मुझे सभी 3 स्थितियों को संबोधित करने दें:

पढ़ना काम नहीं करता है: यह अप्राप्य नहीं है, है ना? इसे फिर से आजमाया जा सकता है।
सिर मर जाता है: यह निश्चित रूप से अप्राप्य होगा, लेकिन, इसका मतलब यह भी है कि पूर्ण थाली (या कम से कम पक्ष) अपठनीय होगी, यह अधिक खतरनाक होगा, नहीं?
क्षेत्र मर जाता है: साथ ही पूरी तरह से अप्राप्य है, लेकिन यहां मुझे समझ में नहीं आता है कि 4TB डिस्क को URE के लिए 10 ^ 14 पर रेट किया गया है और 8TB को URE के लिए 10 ^ 14 पर रेट किया गया है, इसका मतलब है कि सेक्टरों पर 8TB (सबसे अधिक संभावना है कि नई तकनीक) 4TB की तुलना में आधी विश्वसनीय है, इसका कोई मतलब नहीं है।

जैसा कि आप देखते हैं, 3 विफलता बिंदुओं में से, मैं पहचानता हूं, कोई भी समझ में नहीं आता है। तो क्या वास्तव में एक URE है, मेरा मतलब है संक्षिप्त रूप से?

क्या कोई ऐसा है जो मुझे समझा सकता है?

संपादित करें 1

जवाबों की पहली लहर के बाद, ऐसा लगता है कि इसका कारण क्षेत्र की विफलता है। अच्छी बात यह है कि फर्मवेयर, RAID कंट्रोलर और OS + फाइलसिस्टम में आरंभिक और वास्तविक क्षेत्रों का पता लगाने के लिए प्रक्रिया है।

खैर, अब मुझे पता है कि एक यूआरई क्या है (वास्तव में, नाम काफी आत्म-व्याख्यात्मक है :)।

मैं अभी भी अंतर्निहित कारणों से चकित हूं और ज्यादातर स्थिर रेटिंग जो वे देते हैं।

कुछ ने विफल होने वाले क्षेत्र को बाहरी स्रोतों (कॉस्मिक वेव्स) के लिए जिम्मेदार ठहराया, मुझे तब आश्चर्य हुआ कि URE दर तब रीडिंग काउंट पर आधारित है और उम्र पर नहीं, कॉस्मिक तरंगों को वास्तव में अधिक पुरानी डिस्क पर प्रभाव डालना चाहिए क्योंकि यह उजागर हो चुकी है अधिक, मुझे लगता है कि यह एक कल्पना से अधिक है, हालांकि मैं गलत हो सकता हूं।

अब दूसरा कारण है जो डिस्क के पहनने से संबंधित है और कुछ ने बताया कि उच्च घनत्व कमजोर चुंबकीय डोमेन देते हैं, जो पूरी तरह से समझ में आता है और मैं स्पष्टीकरण का पालन करूंगा। लेकिन जैसा कि यह अच्छी तरह से यहाँ समझाया गया है , नए डिस्क विभिन्न आकारों को ज्यादातर एचडीडी चेसिस में एक ही प्लैटर (और फिर एक ही घनत्व) के अधिक या कम डालकर प्राप्त किया जाता है। सेक्टर समान हैं और सभी के पास बहुत ही विश्वसनीयता होनी चाहिए, इसलिए बड़ी डिस्क को छोटे डिस्क की तुलना में उच्च रेटिंग प्राप्त होनी चाहिए, जिन क्षेत्रों को कम पढ़ा जा रहा है, यह मामला नहीं है, क्यों? हालांकि यह बताएगा कि नए तकनीक के साथ नए डिस्क को पुराने लोगों की तुलना में बेहतर रेटिंग क्यों नहीं मिलती है, क्योंकि उच्च घनत्व के कारण नुकसान से बेहतर तकनीकी लाभ की भरपाई होती है।

— memes
स्रोत

"URE और आपके डेटा को खोने के लिए" afaik (और मैं गलत हो सकता है), एक URE का मतलब केवल यह है कि कुछ डेटा खो गया है, यह सब नहीं है - और आप URE को हिट करने के बाद फिर से बनाने की कोशिश कर सकते हैं। उस ने कहा, छापे 10 या zfs थोड़े है जहां यह इन दिनों है।

— 6

1

" नए डिस्क पर सेक्टर [] पुराने [पर] के रूप में आधे विश्वसनीय हैं, इसका कोई मतलब नहीं है " मुझे यकीन नहीं है कि मैं सहमत हूं। चूंकि चुंबकीय क्षेत्र कभी छोटे हो जाते हैं (जो समान आकार के पैकेज में उच्च डेटा घनत्व का अर्थ है), यह बहुत ही उचित है कि वे आकस्मिक क्षरण (स्थानीय गामा-किरण उत्सर्जन, ब्रह्मांडीय किरण घटना और इतने पर) के लिए अतिसंवेदनशील हो जाते हैं। आधुनिक ड्राइव की यह बढ़ती संवेदनशीलता है कि हम में से कोई भी किसी भी मामले में संयुक्त राष्ट्र के RAID ड्राइव को तैनात नहीं करेगा, और एक कारण है कि हम में से अधिकांश ने RAID-5 को छोड़ दिया है।

— 7

संबंधित: वर्तमान में कितने विश्वसनीय हैं 2 टीबी उपभोक्ता ग्रेड डिस्क ड्राइव?

— बजे एक सीवीएन

यहाँ वास्तविक समस्या यह है कि अभी तक बहुत सारे आरईजी सरणियाँ एकल यूआरई को एक पूरे-सरणी त्रुटि में बदल रही हैं। एक एकल URE को एक एकल RAID ब्लॉक के नुकसान का कारण बनना चाहिए। अगर उस ब्लॉक का उपयोग किया गया था, तो फाइलसिस्टम को यह पता लगाने दें कि संभावना है कि यह वास्तव में कोई फर्क नहीं पड़ता।

— MSLALERS

1

@ नहीं, नंबर रद्द कर देते हैं। दो क्षेत्रों के रूप में दो बार असफलता के कई अवसर हैं, इसलिए एक ही पढ़ने में त्रुटि दर प्रति-बाइट आधार पर समान विश्वसनीयता के बराबर है। यही कारण है कि यह पहली जगह में उपयोग किया जाता है।

— hobbs

13

एक URE एक अप्राप्य रीड त्रुटि है। कुछ ऐसा हुआ है, जिसके कारण सेक्टर की रीडिंग विफल हो गई है कि ड्राइव को ठीक नहीं किया जा सकता है। ड्राइव इलेक्ट्रॉनिक्स परिष्कृत हैं, वे केवल डेटा को पास करेंगे यदि वे डिस्क से इसे सही ढंग से पढ़ने में सक्षम हैं। ड्राइव इलेक्ट्रॉनिक्स खराब घोषित करने से पहले एक खराब क्षेत्र को पढ़ने के लिए कई बार प्रयास करेगा।

पढ़ने में त्रुटि का क्या कारण है - मैं यहां विशेषज्ञ नहीं हूं (हाथ लहराते हुए) लेकिन ड्राइव उम्र बढ़ने के कारण विनिर्माण सहिष्णुता प्रासंगिक हो सकती है। चुंबकीय डोमेन कमजोर हो सकते हैं। कॉस्मिक किरणें नुकसान आदि का कारण बन सकती हैं। अनिवार्य रूप से यह एक यादृच्छिक विफलता है।

यह RAID 5 को कैसे प्रभावित करता है?

एक RAID 5 में वितरित समता के साथ ब्लॉक स्तर की पट्टी होती है। समता ब्लॉकों की गणना डेटा ब्लॉक से बिट्स को एक साथ XORING द्वारा की जाती है। XOR फ़ंक्शन मूल रूप से कहता है, यदि सभी बिट समान हैं, तो परिणाम 0 है अन्यथा यह 1 है। जब समता की गणना करते हुए आप पहले 2 बिट्स लेते हैं और XOR उन्हें लेते हैं, तो XOR परिणाम को अगले बिट और इसी तरह उदाहरण के लिए।

1010   data      or    1010 data
1100   data            1100 data
0110   parity          0011 data
                       0101 parity

एक्सओआर फ़ंक्शन की प्रकृति ऐसी है कि यदि कोई डिस्क मर जाती है और उसे बदल दिया जाता है, तो उस पर होने वाले डेटा को शेष डिस्क से फिर से संगठित किया जा सकता है।

1010  data       or    1010 data
      damaged               damaged
0101  parity           0011 data
                       0101 parity

जैसा कि आप देख सकते हैं कि बचे हुए डेटा और समता को नष्ट करके क्षतिग्रस्त डेटा का पुनर्निर्माण किया जा सकता है।

एक URE इसे कैसे प्रभावित करता है?

RAID 5 पुनर्निर्माण के दौरान एक URE ही महत्वपूर्ण है।

जब आप एक RAID 5 का पुनर्निर्माण करते हैं, तो पढ़ने की एक बड़ी मात्रा होती है। नई डिस्क पर डेटा को फिर से बनाने के लिए प्रत्येक डेटा ब्लॉक को पढ़ने की आवश्यकता है। यदि कोई URE होता है, तो संबंधित ब्लॉक का डेटा पुनर्प्राप्त नहीं किया जा सकता है, इसलिए आपका डेटा असंगत है। पर्याप्त रूप से बड़े R5 में पर्याप्त रूप से बड़े डिस्क के लिए प्रतिस्थापित डिस्क को फिर से संगठित करने के लिए पढ़े जाने वाले बिट्स की संख्या उदाहरण के लिए URE मान 10 ^ 14 रीड में 1 बिट से अधिक है।

— user9517
स्रोत

2

एक एकल 8TB डिस्क पर 6 * 10 ^ 13 बिट्स से अधिक है, इसलिए RAID -5 में केवल तीन ऐसी डिस्क के साथ, एक यूआरई पुनर्निर्माण के दौरान नहीं होने की तुलना में अधिक संभावना है । ओह, और +1 मुझसे।

— 8

3

दावा (प्रश्न में लिखा गया और कुछ उत्तरों और टिप्पणियों में, अन्य प्रश्नों में भी, वास्तव में पूरे इंटरनेट पर) कि 12TB पढ़ने के बाद एक पढ़ने में त्रुटि लगभग निश्चित है। यह विश्वास नहीं है? मत करो। पता है। आपके किसी भी डिस्क से 12 (या अधिक) टीबी पढ़कर और यह देखते हुए कि कोई त्रुटि नहीं हुई। कृपया इसे करें और इस मिथक को रोकें। धन्यवाद।

— डेविड बालैसिक

1

@IanKemp नहीं यह नहीं है। मैं इसे करने की कोशिश की। आपने स्पष्ट रूप से नहीं किया। (यह भी, बेहतर रेटिंग बस मिथक को थोड़ा

— आगे बढ़ाती है

1

@ DavidBalažic जाहिर है, के अपने नमूने का आकार एक को अमान्य कर संभाव्यता सिद्धांत के पूरी तरह! मेरा सुझाव है कि आप नोबेल समिति को एक पत्र प्रस्तुत करें।

— इयान केम्प

1

@IanKemp यदि कोई दावा करता है कि सभी संख्याएँ 7 से विभाज्य हैं और मुझे पता है कि ऐसा नहीं है, तो हाँ, एक एकल खोज पूरे सिद्धांत को अमान्य कर सकती है। BTW, अभी भी एक भी व्यक्ति ने व्यवहार में मिथक की पुष्टि नहीं की है (प्रयोग द्वारा), क्या उन्होंने? उन्हें क्यों करना चाहिए, जब विश्वास ज्ञान से अधिक है ...

— डेविड बालैसिक

9

तो क्या वास्तव में एक URE है, मेरा मतलब है संक्षिप्त रूप से?

हार्ड डिस्क केवल उस डेटा को संग्रहीत नहीं करते हैं जो आप उनसे पूछते हैं। क्योंकि कभी-कभी घटते चुंबकीय डोमेन आकार, और यह तथ्य कि हार्ड डिस्क द्विआधारी फैशन के बजाय एनालॉग में डेटा स्टोर करते हैं (हार्ड डिस्क फर्मवेयर को प्लैटर से एक एनालॉग सिग्नल मिलता है, जिसका अनुवाद बाइनरी सिग्नल में किया जाता है, और यह अनुवाद है निर्माता की गुप्त चटनी का हिस्सा), वस्तुतः पढ़ने में हमेशा कुछ हद तक त्रुटि होती है, जिसकी भरपाई होनी चाहिए।

यह सुनिश्चित करने के लिए कि डेटा को वापस पढ़ा जा सकता है, हार्ड डिस्क आपके द्वारा स्टोर किए गए डेटा के साथ त्रुटि सुधार डेटा को भी संग्रहीत करता है।

सामान्य ऑपरेशन के तहत, एफईसी डेटा सिग्नल में त्रुटियों को ठीक करने के लिए पर्याप्त है जो कि प्लेटटर से वापस पढ़ा जाता है। फर्मवेयर फिर मूल डेटा को फिर से संगठित कर सकता है, और सब कुछ ठीक है। यह एक पुनर्प्राप्त पठनीय त्रुटि है जो कि SMART में पठन त्रुटि दर विशेषता (SMART विशेषता 0x01) और / या हार्डवेयर ECC पुनर्प्राप्त (SMART विशेषता 0xc3) के रूप में सामने आती है ।

यदि किसी कारण से सिग्नल एक निश्चित बिंदु से नीचे चला जाता है, तो FEC डेटा अब मूल डेटा को फिर से संगठित करने के लिए पर्याप्त नहीं है। उस बिंदु पर, सिद्धांत जाता है, फर्मवेयर अभी भी यह पता लगाने में सक्षम होगा कि डेटा को मज़बूती से वापस नहीं पढ़ा जा सकता है, लेकिन यह इसके बारे में कुछ भी नहीं कर सकता है। यदि कई ऐसे रीड विफल हो जाते हैं, तो डिस्क को किसी भी तरह बाकी कंप्यूटर को सूचित करना होगा कि रीड सफलतापूर्वक निष्पादित नहीं किया जा सकता है। यह एक अपरिवर्तनीय पढ़ने की त्रुटि का संकेत देकर ऐसा करता है । यह रिपोर्ट किए गए अपरिवर्तनीय त्रुटियों (स्मार्ट विशेषता 0xbb) काउंटर को भी बढ़ाता है ।

एक बिना पढ़ी गई त्रुटि, या URE, बस एक रिपोर्ट है कि जो भी कारण से, पेलोड डेटा और एफईसी डेटा मूल रूप से संग्रहीत डेटा को फिर से संगठित करने के लिए अपर्याप्त था।

ध्यान रखें कि URE दरें सांख्यिकीय हैं । आप किसी भी हार्ड डिस्क का सामना नहीं करेंगे जहां आप ठीक 10 ^ 14 (या 10 ^ 15) पढ़ सकते हैं - 1 बिट सफलतापूर्वक और फिर अगला बिट विफल हो जाता है। बल्कि, यह निर्माता का एक बयान है कि औसतन , यदि आप 10 ^ 14 बिट्स पढ़ते हैं (कहते हैं), तो उस प्रक्रिया के दौरान कुछ बिंदु पर आप एक अपठनीय क्षेत्र का सामना करेंगे।

इसके अलावा, ऊपर दिए गए अंतिम कुछ शब्दों के बाद, ध्यान रखें कि प्रति बिट्स सेक्टर के संदर्भ में URE दरें दी गई हैं । प्लॉटर्स पर डेटा कैसे स्टोर किया जाता है, इस वजह से डिस्क यह नहीं बता सकती है कि किसी सेक्टर का कौन सा हिस्सा खराब है, इसलिए यदि कोई सेक्टर FEC चेक को फेल करता है, तो पूरे सेक्टर को खराब माना जाता है।

— एक CVn
स्रोत

ठीक है, इसलिए यह क्षेत्र के विफल होने की ओर इशारा करता है। मुझे पूरी तरह से आंकड़े की चीजें मिलती हैं, कोई चिंता नहीं। मैं यहां यह भी देखता हूं कि घनत्व बढ़ने के साथ-साथ सेक्टर की विश्वसनीयता घटती जाती है, लेकिन फिर भी इसका कोई मतलब नहीं है। नए डिस्क में आमतौर पर एक ही प्लैटर घनत्व होता है चाहे भौतिक आकार कोई भी हो, 4TB में केवल 6BB की तुलना में कम प्लैटर होंगे। मूल रूप से सेक्टर समान हैं, इसलिए 8TB सांख्यिकीय रूप से उच्च मूल्य प्राप्त करने में सक्षम नहीं है, इसलिए कई सेक्टर दो बार हैं इसलिए प्रत्येक को आधा (सांख्यिकीय) पढ़ा जाता है। उन्हें तब कम असफल होना चाहिए, नहीं?

— मेम

3

क्षेत्र मर जाता है: साथ ही पूरी तरह से अप्राप्य है, लेकिन यहां मुझे समझ में नहीं आता है कि 4TB डिस्क को URE के लिए 10 ^ 14 पर रेट किया गया है और 8TB को URE के लिए 10 ^ 14 पर रेट किया गया है, इसका मतलब है कि सेक्टरों पर 8TB (सबसे अधिक संभावना है कि नई तकनीक) 4TB की तुलना में आधी विश्वसनीय है, इसका कोई मतलब नहीं है।

विनिर्देश आमतौर पर " एन बिट्स पढ़ते समय औसत 1 त्रुटि का पता लगाया जाता है ", इसलिए ड्राइव का आकार कोई फर्क नहीं पड़ता। यह मायने रखता है कि यदि आप अपने जोखिम की गणना करते हैं कि आपके ड्राइव और वर्कलोड पर कोई त्रुटि होगी, लेकिन निर्माता केवल यह बताता है कि त्रुटि खोजने के लिए n बिट्स को पढ़ा जाता है (औसतन, गारंटी नहीं)।

उदाहरण: यदि आप 1TB ड्राइव खरीदते हैं, तो आपको एक त्रुटि खोजने के लिए इसे लगभग 12 बार पढ़ना होगा, जबकि 8TB ड्राइव दूसरी बार पढ़ने पर इसका अनुभव कर सकती है - लेकिन पढ़ने की संख्या दोनों बार समान होती है, इसलिए गुणवत्ता चुंबकीय स्पिंडल के लगभग समान है।

बढ़ी हुई कीमत के लिए आप जो भुगतान करते हैं, वे अन्य कारक हैं, 1TB के भौतिक स्थान में 8TB रटना करने की क्षमता, ऊर्जा की खपत को बहुत कम कर देता है, ड्राइव को आगे बढ़ाते समय कम हेडस्क्रास करता है।

— user121391
स्रोत

0

मुझे लगता है कि @Michael Kjörling ने स्पष्ट उत्तर दिया।

जब डिस्क पढ़ता है, तो चुंबकीय क्षेत्र की दिशा का पता लगाने वाला सिर, फिर कुछ इलेट्रोनिक सिग्नल भेजते हैं, जो कि एनालॉग है। हम मानते हैं कि फर्मवेयर को 0.5 वी से अधिक वोल्टेज प्राप्त होने पर 1 देना चाहिए, लेकिन चुंबकीय क्षेत्र बहुत कमजोर है, इसलिए सिर केवल 0.499V के साथ एक सिग्नल भेजता है, एक त्रुटि मुठभेड़। हमें इस त्रुटि को ठीक करने के लिए FEC की आवश्यकता है।

यहां एक उदाहरण है: एक सेक्टर डेटा 0x0F23 होना चाहिए, हम इसे 0 * 1 + एफ * 2 + 2 * 3 + 3 * 4 = 0x30 के साथ एन्कोड करते हैं। अब हम एफईसी प्राप्त करते हैं, और इसे सेक्टर के बाद लिखते हैं। जब हम पढ़ते हैं, तो हम 0x0E23 और FEC 0x30 पढ़ते हैं, यह मेल नहीं खाता है। कुछ गणना के बाद, हमने पाया कि यह 0x0F23 होना चाहिए। लेकिन अगर हमें 0x0E13 और 0x30 मिला है, या हमें 0x0E23 और 0x32 मिला है, तो हम सही गणना नहीं कर सकते हैं।

यह रेटिंग इतनी कम है, हो सकता है कि जब तक कि HDD कारख़ाना कभी PBs कभी EBs डेटा को पढ़े, एक स्थिर मूल्य प्राप्त न कर सके। इसलिए वे संभाव्यता मूल्य देते हैं: जब आप 10 ^ 14 बिट डेटा पढ़ते हैं, तो आप एक बार सामना कर सकते हैं। चूँकि यह एक प्रायिकता मूल्य है, हो सकता है कि आपने सिर्फ 1 सेक्टर डेटा पढ़ने के बाद आपको घेर लिया हो, हो सकता है कि आपने तब तक सामना किया जब तक आप 50TB डेटा नहीं पढ़ लेते। और इस मूल्य में डिस्क क्षमता के साथ कुछ भी नहीं था, यह सिर्फ आपके द्वारा पढ़े गए डेटा आकार के साथ एक मौका चिंता का विषय है। यदि आप 4TB डिस्क को 6 बार डेटा से भरा हुआ पढ़ते हैं, तो यह मौका 6TB डिस्क को 4 बार पढ़ने के लिए बराबर होगा, या 3TB डिस्क को 3 बार पढ़ा जाएगा।

— हार्ले
स्रोत