क्या मुझे ECC DIMM के साथ Dell PowerEdge R710 Bios में bios "उन्नत ECC" का उपयोग करना चाहिए?


15

मैं दोहरी इंटेल Xeon E5503 सीपीयू के साथ एक डेल पॉवरडेज R710 है। इसमें ECC DIMM के 96GB (12x8GB) हैं। इसके BIOS में, मेमोरी को "उन्नत ईसीसी" के लिए कॉन्फ़िगर किया गया है।

मेरा सवाल यह है कि अगर मेरे डीआईएमएम पहले से ही ईसीसी हैं, तो क्या यह "उन्नत ईसीसी" मोड को BIOS में सक्षम करने के लिए समझ में आता है या मुझे "अनुकूलित" पर स्विच करना चाहिए?

डेल इन विधियों का वर्णन इस प्रकार करता है:

उन्नत ECC मोड यह मोड दो MCH का उपयोग करता है और एक साथ 128-बिट डेटा बस DIMM का अनुकरण करने के लिए उन्हें "टाई" करता है। यह मुख्य रूप से X8 DRAM तकनीक पर आधारित DIMM के लिए एकल उपकरण डेटा सुधार (SDDC) प्राप्त करने के लिए उपयोग किया जाता है। SDDC हर मेमोरी मोड में x4 आधारित DIMM के साथ समर्थित है। एक एमसीएच पूरी तरह से उपयोग नहीं किया गया है, और इस चैनल में स्थापित कोई भी मेमोरी POST के दौरान एक चेतावनी संदेश उत्पन्न करेगा।

मेमोरी ऑप्टिमाइज़्ड मोड इस मोड में, एमसीएच एक दूसरे से स्वतंत्र रूप से चलते हैं; उदाहरण के लिए, एक निष्क्रिय हो सकता है, एक लेखन ऑपरेशन कर सकता है, और दूसरा एक रीड ऑपरेशन के लिए तैयारी कर सकता है। मेमोरी एक, दो या तीन चैनलों में लगाई जा सकती है। मेमोरी ऑप्टिमाइज़्ड मोड के प्रदर्शन लाभ को पूरी तरह से महसूस करने के लिए, प्रति सीपीयू के तीनों चैनलों को आबाद किया जाना चाहिए। इसका तात्पर्य यह है कि कुछ 'एटिपिकल' मेमोरी कॉन्फ़िगरेशन, जैसे 3 जीबी, 6 जीबी, या 12 जीबी, सबसे अच्छा प्रदर्शन करेंगे। यह अनुशंसित मोड है जब तक कि विशिष्ट आरएएस विशेषताओं की आवश्यकता नहीं होती है।

Dell PowerEdge R710 सिस्टम हार्डवेयर मालिक मैनुअल (PDF)

जवाबों:


24

इससे फर्क पड़ता है, यह केवल तभी समझ में आएगा जब आपको एक्स 4 या एक्स 8 उपकरणों पर आरएएस (विश्वसनीयता, उपलब्धता और सेवा) सुविधाओं की आवश्यकता होती है और अपनी आवश्यकताओं के लिए व्यापार-बंद को समझते हैं। अधिक विवरण डेल व्हाइट पेपर डेल ™ पावरएडगे ™ सर्वर 2009 - मेमोरी में समझाया जा सकता है ।

इसके अलावा, R710 के लिए विशिष्ट विवरण के साथ कॉन्फ़िगरेशन और लेआउट पॉवरएडज R710 के लिए तकनीकी गाइडबुक पर उपलब्ध हैं - (Google इसे इसलिए क्योंकि मेरे पास लिंक के लिए प्रतिष्ठा नहीं है)।

ध्यान देने के लिए महत्वपूर्ण मुद्दा चिप पर ईसीसी और सिंगल डिवाइस डेटा सुधार (एसडीडीसी) के लिए डेल के BIOS द्वारा प्रदान किए गए "उन्नत ईसीसी" के बीच अंतर है। आप दोनों पर प्रदर्शन प्रभाव पड़ेगा। ECC चिप को लिखने के दौरान त्रुटियों से उबर जाएगा। हालांकि, एसडीडीसी एक कदम आगे बढ़ता है और बिट्स को व्यवस्थित करेगा ताकि एक पूरी चिप विफल हो जाए और अभी भी पुनर्प्राप्त करने योग्य हो। एक उदाहरण और विवरण देखें SDDC E7500 चिपसेट

समस्या यह है कि मशीन के आपके विशिष्ट उपयोग में आपका प्रदर्शन और / या विश्वसनीयता अत्यधिक चिंता का विषय है। यदि चिप की विफलता से इस मशीन पर महत्वपूर्ण डेटा या उपयोग का नुकसान होगा और यह कार्यान्वयन में गैर-बेमानी है, तो उन्नत ईसीसी जाने का एक शानदार तरीका हो सकता है। हालाँकि, आप ऐसा प्रदर्शन प्रभाव पर करते हैं जो आपके लिए अधिक महत्वपूर्ण हो सकता है।

मैं दोनों एकल Microsoft SQL सर्वर कार्यान्वयन के लिए Dell PowerEdge सर्वर पर क्षेत्र में लागू किया है। अगर मैं अधिक मदद कर सकता हूं, तो मुझे बताने के लिए टिप्पणी करें।

उम्मीद है की वो मदद करदे।

EDIT: कवरेज गैप / ECC कार्यान्वयन

हां, यदि आप दोनों को लागू करते हैं तो भी कवरेज का अंतर है। चूंकि, आप विशेष रूप से उच्च उपलब्धता सर्वर के एक क्लस्टर का उपयोग कर रहे हैं, IMHO आपको उन्नत ईसीसी का उपयोग करना चाहिए। क्लस्टर किए गए उपकरणों के लाभों की तुलना में आपका प्रदर्शन प्रभाव न्यूनतम है। Crucial के अनुसार आपके पास सामान्य रूप से ECC मेमोरी पर प्रदर्शन में केवल 2% की कमी है

अंतर उन त्रुटियों के प्रकारों के लिए अधिक विशिष्ट होगा जो प्रत्येक त्रुटि को संभालती हैं और कैसे होती हैं। आपकी विशिष्ट स्थिति में इसे डेटा हानि में अनुवाद नहीं करना चाहिए। चूंकि यह एक एंटरप्राइज़ DBMS है और डेटा हानि को रोकने के लिए सॉफ़्टवेयर स्तर पर त्रुटियों, संगामिति समस्याओं आदि का प्रबंधन किया जाता है। एक विस्तृत इतिहास को ठीक से कॉन्फ़िगर किए गए DBMS में परिवर्तन से रखा जाता है और इसका उपयोग करने वाले सॉफ़्टवेयर में आमतौर पर कोई भी गंभीर त्रुटि होने पर "रोलबैक" लेन-देन करने के लिए सेटअप किया जा सकता है।

ईसीसी कार्यान्वयन

ईसीसी मेमोरी रीड / राइट में किसी भी त्रुटि को ठीक करने का प्रयास करेगा। हालांकि, यदि त्रुटि अधिक महत्वपूर्ण है, तो ईसीसी भी पुनर्प्राप्त करने में सक्षम नहीं होगा, जिससे डेटा की संभावित हानि हो सकती है । ECC के साथ-साथ ServerFault / ECC ram पर अधिक चर्चा होती है और यह बेहतर क्यों है?

ECC_Memory पर विकिपीडिया के अनुसार

ECC मेमोरी एकल-बिट त्रुटियों से प्रभावी रूप से एक मेमोरी सिस्टम को बनाए रखती है ...

SDDC

यदि आप ऊपर दिए गए E7500 चिपसेट दस्तावेज़ का उल्लेख करते हैं (ध्यान दें कि इंटेल से 55xx / 56xx को लॉगिन / साझेदारी की आवश्यकता है लेकिन यह विचार समान है कि मैंने मूल रूप से लिंक क्यों नहीं किया है), जो एसडीडीसी का वर्णन करता है और यह कैसे संभव हुआ है। मूल रूप से, यह स्मृति में लिखे गए शब्दों को व्यवस्थित करने के लिए एक तकनीक का उपयोग करता है जो यह सुनिश्चित करता है कि सभी को इस तरह से लिखा जाए कि हर शब्द में केवल एक बिट त्रुटि हो यानी शब्द एकल बिट त्रुटि (ऊपर के रूप में) से पुनर्प्राप्त होना चाहिए। अब यह प्रति शब्द है, इसलिए यह संभावित रूप से x4 उपकरणों पर 4-बिट त्रुटियों (1 प्रति शब्द) और 88-बिट त्रुटियों पर x8 डिवाइसों (अभी भी 1 प्रति शब्द) पर प्रत्येक शब्द को सुधारने से ठीक हो सकता है।

अतिरिक्त त्रुटियां, अधिक बिट त्रुटियां, कुल मेमोरी विफलता, चैनल विफलता, बस विफलता आदि, अभी भी सभी भयानक समस्याएं पैदा कर सकते हैं लेकिन यही कारण है कि आपके पास क्लस्टर और एंटरप्राइज डीबीएमएस है।

संक्षेप में, अगर आपके पास सब कुछ सक्षम है और त्रुटि सुधार एल्गोरिदम के लिए बहुत अधिक त्रुटियां हैं, तो आपको सही करने के लिए अभी भी एक त्रुटि यानी त्रुटि कवरेज अंतराल होगा। ये असाधारण रूप से दुर्लभ हो सकते हैं, हालांकि।


अधिक विशिष्ट होने के लिए यह 3 समान R710s का एक सेट है जो ओरेकल डीबी क्लस्टर चला रहा है। इसलिए किसी एक मशीन की उपलब्धता सर्वोच्च महत्व की नहीं है। हालांकि, डेटा भ्रष्टाचार परेशान कर रहा है। मैंने R710 तकनीकी गाइडबुक देखी है। इसमें मेमोरी के बारे में ज्यादा जानकारी नहीं थी। तो ई-डिस्म ईसीसी के साथ यह डिम के चिप्स के भीतर त्रुटियों का पता लगाएगा / सही करेगा? हालाँकि, उन्नत ईसीसी पूरे डिम के लिए त्रुटियों का पता लगाएगा / सही करेगा? अगर ऐसा है, तो क्या इन 2 तरीकों के बीच कोई कवरेज गैप है?
एमएक्स

@ XXX मैंने समझाने का प्रयास करने के लिए अपना उत्तर अपडेट कर दिया है। IMHO चूंकि आप एक Oracle DB क्लस्टर चला रहे हैं, मुझे संदेह है कि आपको डेटा हानि होगी। विफलता की दुर्लभ घटना में, DBMS डेटा हानि और अन्य मुद्दों को रोकने के लिए बनाया गया है। क्लस्टर के लिए आपके मामले में, मैं उन्नत ECC को सक्षम करूंगा क्योंकि प्रदर्शन नगण्य होना चाहिए, लेकिन यदि आप चिंता करते हैं तो आप इसे लोड के तहत परीक्षण कर सकते हैं।
मैथ्यू रीड

उत्तर के लिए बहुत बहुत धन्यवाद। मुझे क्षमा करें, लेकिन मैं अभी भी एक बात के बारे में स्पष्ट नहीं हूं। "उन्नत ईसीसी" मुझे उस ऑन-डिम ईसीसी से नहीं बचा सकता है? यदि हम dbms का उपयोग कर रहे हैं, तो यह ट्रिपल-चैनल मेमोरी कॉन्फिगरेशन का प्रदर्शन लाभ पाने के लिए बायोस को "अनुकूलित मोड" में बदलने के लिए समझ में नहीं आता है और ऑन-डिस्म ईसीसी और ओरेकल के स्वयं के सत्यापन द्वारा संरक्षित किया जाएगा?
Mxx

@ XXX मुझे लगता है कि इसकी बिलकुल भी गारंटी नहीं है। हालाँकि, उन्नत ECC विकल्प के साथ आप हस्तक्षेप के बिना अधिक त्रुटियों से उबरने में सक्षम होंगे (थोड़ी त्रुटि की समग्र संभावना) और प्रदर्शन हिट कम होना चाहिए। यह निश्चित रूप से डीबीएमएस पर सही करने का प्रयास कम है। हालांकि डीबीएमएस आपके डेटा को बचाने में सक्षम हो सकता है, एंड-यूज़र अनुभव अभी भी एक सॉफ़्टवेयर क्रैश और / या संभावित बड़े ऑपरेशन के रोलबैक में प्रस्तुत किया जा सकता है। मुझे लगता है कि अगर चिप फेल हो रही है और मॉनिटरिंग फ्रीक्वेंसी बढ़ती है, तो मैं मॉनिटरिंग के साथ मान सकता हूं कि एडवांस्ड ईसीसी आपको डीआईएमएम को साफ-सुथरा करने के लिए समय दे सकता है।
मैथ्यू रीड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.