आपके द्वारा दिखाए गए CMU-Intel पेपर ने (पृष्ठ 5 पर) दिखाया कि त्रुटि दर DRAM मॉड्यूल की भाग संख्या / निर्माण तिथि पर बहुत अधिक निर्भर करती है और 10-1000 के कारक से भिन्न होती है। कुछ संकेत भी हैं कि हाल ही में (2014) निर्मित चिप्स में समस्या बहुत कम स्पष्ट है।
आपके द्वारा उद्धृत संख्या '9.4x10 ^ -14' का उपयोग "PARA" नामक एक प्रस्तावित सैद्धांतिक शमन तंत्र के संदर्भ में किया गया था (जो कि मौजूदा शमन तंत्र pTRR (छद्म लक्ष्य पंक्ति ताज़ा) के समान हो सकता है) और आपके लिए अप्रासंगिक है। सवाल, क्योंकि PARA का ECC से कोई लेना-देना नहीं है।
एक दूसरे CMU- इंटेल पेपर (पृष्ठ 10) में त्रुटि में कमी पर विभिन्न ईसीसी एल्गोरिदम के प्रभावों का उल्लेख है (कारक 10 ^ 2 से 10 ^ 5, संभवतः परिष्कृत स्मृति परीक्षणों और "गार्डबैंडिंग") के साथ।
ECC ने प्रभावी रूप से रो हैमर के शोषण को DOS हमले में बदल दिया। ECC द्वारा 1bit त्रुटियों को ठीक किया जाएगा, और जैसे ही एक गैर-सुधारात्मक 2bit त्रुटि का पता चलता है, सिस्टम रुक जाएगा (SECDED ECC मानकर)।
एक समाधान हार्डवेयर खरीदने के लिए है जो pTRR या TRR का समर्थन करता है। रो हैमर के बारे में सिस्को की वर्तमान ब्लॉग पोस्ट देखें । कम से कम कुछ निर्माताओं को डीआरएएम मॉड्यूल में निर्मित इन शमन तंत्रों में से एक लगता है, लेकिन इसे अपने चश्मे में गहराई से छिपा कर रखें। अपने प्रश्न का उत्तर देने के लिए: विक्रेता से पूछें।
तेज़ ताज़ा दरें (64ms के बजाय 32ms) और आक्रामक पैट्रोल स्क्रब अंतराल भी मदद करते हैं, लेकिन एक प्रदर्शन प्रभाव होगा। लेकिन मैं किसी भी सर्वर हार्डवेयर को नहीं जानता जो वास्तव में इन मापदंडों को पूरा करने की अनुमति देता है।
मुझे लगता है कि लगातार उच्च सीपीयू उपयोग और उच्च कैश मिस के साथ संदिग्ध प्रक्रियाओं को समाप्त करने के अलावा आप ऑपरेटिंग सिस्टम की तरफ बहुत कुछ नहीं कर सकते हैं।