डिस्क्स (8 टीबी) के बड़े एलवीएम के लिए कौन सा फाइलसिस्टम?


21

मेरे पास कई 2 टीबी डिस्क के साथ एक लिनक्स सर्वर है, जो वर्तमान में एक एलवीएम में है, जिसके परिणामस्वरूप लगभग 10 टीबी स्पेस है। मैं एक ext4 विभाजन पर इस सभी स्थान का उपयोग करता हूं, और वर्तमान में लगभग 8,8 टीबी डेटा है।

समस्या यह है, मुझे अक्सर अपने डिस्क पर त्रुटियां मिलती हैं, और यहां तक ​​कि अगर मैं प्रतिस्थापित करता हूं (जो कि कहना है, मैं पुराने डिस्क को एक नए के साथ dd पर कॉपी करता हूं, तो मैं नए को सर्वर में डाल देता हूं) जैसे ही वे त्रुटियां सामने आती हैं, मुझे अक्सर उस पर लगभग 100 एमबी दूषित डेटा मिलता है। यह e2fsck को हर बार पागल कर देता है, और एक बार फिर से sane अवस्था में ext4 फाइलसिस्टम प्राप्त करने में एक सप्ताह लगता है।

तो सवाल यह है: आप मुझे अपने LVM पर फाइल सिस्टम के रूप में उपयोग करने के लिए क्या सलाह देंगे? या आप इसके बजाय मुझे क्या करने की सलाह देंगे (मुझे वास्तव में LVM की आवश्यकता नहीं है)?

मेरे फाइल सिस्टम का प्रोफाइल:

  • विभिन्न आकार के कई फ़ोल्डर (कुछ कुल 2 टीबी, कुछ कुल 100 एमबी)
  • विभिन्न आकारों के साथ लगभग 200,000 फाइलें (10 एमबी के बारे में उनमें से 3/4, 100 एमबी और 4 जीबी के बीच 1/4; मैं वर्तमान में फाइलों पर अधिक आंकड़े नहीं प्राप्त कर सकता हूं क्योंकि मेरा ext4 विभाजन कुछ दिनों के लिए पूरी तरह से बर्बाद हो गया है)
  • कई पढ़ता है लेकिन कुछ लिखता है
  • और मुझे गलती सहिष्णुता की आवश्यकता है (मैंने mdadm RAID का उपयोग करना बंद कर दिया है क्योंकि यह पूरी डिस्क पर एक त्रुटि पसंद नहीं करता है, और मुझे कभी-कभी असफल डिस्क है, कि मैं जितनी जल्दी हो सके बदल सकता हूं, लेकिन इसका मतलब है कि मुझे दूषित डेटा मिल सकता है मेरी फाइलसिस्टम)

बड़ी समस्या डिस्क को फेल कर रही है; मैं कुछ फाइलें खो सकता हूं, लेकिन मैं एक ही समय में सब कुछ नहीं खो सकता।

अगर मैं ext4 का उपयोग करना जारी रखता हूं, तो मैंने सुना है कि मुझे छोटे फाइलसिस्टम बनाने की पूरी कोशिश करनी चाहिए और उन्हें किसी भी तरह "मर्ज" करना चाहिए, लेकिन मुझे नहीं पता कि कैसे।

मैंने सुना है कि btrfs अच्छा होगा, लेकिन मुझे कोई सुराग नहीं मिल सकता है कि यह कैसे डिस्क (या संपूर्ण डिस्क) का एक हिस्सा खोने का प्रबंधन करता है, जब डेटा को दोहराया नहीं जाता है ( mkfs.btrfs -d single?)।

प्रश्न पर किसी भी सलाह का स्वागत किया जाएगा, अग्रिम धन्यवाद!


1
वास्तव में आपको कौन सी डिस्क त्रुटियां मिलती हैं। यह एक सुराग देना चाहिए
सोहम चक्रवर्ती 18

खराब सेक्टर, अक्सर यह पूरी डिस्क पर केवल एक या दो खराब सेक्टर हैं ...
अल्फाटाइगर

इसका मतलब है कि आपकी डिस्क खराब चल रही है। फाइलसिस्टम के साथ शायद ही कुछ किया जाए। यदि डिस्क खराब है, तो कोई फर्क नहीं पड़ता कि आप किस एफएस का उपयोग करते हैं, आसान होगा। जैसा कि दूसरों ने उल्लेख किया है, RAID डिस्क और / या एंटरप्राइज़ डिस्क खरीदने के लिए जाएं। इसके अलावा, गुणवत्ता नियंत्रकों के लिए भी देखें।
सोहम चक्रवर्ती

हां, मुझे पता है, इसीलिए मैं उन डिस्क को बदल देता हूं जो खराब चल रही हैं। क्षमा करें यदि मेरा प्रश्न स्पष्ट नहीं था। लेकिन फिर भी, मैंने सोचा था कि कुछ डेटा सिस्टम दूषित डेटा के साथ बेहतर व्यवहार करेंगे ...
अल्फा

आपको वास्तव में अपने हार्डवेयर के दोषपूर्ण टुकड़ों को बदलना चाहिए। यह एक दुर्घटना परीक्षण डमी को देखने के बाद है जैसे कि 200 किमी / घंटा दीवार के खिलाफ एक कार को चलाने के बाद। "ओह देखो! उनका बायां पैर लगभग ठीक है! परीक्षण सफल रहा!" ... कोई भी फाइल सिस्टम आपकी मदद नहीं कर सकता है अगर अंतर्निहित हार्डवेयर घूमता है। एक्सएफएस में एक्स * की तुलना में तेजी से एफएसके है, और पर्याप्त समय बीतने के बाद और फाइलसिस्टम थोड़ा अधिक परिपक्व होता है, शायद btrfs भी काम करेगा। फिर ZFS है लेकिन लिनक्स पर इसका राज्य थोड़ा दुखी है।
Janne Pikkarainen

जवाबों:


22

यह फ़ाइल सिस्टम समस्या नहीं है, यह डिस्क 'भौतिक सीमाएँ है। यहाँ कुछ डेटा है:

एसएटीए ड्राइव आमतौर पर 10 ^ 14 के एक अपरिवर्तनीय रीड एरर रेट (यूआरई) के साथ निर्दिष्ट होते हैं। इसका मतलब है कि अगर काम ठीक है तो भी 12TB प्रति 1 बाइट अपरिवर्तित रूप से खो जाएगा

इसका मतलब है कि बिना RAID के आप डेटा खो देंगे भले ही कोई ड्राइव विफल न हो - RAID आपका एकमात्र विकल्प है।

यदि आप RAID5 (कुल क्षमता एन -1, जहां एन = डिस्क की संख्या) चुनते हैं, तो यह अभी भी पर्याप्त नहीं है। 10TB RAID5 के साथ 6 x 2TB HDD से युक्त, आपके पास प्रति वर्ष एक ड्राइव की विफलता का 20% मौका होगा और एक डिस्क के विफल होने के कारण, आपके पास RAID5 के सफलतापूर्वक 50% पुनः निर्माण और आपके डेटा का 100% पुनर्प्राप्त करने का मौका होगा। ।

मूल रूप से डिस्क की उच्च क्षमता और अपेक्षाकृत उच्च यूरे के साथ आपको एक बार फिर सिंगल डिस्क फेल्योर होने के लिए RAID6 की आवश्यकता होती है।

इसे पढ़ें: http://www.zdnet.com/blog/storage/why-raid-5-stops-working-in-2009/162


3
प्रतीक्षा, URE मतलब है अप्राप्य पढ़ें त्रुटि लेकिन इसका मतलब यह नहीं है कि डिस्क वास्तव में HAS त्रुटि। अगला पढ़ा हुआ (और शायद होगा) सही बिट लौटाएगा। ओएस शायद सेक्टर को फिर से पढ़ेगा और सही डेटा प्राप्त करेगा। आप स्मार्ट के बारे में बात करना भी भूल गए: इससे पहले कि कोई सेक्टर स्थायी रूप से क्षतिग्रस्त हो जाए, एसएमएआरटी इससे / से डेटा पढ़ने / लिखने की कोशिश करेगा। यदि यह बहुत अधिक विफलताओं का पता लगाता है, तो SMART बस सेक्टर की सामग्री को किसी अन्य स्थान पर ले जाता है और इस क्षेत्र को BAD के रूप में चिह्नित करता है और कोई भी इस पर फिर से लिखने में सक्षम नहीं होगा।
Avio

तो, आप बस से पूछे बिना डिस्क की टन खरीदने के लिए सुझाव दे रहे हैं क्यों अपने डिस्क इतना दोषपूर्ण है। यह गर्मी की समस्या हो सकती है, यह एक दोषपूर्ण एसएटीए नियंत्रक के साथ एक समस्या हो सकती है, यह खराब एसएटीए कनेक्टर्स, आदि आदि की समस्या हो सकती है
एविओ

@Avio मैं जो कह रहा हूं वह यह है कि 10TB डेटा के साथ आपने हार्ड डिस्क सीमाओं के कारण त्रुटियों को पढ़ा होगा, भले ही सभी डिस्क, SATA नियंत्रक, SATA कनेक्टर आदि सही स्थिति में हों और चश्मा के अनुसार काम कर रहे हों। मैं यह भी कह रहा हूं कि भले ही आप RAID को कम करने के लिए उपयोग करने का निर्णय लेते हैं कि आपको RAID6 के साथ जाना चाहिए क्योंकि डिस्क क्षमता + URE भी RAID5 को विश्वसनीय नहीं बनाती है। RAID5 पर एकल ड्राइव विफलता भी एक उच्च (50% FFS!) डेटा हानि की संभावना है।
c2h5oh

1
URE में @Avio यू के लिए खड़ा है अप्राप्य में के रूप में हमेशा के लिए चला।
c2h5oh

यह फ़ाइल सिस्टम समस्या हो सकती है, यदि आप लिखने की फाइल सिस्टम पर btrfs या xfs की तरह कॉपी का उपयोग करते हैं, तो आप संभवतः फ़ाइल के पिछले संस्करण को पुनर्प्राप्त कर सकते हैं, इसलिए केवल फ़ाइल में अंतिम परिवर्तन खो देते हैं। (अगर यह कभी बदल गया था)
जेन्स टिमरमैन

13

अपने आप को एक एहसान करो और अपने डिस्क के लिए एक RAID का उपयोग करें, यहां तक ​​कि सॉफ्टवेयर भी हो सकता है RAID mdadm के साथ। इस बारे में भी सोचें कि आपको "अक्सर अपने डिस्क पर त्रुटियां क्यों होती हैं" - यह सामान्य नहीं है सिवाय इसके कि जब आप RAID ग्रेड डिस्क के बजाय सस्ते डेस्कटॉप क्लास एसएटीए ड्राइव का उपयोग करते हैं।

उसके बाद, फ़ाइल सिस्टम अब महत्वपूर्ण नहीं है - ext4, xfs दोनों ठीक विकल्प हैं।


1
मैं सहमत हूं कि मुझे;) लेकिन मैं कई कारणों से RAID का उपयोग नहीं करता। मुख्य मूल्य एक है, क्योंकि वे 2-3 गुना अधिक महंगे हैं, और मैं वास्तव में ऐसा नहीं कर सकता। दूसरा कारण यह है कि पिछली बार जब मैंने RAID 5 का उपयोग किया था, तो मैं भाग्यशाली था कि दो खराब डिस्क प्राप्त करने से पहले मैं एक नया कनेक्ट कर सकता हूं और इसे फिर से सिंक कर सकता हूं (मेरे पास उस समय कोई अतिरिक्त डिस्क नहीं थी, मुझे इंतजार करना पड़ा नया एक; मैं मानता हूं कि RAID वर्ग डिस्क के साथ, मुझे यह समस्या होगी)। तीसरा कारण यह है कि जैसा कि मुझे स्टोर करना है डेटा बढ़ रहा है, मैं उत्तरोत्तर बड़े आकार के नए डिस्क जोड़ता हूं, जो मैं एक RAID कॉन्फ़िगरेशन के साथ नहीं कर सकता।
१।

इसलिए मैं यह देखने की कोशिश कर रहा हूं कि क्या कोई ऐसी फाइल सिस्टम मौजूद है जो मुझे किसी ऐसे कॉन्फ़िगरेशन में उपयोग करने की सलाह देगा जहां मैं अनियंत्रित डेटा पर भरोसा नहीं कर सकता। फिर भी, आपके उत्तर के लिए धन्यवाद!
अल्फातिगर

4
तो आप कह रहे हैं कि आपका डेटा अतिरिक्त खर्च के लायक नहीं है? यदि आप अपने डेटा की कम से कम दो प्रतियां नहीं रख सकते हैं, तो आपको इसे खो जाने पर विचार करना चाहिए। आप सही कह रहे हैं कि RAID5 शायद एक अच्छा विकल्प नहीं है, आपको शायद RAID6 या RAID10 को देखना चाहिए।
Zoredache

@alphatiger: यदि आपका समय और आपका डेटा बहुत सस्ता है तो डिस्क केवल बहुत महंगी हैं।
मोनिका को पुनः स्थापित करें - एम। श्रोडर

8

मेरे पास ZFS के साथ अच्छी किस्मत है, आप यह देखने के लिए जांच कर सकते हैं कि यह आपके द्वारा उपयोग किए जाने वाले डिस्ट्रो पर उपलब्ध है या नहीं। निष्पक्ष चेतावनी, इसका मतलब शायद आपके पूरे सिस्टम का पुनर्निर्माण करना होगा, लेकिन यह वास्तव में अच्छा प्रदर्शन और गलती-सहिष्णुता देता है।


मैं वर्तमान में डेबियन जीएनयू / लिनक्स का उपयोग करता हूं, ऐसा लगता है कि एक FUSE कार्यान्वयन है, लेकिन कोई पैकेज (लाइसेंस समस्याओं के कारण)। मैं शायद इसे एक कोशिश करूँगा (स्रोतों से संकलन करने के बाद, FUSE का उपयोग उच्च उत्पादन के लिए बहुत अच्छा नहीं है), मैं अपने पूरे फाइल सिस्टम को फिर से बनाने के बारे में चिंता नहीं करता। धन्यवाद !
१०:४६ पर १२

ZFS के लिए +1। पारंपरिक RAID चुपचाप भ्रष्ट डेटा को दिखाएगा क्योंकि यह पता करने के लिए पर्याप्त बुद्धिमान नहीं है कि ब्लॉक कब गलत हैं, या उन्हें कैसे सुधारें। दूसरी ओर ZFS भ्रष्ट ब्लॉक (चेकसम के माध्यम से) का पता लगाएगा और उन्हें ज्ञात अच्छी दर्पण प्रतियों से मरम्मत करेगा। FUSE के तहत ZFS चलाना, जबकि आदर्श नहीं है, कई वर्कलोड के लिए पर्याप्त प्रदर्शन करेगा। कहा जा रहा है, आपको उत्पादन वातावरण में उपयोग करने से पहले अपने आवेदन का परीक्षण करना चाहिए।
बहमट

1
ZFS के लिए एक और +1। यहाँ बहुत सारे सर्वर लिनक्स चल रहे हैं और मैं इसका बहुत बड़ा प्रशंसक हूँ, लेकिन ZFS ने पिछले 3+ वर्षों में मेरे लिए इतना उपयोगी साबित किया है कि मैं वास्तव में फ्रीबीएसडी सीखने और स्थापित करने के प्रयास से गुजरा हूँ किसी भी लाइसेंस या प्रदर्शन के मुद्दों के बिना ZFS का उपयोग करने में सक्षम होने के लिए बड़ी भंडारण मशीन।
ssc

मैं अपने पुराने सन वर्कस्टेशन पर सोलारिस के तहत इसे चला रहा हूं, और हार्डवेयर (सिंगल-कोर ओपर्टन @ 2.2GHz के साथ 3 जी मेमोरी और 250G एसएटीए ड्राइव की एक जोड़ी) पर विचार करते हुए प्रदर्शन कुछ भी अद्भुत नहीं है।
TM15

8

मैं उत्तरोत्तर बड़े आकार के नए डिस्क जोड़ता हूं

चूंकि आप LVM का उपयोग करने में दिलचस्प हैं, और आप कई ड्राइव्स को संभालना चाहते हैं, इसलिए सरल उत्तर यह होगा कि आप केवल मिरर फीचर का उपयोग करें जो LVM का हिस्सा है। बस अपने LVM में सभी भौतिक मात्राएँ जोड़ें। जब आप लॉजिकल वॉल्यूम बना रहे हों तो --mirrorsविकल्प पास करें । यह आपके डेटा को डुप्लिकेट करता है।

एक अन्य विकल्प सिर्फ कई RAID1 जोड़े को सेटअप करना हो सकता है। फिर PV के रूप में सभी RAID1 वॉल्यूम को अपने VG में जोड़ें। फिर जब भी आप अपने भंडारण का विस्तार करना चाहते हैं, तो बस एक जोड़ी डिस्क खरीदें।


7

आपको वास्तव में एक RAID 5, 6, 10, 50, या 60 का उपयोग करना चाहिए। यहां कुछ संसाधन आपके आरंभ करने के लिए हैं:

RAID के बारे में पृष्ठभूमि की जानकारी

कैसे और सेटअप

अतिरिक्त RAID लिंक के लिए मेरे स्वादिष्ट लिंक देखें: http://delicious.com/slmingol/raid


SvenW के जवाब पर मेरी टिप्पणियाँ देखें कि मैं वास्तव में RAID क्यों नहीं चाहता। (वास्तव में, मैंने पहले से ही एक कंपनी में कई सॉफ़्टवेयर RAID सेटअप किए थे जो इसे बर्दाश्त कर सकते थे ...) फिर भी, धन्यवाद!
१०:३४ पर १२

मैंने हमेशा RAID के लिए कमोडिटी ड्राइव का उपयोग किया है, कभी भी RAID उपयोग के लिए मूल्यांकन नहीं किया है और कभी भी इसके साथ कोई समस्या नहीं हुई है जब तक कि आप एक RAID चुनें जो इसके भीतर पर्याप्त अतिरेक है (RAID 6 या RAID 60)। एक RAID 6 का उपयोग करके आपको एक सम संख्या की आवश्यकता है। आप मौजूदा सदस्यों को बड़े डिस्क के साथ बदलकर और फिर नए डिस्क के स्थान में विकसित करके, आसानी से RAID विकसित कर सकते हैं।
SLM

4

यदि आप वास्तव में डेटा भ्रष्टाचार के बारे में चिंतित हैं, तो मैं एक चेकसम फाइल की सिफारिश करूंगा जैसे कि zfs और btrfs - हालांकि ध्यान दें कि btrfs को अभी भी विकास और उत्पादन-तैयार नहीं माना जाता है ।

ऐसा कोई गुरुत्व नहीं है कि डिस्क से पढ़ा गया डेटा (यहां तक ​​कि सफलतापूर्वक पढ़ा गया) सही होगा। ब्लॉक में चेकसम हैं, लेकिन वे सरल चेकसम हैं जो हमेशा त्रुटियों को नहीं पकड़ते हैं। ZFS जैसे नए फाइलसिस्टम फाइलों में अधिक सक्षम चेकसम संलग्न करते हैं और हार्ड डिस्क या RAID कंट्रोलर द्वारा देखे गए डेटा त्रुटियों को पकड़ नहीं सकते (और कथित तौर पर) उन्हें सुधारते हैं।


1

के रूप में @ C2H5OH कहते हैं , अप्राप्य महत्वपूर्ण है - इसका अर्थ है डिस्क पहले से ही करने की कोशिश की और क्षेत्र में फिर से पढ़ने के लिए नाकाम रही है।

मेरे अनुभव में, एक बार जब कोई डिस्क बिना पढ़ी गई त्रुटियों (URE) को उत्पन्न करना शुरू कर देती है, तो कुछ डेटा हमेशा के लिए खो जाता है, और आपकी एकमात्र आशा यह है कि आप GNU ddrescue का उपयोग करते हुए सभी डेटा का तुरंत बैकअप ले लें , जो कि असफल क्षेत्रों को पुन: प्रयास कर सकते हैं और साथ ही अप्राप्य को छोड़ सकते हैं।

मान लें कि आपके पास बैकअप है, तो वे URE के कारण अच्छी तरह से विफल हो सकते हैं, और निश्चित रूप से कुछ भ्रष्ट फाइलें होंगी, इसलिए आपको एक ही फाइल सिस्टम के विभिन्न बैकअप से डेटा का पूरा सेट एक साथ मिलाना होगा।

ZFS की सिफारिश करने वाले अन्य उत्तर पढ़ने योग्य हैं, क्योंकि इसके निरंतर डेटा स्क्रबिंग और RAID फीचर आपके डेटा को भविष्य में सुरक्षित रखने में मदद करेंगे - हालांकि अभी भी बैकअप का विकल्प नहीं है, जो उपयोगकर्ता और व्यवस्थापक त्रुटियों से भी बचाता है।

मैं केवल LVM का उपयोग करूंगा यदि आपको स्नैपशॉट की आवश्यकता नहीं है - यह RAID के साथ इतनी अच्छी तरह से एकीकृत नहीं है, इसमें डेटा स्क्रबिंग / डेटा चेकसम शामिल नहीं है, और आपको अभी भी बैकअप की आवश्यकता है, इसलिए ZFS जैसा कुछ शायद एक बेहतर विकल्प है। अधिक के लिए LVM समस्याओं और जोखिमों पर यह उत्तर देखें ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.