दीर्घकालिक, उच्च मात्रा, डेटा संग्रहण (अभिलेखीय) के लिए किस माध्यम का उपयोग किया जाना चाहिए?


59

यह प्रश्न https://superuser.com/questions/374386/how-to-store-and-preserve-lots-of-data से प्रेरित था । इसी तरह के अन्य प्रश्न हैं, लेकिन समान मानदंडों के साथ कोई भी नहीं।

यह एक में दो प्रश्न हैं।

  1. आप वित्तीय / महत्वपूर्ण रिकॉर्ड कैसे संग्रहीत करते हैं जो कुछ भी जीवित रहना चाहिए लेकिन एक आग और दशकों तक उपलब्ध होना चाहिए?
  2. आइए हम कहते हैं कि मैं परिवार के फोटो / वीडियो स्टोर करना चाहता हूं और चाहते हैं कि लोग उन्हें अभी से 100 साल बाद स्टोरेज में पा सकें और फिर भी उनका इस्तेमाल कर सकें। यह कैसे किया जाएगा?

मानदंड

  1. लंबी अवधि का मतलब है 30+ साल की गारंटी । 100+ साल का औसत। [यदि यह व्यावहारिक नहीं है, तो निकटतम समाधान का उपयोग करें]
  2. उच्च मात्रा का अर्थ है एक युगल टेराबाइट्स।
  3. उत्तर घर कार्यालय / छोटे व्यवसाय उपयोगकर्ता के लिए 'कोई समझौता / औद्योगिक' समाधान या व्यावहारिक समाधान नहीं हो सकते हैं।
  4. समय के दौरान मीडिया सक्रिय नहीं होगा। (यानी, यदि आप हार्ड ड्राइव का सुझाव देते हैं, तो वे कताई नहीं करेंगे)।
  5. इसके अलावा, इन अभिलेखागार को पढ़ने की आवश्यकता की कोई उम्मीद नहीं है। वे आपातकाल या "भविष्य की पीढ़ियों के लिए" उद्देश्यों के लिए हैं।
  6. रखरखाव की आवश्यकता नहीं होनी चाहिए (यदि संभव हो तो)।

मेरे विचार:

  1. सीडी-आर / डीवीडी-रुपये ने मुझे अल्पावधि में, बैकअप के लिए एक भयानक माध्यम साबित किया है। वे बहुत नाजुक लगते हैं और प्राचीन अवस्था में होने पर भी अपना डेटा बहुत कम समय के लिए खो देते हैं।
  2. मैं मदद नहीं कर सकता, लेकिन यह सोच सकता हूं कि 1TB HDD के एक जोड़े पर डेटा संग्रहीत करना और फिर उन्हें एक या दो दशक बाद सही ढंग से स्पिन करने की उम्मीद करना एक भयानक विचार है। क्या मै गलत हु?
  3. औद्योगिक टेप ड्राइव एक व्यवहार्य विकल्प की तरह लगते हैं?

मैं कोई विशेषज्ञ नहीं हूं, लेकिन मैं टेप कहूंगा। यह सवाल सर्वर फाल्ट पर बेहतर हो सकता है, लेकिन मुझे ईमानदारी से यह नहीं लगता कि यह पूरी तरह से फिट बैठता है, इसलिए मैं वोट देने से इनकार कर दूंगा। यह एक अच्छा सवाल है और इसे कहीं रहना चाहिए।
शिन्राय

मैं @Shinrai से सहमत हूं। मैं इसे कहीं और स्थानांतरित करने के लिए स्वागत कर रहा हूं अगर कोई टिप्पणी कर सकता है कि उसे कहां रहना चाहिए।
user606723

4
यदि आप कोई समझौता नहीं चाहते हैं, तो मौजूदा तकनीक है जिसे कम से कम 40,000 वर्षों के लिए बिना किसी हस्तक्षेप के बनाया गया है: voyager.jpl.nasa.gov/spacecraft/goldenrec.html
fixer1234

भविष्य क्रिस्टल में है, यह संभावित रूप से 360TB और पिछले एक लाख वर्षों को संग्रहीत कर सकता है। देखें: 5D 'सुपरमैन मेमोरी क्रिस्टल' हेराल्ड अनलिमिटेड लाइफटाइम डेटा स्टोरेज
kenorb

जवाबों:


20

कागज़

सीलबंद भंडारण में अभिलेखीय कागज पर अभिलेखीय स्याही के अलावा, कोई भी मौजूदा माध्यम किसी भी प्रकार के रखरखाव के बिना औसत 100 साल तक चलने वाला नहीं है।

अभिलेखीय कागज

लिनन और हेम्प जैसी सामग्रियों से पुराने कागजात बनाए गए थे, और इसलिए वे स्वाभाविक रूप से क्षारीय हैं। या एसिड मुक्त, इसलिए सैकड़ों वर्षों से स्थायी है। 20 वीं शताब्दी का पेपर और सबसे आधुनिक कागज आमतौर पर लकड़ी के गूदे से बनाया जाता है, जो अक्सर अम्लीय होता है और लंबे समय तक नहीं रहता है।

अभिलेखीय स्याही

ये स्थायी, गैर-लुप्त होती स्याही प्रकाश, गर्मी और पानी के लिए प्रतिरोधी हैं, और इसमें कोई अशुद्धियां नहीं हैं जो कागज या फोटोग्राफिक सामग्रियों की स्थायित्व को प्रभावित कर सकती हैं। ब्लैक एक्टिनिक स्याही रासायनिक रूप से स्थिर हैं और एक अकार्बनिक वर्णक की सुविधा है जिसमें अन्य स्याही पिगमेंट की तरह अशुद्धियों को अवशोषित करने की कोई प्रवृत्ति नहीं है।

निरर्थक भंडारण

टॉर्वाल्ड्स ने एक बार कहा था

केवल wimps ही टेप बैकअप का उपयोग करते हैं: _real_ पुरुष अपने महत्वपूर्ण सामान को ftp पर अपलोड करते हैं, और बाकी दुनिया को इसे आइना दिखाने देते हैं

जो आपको सुझाव देता है कि आपको एक ही माध्यम पर एक प्रति पर भरोसा नहीं करना चाहिए।

चुंबकीय मीडिया नहीं?

http://www.zdnet.com/blog/perlow/the-bell-tolls-for-your-magnetic-media/9364?tag=content;siu-container

  • चुंबकीय मीडिया के अप्रासंगिक गिरावट का विशिष्ट उदाहरण।
  • हार्डवेयर और सॉफ्टवेयर के मुद्दे (और डेटा प्रारूप)

स्पेशलाइज्ड सिस्टम नहीं

2002 में, बहुत आशंकाएं थीं कि डिस्क अपठनीय हो जाएंगी क्योंकि प्रारूप पढ़ने में सक्षम कंप्यूटर दुर्लभ हो गए थे और डिस्क को भी दुर्लभ तक पहुंचाने में सक्षम ड्राइव। मूल कोड के अनुकरण की कठिनाई के अलावा, एक प्रमुख मुद्दा यह था कि अभी भी छवियों को सिंगल-फ्रेम एनालॉग वीडियो के रूप में लेजरडिस्क पर संग्रहीत किया गया था,

http://en.wikipedia.org/wiki/BBC_Domesday_Project#Preservation

लंबी अवधि के व्यक्तिगत भंडारण

http://www.zdnet.com/blog/storage/long-term-personal-data-storage/376

  • मीडिया और प्रारूप दोनों ही अपठनीय हो सकते हैं।
  • एसिड मुक्त कागज पर वर्णक स्याही और एक शांत, सूखी और अंधेरे जगह में स्टोर के साथ प्रिंट करें।
  • पहली समस्या अधिकतम दीर्घायु के लिए डेटा प्रारूपों को चुनना है।
  • मालिकाना प्रारूप का उपयोग करने से बचें
  • USCSF अपने सभी मूल टेपों को स्थानांतरित कर रहा है - कई अब-अप्रचलित स्वरूपों जैसे कि BetaSP और VHS - को 75Mbit मोशनजैप2000 फॉर्मेट में

1
1) क्या आप इसके बारे में विवरण प्रदान कर सकते हैं? क्या सामान्य हार्ड कॉपी लंबे समय तक नहीं चलेगी? (100 साल पहले की तस्वीरें ठीक लगती हैं, AFAIK)। 2) यदि कोई वर्तमान डेटा माध्यम लंबे समय तक नहीं रहेगा, तो मेरा सुझाव है कि हम कोठरी समाधान का उपयोग करें। यह निराशाजनक है कि अब से दशकों तक हम पुराने बक्सों को नहीं देख पाएंगे और हमारे किसी भी पुराने, भूले हुए फोटो आदि को देखने में सक्षम होने की उम्मीद करेंगे
user606723

@ user606723: अद्यतन उत्तर देखें
RedGrittyBrick

मुझे लगा है कि एसिड-फ्री पेपर पर लेजर प्रिंटिंग डेटा (कुछ मेगाबाइट प्रति पृष्ठ) स्टोर करने का एक अच्छा तरीका होगा, जिसमें 100-200 वर्षों में पठनीय होने की उच्च संभावना है। इसे पढ़ने के लिए सॉफ्टवेयर अपेक्षाकृत सरल होगा, और एक मान लेता है कि स्कैनर हमेशा उपलब्ध होंगे, इसलिए प्रारूप (इतना लंबा नहीं कि बहुत जटिल हो) कभी भी वास्तव में "दूर" नहीं हो पाएगा, जो एक सक्षम शौकिया से उबरने की क्षमता से परे होगा।
डैनियल आर हिक्स

64

संक्षिप्त जवाब

एन्ट्रापी (जिसे मृत्यु भी कहा जाता है!) के कारण लंबे समय की गारंटी देना असंभव है। डिजिटल डेटा क्षय और मर जाता है, ब्रह्मांड में किसी भी अन्य चीज की तरह। लेकिन इसे धीमा किया जा सकता है।

वर्तमान में 30+ साल के कोल्ड डेटा आर्काइव की गारंटी देने के लिए कोई विफल-सबूत और वैज्ञानिक रूप से सिद्ध तरीका नहीं है। कुछ परियोजनाएं ऐसा करने का लक्ष्य रख रही हैं, जैसे कि लॉन्ग नाउ संग्रहालय की रोसेटा डिस्क परियोजना , हालांकि वे अभी भी बहुत महंगे हैं और कम डेटा घनत्व (लगभग 50 एमबी) के साथ हैं।

इस बीच, आप वैज्ञानिक रूप से सिद्ध रेजिलिएंट ऑप्टिकल माध्यमों का उपयोग कोल्ड स्टोरेज के लिए कर सकते हैं जैसे कि ब्लू-रे डिस्क HTL प्रकार पैनासोनिक, या आर्काइवल ग्रेड डीवीडी + आर जैसे वर्बेटिम गोल्ड आर्काइव, और उन्हें एयर-टाइट बॉक्स में सॉफ्ट स्पॉट में रखें (बचें) उच्च तापमान) और प्रकाश से बाहर।

इसके अलावा REDUNDANT हो : अपने डेटा (कम से कम 4) की कई प्रतियाँ बनाएँ, और हैश की गणना नियमित रूप से जाँचने के लिए करें कि सब कुछ ठीक है, और हर कुछ वर्षों में आपको अपने डेटा को नए डिस्क पर फिर से लिखना चाहिए। इसके अलावा, बहुत सारे त्रुटि सुधार कोड का उपयोग करें , वे आपको अपने दूषित डेटा को सुधारने की अनुमति देंगे!

लंबा जवाब

समय के साथ डेटा दूषित क्यों हैं? उत्तर एक शब्द में निहित है: एन्ट्रॉपी । यह ब्रह्मांड के प्राथमिक और अपरिहार्य बल में से एक है, जो सिस्टम को कम और कम समय में क्रमबद्ध बनाता है। डेटा भ्रष्टाचार बिल्कुल वही है: बिट्स ऑर्डर में एक विकार। तो दूसरे शब्दों में, ब्रह्मांड आपके डेटा से नफरत करता है

एन्ट्रापी से लड़ना बिल्कुल मौत से लड़ने जैसा है: आप कभी सफल होने की संभावना नहीं रखते। लेकिन, आप मौत को धीमा करने के तरीके पा सकते हैं, ठीक वैसे ही जैसे आप एन्ट्रापी को धीमा कर सकते हैं। आप भ्रष्टाचारों की मरम्मत करके भी एन्ट्रापी को रौंद सकते हैं (दूसरे शब्दों में: आप भ्रष्टाचारों को रोक नहीं सकते हैं, लेकिन यदि आप पहले से उपाय कर लेते हैं तो आप मरम्मत कर सकते हैं!)। बस जीवन और मृत्यु के बारे में कुछ भी, कोई जादू की गोली नहीं है, न ही सभी के लिए एक समाधान है, और सबसे अच्छा समाधान आपको सीधे अपने डेटा के डिजिटल क्यूरेशन में संलग्न करने की आवश्यकता है । और यहां तक ​​कि अगर आप सब कुछ सही ढंग से करते हैं, तो आपको अपने डेटा को सुरक्षित रखने की गारंटी नहीं है, आप केवल अपने अवसरों को अधिकतम करते हैं।

अच्छी खबर के लिए: अब आपके डेटा को रखने के लिए काफी कुशल तरीके हैं, यदि आप अच्छी गुणवत्ता वाले भंडारण माध्यमों और अच्छे अभिलेखीय / क्यूरेशन रणनीतियों को जोड़ते हैं : आपको विफलता के लिए डिज़ाइन करना चाहिए ।

अच्छी अवधि की रणनीतियाँ क्या हैं? आइए एक चीज़ को सीधे करें: अधिकांश जानकारी जो आप पाएंगे, वे बैकअप के बारे में होंगी, अभिलेखीय के बारे में नहीं। मुद्दा यह है कि अधिकांश लोग बैकअप रणनीतियों पर अपने ज्ञान को अभिलेखीय रूप से स्थानांतरित कर देंगे, और इस प्रकार बहुत सारे मिथक अब आम तौर पर सुने जाते हैं। दरअसल, कुछ वर्षों (बैकअप) के लिए डेटा संग्रहीत करना और कम से कम (अभिलेखीय) दशकों तक सबसे लंबे समय तक डेटा संग्रहीत करना पूरी तरह से अलग लक्ष्य हैं, और इस प्रकार विभिन्न उपकरणों और रणनीतियों की आवश्यकता होती है।

सौभाग्य से, बहुत सारे शोध और वैज्ञानिक परिणाम हैं, इसलिए मैं मंचों या पत्रिकाओं के बजाय उन वैज्ञानिक पत्रों को संदर्भित करने की सलाह देता हूं। यहाँ, मैं अपने कुछ पठन को सारांशित करूँगा।

इसके अलावा, दावों और गैर-स्वतंत्र वैज्ञानिक अध्ययनों से सावधान रहें , यह दावा करते हुए कि इस तरह के भंडारण माध्यम एकदम सही हैं। प्रसिद्ध बीबीसी डोमडेडे प्रोजेक्ट को याद रखें: «डिजिटल डोमेसडे बुक 15 साल नहीं 1000» तक रहता है । हमेशा वास्तव में स्वतंत्र कागजात के साथ अध्ययनों को दोहराएं, और यदि कोई नहीं है, तो हमेशा मान लें कि संग्रहण माध्यम अभिलेखीय के लिए अच्छा नहीं है।

आइए स्पष्ट करें कि आप क्या देख रहे हैं (अपने प्रश्न से):

  • लंबे समय तक अभिलेखीय : आप अपने समझदार, अपूरणीय "व्यक्तिगत" डेटा की प्रतियां रखना चाहते हैं। अभिलेखीकरण एक बैकअप की तुलना में मौलिक रूप से अलग है , साथ ही यहाँ समझाया गया है : बैकअप गतिशील तकनीकी डेटा के लिए हैं जो नियमित रूप से अपडेट होते रहते हैं और इस तरह बैकअप (यानी, ओएस, वर्क फोल्डर लेआउट, आदि) में ताज़ा होने की आवश्यकता होती है, जबकि अभिलेखागार स्थिर डेटा हैं आप की संभावना हैं केवल एक बार लिखने और बस को पढ़ने से समय-समय परअभिलेखीय अंतरंग डेटा के लिए हैं , आमतौर पर व्यक्तिगत।

  • कोल्ड स्टोरेज : आप अपने संग्रहीत डेटा के रखरखाव से यथासंभव बचना चाहते हैं। यह एक बड़ी बाधा है, क्योंकि इसका मतलब है कि माध्यम को घटकों और एक लेखन पद्धति का उपयोग करना चाहिए जो आपके हिस्से से किसी भी हेरफेर के बिना, और कंप्यूटर या विद्युत आपूर्ति के किसी भी कनेक्शन की आवश्यकता के बिना बहुत लंबे समय तक स्थिर रहता है।

हमारे विश्लेषण को आसान बनाने के लिए, आइए पहले कोल्ड स्टोरेज समाधानों का अध्ययन करें, और फिर दीर्घकालिक अभिलेखीय रणनीतियों का अध्ययन करें।

कोल्ड स्टोरेज माध्यम

हमने ऊपर परिभाषित किया है कि एक अच्छा कोल्ड स्टोरेज माध्यम क्या होना चाहिए: इसे बिना किसी हेरफेर के लंबे समय तक डेटा बनाए रखना चाहिए (इसलिए इसे "कोल्ड" कहा जाता है: आप इसे केवल एक कोठरी में स्टोर कर सकते हैं और आपको इसे प्लग करने की आवश्यकता नहीं है एक कंप्यूटर डेटा को बनाए रखने के लिए)।

कागज पृथ्वी पर सबसे लचीला भंडारण माध्यम की तरह लग सकता है, क्योंकि हम अक्सर प्राचीन युगों से बहुत पुरानी पांडुलिपि पाते हैं। हालांकि, पेपर बड़ी कमियों से ग्रस्त है: सबसे पहले, डेटा घनत्व बहुत कम है (एक कागज पर ~ 100 केबी से अधिक स्टोर नहीं कर सकता है, यहां तक ​​कि छोटे अक्षरों और कंप्यूटर टूल के साथ भी), और यह समय के साथ इसे मॉनिटर करने के लिए बिना किसी तरीके से गिरावट करता है: पेपर , हार्ड ड्राइव की तरह, मूक भ्रष्टाचार से पीड़ित हैं। लेकिन जब आप डिजिटल डेटा पर मूक भ्रष्टाचार की निगरानी कर सकते हैं, तो आप कागज पर नहीं कर सकते। उदाहरण के लिए, आप यह गारंटी नहीं दे सकते कि एक चित्र केवल एक दशक में एक ही रंग को बनाए रखेगा: रंग नीचा हो जाएगा, और आपके पास यह खोजने का कोई तरीका नहीं है कि मूल रंग क्या थे। बेशक, आप क्यूरेट कर सकते हैं यदि आप चित्र बहाली में समर्थक हैं, लेकिन यह अत्यधिक समय लेने वाला है, जबकि डिजिटल डेटा के साथ, आप इस अवधि और बहाली प्रक्रिया को स्वचालित कर सकते हैं।

हार्ड ड्राइव (HDDs) कर रहे हैं जाना जाता है के लिए है 3 से 8 साल की औसत जीवन काल: वे सिर्फ समय के साथ गिरावट नहीं करते, वे कर रहे हैं अंत में मरने के लिए गारंटी (यानी: दुर्गम)। निम्नलिखित घटता सभी HDDs के लिए एक चौंका देने वाली दर से मरने की प्रवृत्ति दिखाते हैं:

बाथटब वक्र ने HDD विफलता दर के विकास को दर्शाते हुए त्रुटि प्रकार दिया (यह किसी भी इंजीनियर डिवाइस पर भी लागू होता है):

वक्र hdd1

HDD विफलता दर दिखाते हुए वक्र, सभी त्रुटि प्रकार मर्ज किए गए: वक्र hdd2

स्रोत: बैकब्लेज

आप देख सकते हैं कि उनकी विफलता के लिए अपेक्षाकृत रूप से 3 प्रकार के एचडीडी हैं: तेजी से मरने वाले (जैसे: विनिर्माण त्रुटि, खराब गुणवत्ता वाले एचडीडी, सिर की विफलता, आदि), लगातार मरने की दर (अच्छे निर्माण), वे विभिन्न के लिए मर जाते हैं " सामान्य "कारण, यह अधिकांश HDDs के लिए मामला है), और अंत में मजबूत वाले जो कि ज्यादातर HDDs की तुलना में थोड़ा लंबा रहते हैं और अंततः" सामान्य वाले "के बाद जल्द ही मर जाते हैं (जैसे: भाग्यशाली HDDs, बहुत ज्यादा इस्तेमाल नहीं किया जाता है,) आदर्श पर्यावरण की स्थिति, आदि ..)। इस प्रकार, आपको गारंटी दी जाती है कि आपका HDD मर जाएगा।

HDDs इतनी बार क्यों मरते हैं? मेरा मतलब है, डेटा एक चुंबकीय डिस्क पर लिखा गया है, और चुंबकीय क्षेत्र लुप्त होती से पहले दशकों तक रह सकता है। वे मर जाते हैं इसका कारण यह है कि भंडारण माध्यम (चुंबकीय डिस्क) और रीडिंग हार्डवेयर (इलेक्ट्रॉनिक बोर्ड + कताई सिर) युग्मित हैं : उन्हें अलग नहीं किया जा सकता है, आप सिर्फ चुंबकीय डिस्क नहीं निकाल सकते हैं और इसे दूसरे सिर के साथ पढ़ सकते हैं, क्योंकि पहले इलेक्ट्रॉनिक बोर्ड (जो भौतिक डेटा को डिजिटल में परिवर्तित करता है) लगभग प्रत्येक HDD (यहां तक ​​कि एक ही ब्रांड और संदर्भ के लिए अलग है), यह मूल कारखाने पर निर्भर करता है), और कताई सिर के साथ आंतरिक तंत्र इतना जटिल है कि आजकल यह असंभव है एक मानव के लिए पूरी तरह से उन्हें मारने के बिना चुंबकीय डिस्क पर एक कताई सिर रखें।

इसके अलावा, हार्ड ड्राइव करने के लिए जाना जाता है की शक्ति को हटाना समय के साथ करता है, तो (एसएसडी सहित) का उपयोग नहीं किया। इस प्रकार, आप केवल हार्ड डिस्क पर डेटा स्टोर नहीं कर सकते हैं, इसे एक कोठरी में स्टोर कर सकते हैं और सोच सकते हैं कि यह किसी भी बिजली के कनेक्शन के बिना डेटा को बनाए रखेगा: आपको अपने एचडीडी को प्रति वर्ष या प्रति जोड़े कम से कम एक बार एक विद्युत स्रोत पर प्लग करने की आवश्यकता है । इस प्रकार, एचडीडी स्पष्ट रूप से कोल्ड स्टोरेज के लिए एक अच्छा फिट नहीं है।

चुंबकीय टेप : उन्हें अक्सर बैकअप जरूरतों के लिए, और अभिलेखीय के लिए विस्तार से जाना जाता है। चुंबकीय टेप के साथ समस्या यह है कि वे बहुत संवेदनशील होते हैं: चुंबकीय ऑक्साइड कण सूरज, पानी, हवा, खरोंच से खराब हो सकते हैं, समय से ध्वस्त हो सकते हैं या किसी भी विद्युत चुम्बकीय उपकरण या बस समय के साथ गिर सकते हैं, या प्रिंट-थ्रू हो सकते हैं । इसलिए वे आमतौर पर पेशेवरों द्वारा केवल डेटासेंटर में उपयोग किए जाते हैं। इसके अलावा, यह कभी साबित नहीं हुआ है कि वे एक दशक से अधिक समय तक डेटा को बनाए रख सकते हैं। तो, उन्हें अक्सर बैकअप के लिए सलाह क्यों दी जाती है? क्योंकि वे सस्ते हुआ करते थे: पिछले दिनों में, HDD की तुलना में चुंबकीय टेपों का उपयोग करने के लिए यह 10x से 100x सस्ता था, और HDDs अब की तुलना में बहुत कम स्थिर थे। इसलिए चुंबकीय टेप को मुख्य रूप से लागत प्रभावशीलता के कारण बैकअप के लिए सलाह दी जाती हैनहीं, क्योंकि यह डेटा संग्रह करने की बात आती है, जो कि हमारे लिए सबसे ज्यादा हितकारी है।

कॉम्पैक्टफ्लैश और सिक्योर डिजिटल (एसडी) कार्ड काफी मजबूत और मजबूत होने के लिए जाने जाते हैं, जो विनाशकारी परिस्थितियों से बचने में सक्षम हैं

अधिकांश कैमरों में मेमोरी कार्ड वस्तुतः अविनाशी हैं, जो डिजिटल कैमरा शॉपर्स पत्रिका में पाए जाते हैं। पांच मेमोरी कार्ड फॉर्मेट कॉफ़ी या कोला में उबला, रौंदा, धोया और डुबोया जाने से बचे।

हालांकि, किसी भी अन्य चुंबकीय आधारित माध्यम के रूप में, यह डेटा को बनाए रखने के लिए एक विद्युत क्षेत्र पर निर्भर करता है, और इस प्रकार यदि कार्ड रस से बाहर निकलता है, तो डेटा पूरी तरह से खो सकता है। इस प्रकार, कोल्ड स्टोरेज के लिए एक सही फिट नहीं है (जैसा कि आपको कभी-कभार इलेक्ट्रिकल क्षेत्र को ताज़ा करने के लिए कार्ड पर पूरे डेटा को फिर से लिखना होगा), लेकिन यह बैकअप और लघु या मध्यम अवधि के अभिलेखीय के लिए एक अच्छा माध्यम हो सकता है।

ऑप्टिकल माध्यम: ऑप्टिकल माध्यम स्टोरेज माध्यमों का एक वर्ग है जो डेटा को पढ़ने के लिए लेजर पर निर्भर करता है, जैसे सीडी, डीवीडी या ब्लू-रे (बीडी)। इसे कागज के विकास के रूप में देखा जा सकता है, लेकिन हम डेटा को इतने छोटे आकार में लिखते हैं, कि हमें कागज की तुलना में अधिक सटीक और लचीला सामग्री की आवश्यकता होती है, और ऑप्टिकल डिस्क बस इतना ही है। ऑप्टिकल माध्यमों के दो सबसे बड़े लाभ यह है कि स्टोरेज माध्यम को रीडिंग हार्डवेयर से अलग कर दिया जाता है (यानी, यदि आपका डीवीडी रीडर विफल हो जाता है, तो आप हमेशा अपनी डिस्क को पढ़ने के लिए एक और खरीद सकते हैं) और यह लेजर पर आधारित है, जो इसे सार्वभौमिक बनाता है और भविष्य का प्रमाण (यानी, जब तक आप जानते हैं कि लेजर कैसे बनाया जाता है, आप इसे हमेशा ऑप्टिकल डिस्क के बिट्स को एमुलेशन द्वारा पढ़ने के लिए ट्विक कर सकते हैं, ठीक उसी तरह जैसे CAMILEON ने डोमेसडे बीबीसी प्रोजेक्ट के लिए किया था )।

किसी भी तकनीक की तरह, नए पुनरावृत्तियों न केवल बड़े घनत्व (भंडारण कक्ष) की पेशकश करते हैं, बल्कि बेहतर त्रुटि सुधार, और पर्यावरणीय क्षय (हमेशा नहीं, लेकिन आम तौर पर सच है) के खिलाफ बेहतर लचीला होते हैं। डीवीडी विश्वसनीयता के बारे में पहली बहस डीवीडी-आर और डीवीडी + आर के बीच थी, और भले ही डीवीडी-आर आजकल भी आम हैं, डीवीडी + आर को अधिक विश्वसनीय और सटीक माना जाता है । अब आर्काइव ग्रेड डीवीडी डिस्क हैं, विशेष रूप से कोल्ड स्टोरेज के लिए बनाई गई हैं, यह दावा करते हुए कि वे बिना किसी रखरखाव के न्यूनतम ~ 20 साल का सामना कर सकती हैं:

Verbatim Gold Archival DVD-R [...] को अच्छी तरह से मानी जाने वाली जर्मन पत्रिका (16/2008 नहीं, पृष्ठ 116-123) द्वारा लंबे समय तक तनाव परीक्षण में सबसे विश्वसनीय DVD-R का दर्जा दिया गया है। ) [...] 18 साल की न्यूनतम स्थायित्व और 32 से 127 साल की औसत स्थायित्व (25 सी, 50% आर्द्रता पर) प्राप्त कर रहा है। इन मूल्यों के करीब कहीं भी कोई अन्य डिस्क नहीं आई, दूसरे सर्वश्रेष्ठ डीवीडी-आर में केवल 5 वर्षों का न्यूनतम स्थायित्व था।

LinuxTech.net से

इसके अलावा, कुछ कंपनियां बहुत लंबे समय तक डीवीडी अभिलेखीय क्षेत्र में विशेषज्ञता प्राप्त करती हैं और बड़े पैमाने पर उन्हें बाजार देती हैं, जैसे कि मिलेनियाटा या डेटाट्रेसडिस्क से एम-डिस्क, यह दावा करते हुए कि वे 1000 से अधिक वर्षों तक डेटा बनाए रख सकते हैं, और कुछ (गैर-स्वतंत्र) अध्ययनों से सत्यापित हैं 2009) कम-वैज्ञानिक दूसरों के बीच ।

यह सब बहुत आशाजनक लगता है! दुर्भाग्य से, इन दावों की पुष्टि करने के लिए पर्याप्त स्वतंत्र वैज्ञानिक अध्ययन नहीं हैं, और जो कुछ उपलब्ध हैं वे इतने उत्साही नहीं हैं:

आर्द्रता (80% आरएच) और तापमान (80 डिग्री सेल्सियस) डेटा की पठनीयता की नियमित जाँच के साथ 2000 घंटे (लगभग 83 दिन) परीक्षण से अधिक डीवीडी पर उम्र बढ़ने में तेजी आई: कई डीवीडी ब्रांडों पर आर्द्रता और तापमान में तेजी आई

डिजिटल डेटा अभिलेखीय (अभिलेखागार डी फ्रांस) के लिए फ्रेंच संस्थान से अनुवादित, 2012 से अध्ययन।

धीमी गति से विकास के साथ पहला ग्राफ डीवीडी दिखाता है। तेजी से गिरावट के साथ दूसरा एक डीवीडी घटता है। और तीसरा एक विशेष "बहुत लंबे समय तक" डीवीडी के लिए है जैसे एम-डिस्क और डेटाट्रेसडिस्क। जैसा कि हम देख सकते हैं, उनका प्रदर्शन मानक, गैर अभिलेखीय ग्रेड डीवीडी के साथ कम या बराबर होने के दावों के लिए बिल्कुल फिट नहीं है!

हालांकि, एम-डिस्क और डेटाट्रेसडिस्क जैसे अकार्बनिक ऑप्टिकल डिस्क को एक फायदा मिलता है: वे प्रकाश गिरावट के लिए काफी असंवेदनशील हैं:

240 घंटे के दौरान प्रकाश (750 W / m during) का उपयोग करते हुए त्वरित उम्र बढ़ने: कई डीवीडी ब्रांडों पर प्रकाश त्वरित उम्र बढ़ने

ये शानदार परिणाम हैं, लेकिन एक अभिलेखीय ग्रेड डीवीडी जैसे कि वर्बेटिम गोल्ड आर्काइव भी उसी प्रदर्शन को प्राप्त करता है, और इसके अलावा, प्रकाश एक वस्तु के लिए सबसे अधिक नियंत्रणीय पैरामीटर है: डीवीडी को एक बंद बॉक्स या अलमारी में रखना काफी आसान है, और इस प्रकार प्रकाश के किसी भी संभावित प्रभाव को दूर करना। यह एक डीवीडी पाने के लिए अधिक उपयोगी होगा जो प्रकाश की तुलना में तापमान और आर्द्रता के लिए बहुत लचीला है।

इसी शोध टीम ने ब्लू-रे बाजार का भी अध्ययन किया, यह देखने के लिए कि क्या लंबे समय तक कोल्ड स्टोरेज के लिए अच्छे माध्यम वाला कोई ब्रांड होगा। यहाँ उनकी खोज है:

डीवीडी के रूप में एक ही पैरामीटर के तहत कई ब्लू-रे ब्रांडों पर आर्द्रता और तापमान में तेजी आई है: अस्थायी-bd

कई BluRays ब्रांडों पर प्रकाश त्वरित उम्र बढ़ने, एक ही मापदंडों: प्रकाश bd

आर्काइव्स डी फ्रांस, 2012 के इस अध्ययन से अनुवादित।

यहाँ और यहाँ सभी निष्कर्षों के दो सारांश (फ्रेंच में) ।

ठीक है, सबसे अच्छा ब्लू-रे डिस्क (पैनासोनिक से) ने नमी और तापमान परीक्षण में सर्वश्रेष्ठ अभिलेखीय ग्रेड डीवीडी के समान प्रदर्शन किया, जबकि प्रकाश के लगभग असंवेदनशील होने के कारण! और यह ब्लू-रे डिस्क अभिलेखीय ग्रेड भी नहीं है। इसके अलावा, ब्लू-रे डिस्क डीवीडी की तुलना में एक बढ़ी हुई त्रुटि सुधार कोड का उपयोग करते हैं (स्वयं सीडी में अपेक्षाकृत संस्करण का उपयोग करके), जो डेटा खोने के जोखिम को कम करता है। इस प्रकार, ऐसा लगता है कि कुछ BluRay डिस्क कोल्ड स्टोरेज के लिए एक बहुत अच्छा विकल्प हो सकता है।

और वास्तव में, कुछ कंपनियों ने पैनासोनिक और सोनी की तरह अभिलेखीय ग्रेड, उच्च घनत्व भंडारण ब्लू-रे डिस्क पर काम करना शुरू कर दिया है, यह घोषणा करते हुए कि वे 50 वर्षों के औसत जीवन काल के साथ 300 जीबी से 1 टीबी स्टोरेज की पेशकश कर पाएंगे। इसके अलावा, बड़ी कंपनियां अपने आप को कोल्ड स्टोरेज के लिए ऑप्टिकल माध्यमों की ओर मोड़ रही हैं (क्योंकि यह बहुत कम संसाधनों की खपत करता है क्योंकि आप उन्हें बिना किसी बिजली की आपूर्ति के स्टोर कर सकते हैं), जैसे कि फेसबुक ने ब्लू-रे डिस्क का उपयोग करने के लिए एक "रोबोट" के रूप में विकसित किया "कोल्ड" भंडारण " डेटा के लिए उनके सिस्टम शायद ही कभी एक्सेस करते हैं।

लंबे समय से अभिलेखीय पहल: लॉन्ग नाउ संग्रहालय द्वारा रोसेटा डिस्क परियोजना जैसे अन्य दिलचस्प लीड हैं , जो पृथ्वी पर हर भाषा में उत्पत्ति के माइक्रोस्कोपिक रूप से स्केल किए गए पृष्ठों को लिखने के लिए एक परियोजना है जिसका उत्पत्ति अनुवाद किया गया। यह एक महान परियोजना है, जो एक ऐसा माध्यम है जो 50 एमबी स्टोर करने की अनुमति देता है, जो वास्तव में बहुत लंबे समय तक कोल्ड स्टोरेज (क्योंकि यह कार्बन में लिखा है) के लिए स्टोर करने की अनुमति देता है, और भविष्य में प्रूफ का उपयोग करने के लिए आपको केवल एक आवर्धक की आवश्यकता होती है। डेटा (कोई अजीब प्रारूप विनिर्देशों और न ही तकनीकी परेशानी जैसे कि ब्लू-रे के वायलेट बीम को संभालने के लिए, बस एक आवर्धक की जरूरत है!)। हालांकि, ये अभी भी मैन्युअल रूप से बनाए गए हैं और इस प्रकार लगभग $ 20K खर्च करने का अनुमान है, जो कि मेरे हिसाब से एक व्यक्तिगत अभिलेखीय योजना के लिए बहुत अधिक है।

इंटरनेट आधारित समाधान: फिर भी आपके डेटा को कोल्ड स्टोर में रखने का एक और माध्यम नेट पर है। हालांकि, क्लाउड बैकअप सॉल्यूशंस एक अच्छी फिट नहीं हैं, क्योंकि क्लाउड होस्टिंग कंपनियों की तुलना में प्राथमिक चिंता तब तक नहीं रह सकती है जब तक आप अपना डेटा रखना चाहेंगे। अन्य कारणों में यह तथ्य शामिल है कि यह बैकअप के लिए बुरी तरह से धीमा है (क्योंकि यह इंटरनेट के माध्यम से स्थानांतरित होता है) और अधिकांश प्रदाताओं को यह आवश्यक है कि फाइलें आपके सिस्टम पर उन्हें ऑनलाइन रखने के लिए भी मौजूद हों। उदाहरण के लिए, CrashPlan और Backblaze दोनों उन फ़ाइलों को स्थायी रूप से हटा देंगे, जो पिछले 30 दिनों में कम से कम एक बार आपके कंप्यूटर पर दिखाई नहीं देती हैं, इसलिए यदि आप बैकअप डेटा अपलोड करना चाहते हैं जिसे आप केवल बाहरी हार्ड ड्राइव पर संग्रहीत करते हैं, तो आपको अपना प्लग इन करना होगा USB HDD प्रति माह कम से कम एक बार और उलटी गिनती रीसेट करने के लिए अपने क्लाउड के साथ सिंक करें। हालाँकि, कुछ क्लाउड सेवाएं आपकी फ़ाइलों को अनिश्चित काल तक रखने की पेशकश करती हैं (जब तक कि आप निश्चित रूप से भुगतान करते हैं) बिना किसी उलटी गिनती के स्पाइडरऑक के रूप में। इसलिए क्लाउड बेस्ड बैकअप सॉल्यूशन की शर्तों और उपयोग से सावधान रहें।

क्लाउड बैकअप प्रदाताओं का एक विकल्प यह है कि आप अपने निजी सर्वर को ऑनलाइन किराए पर लें, और यदि संभव हो तो हार्डवेयर विफलता के मामले में अपने डेटा के स्वत: मिररिंग / बैकअप के साथ एक का चयन करें , लेकिन निश्चित रूप से यह अधिक महंगा है)। यह एक महान समाधान है, पहला क्योंकि आप अभी भी अपना डेटा रखते हैं, और दूसरी बात यह है कि आपको हार्डवेयर की विफलताओं का प्रबंधन नहीं करना पड़ेगा, यह आपके होस्ट की जिम्मेदारी है। और यदि एक दिन आपका होस्ट व्यवसाय से बाहर चला जाता है, तो भी आप अपना डेटा वापस पा सकते हैं (एक गंभीर होस्ट चुनें, ताकि वे रात को बंद न हों लेकिन आपको पहले से सूचित कर दें, हो सकता है कि आप उसे अनुबंध पर रख सकें), और कहीं और पुनः स्थापित करना।

यदि आप अपने निजी ऑनलाइन सर्वर को स्थापित करने की परेशानी नहीं चाहते हैं, और यदि आप इसे वहन कर सकते हैं, तो अमेज़ॅन एक नई डेटा संग्रह सेवा प्रदान करता है, जिसे ग्लेशियर कहा जाता है । इसका उद्देश्य लंबे समय के लिए आपके डेटा को कोल्ड स्टोर करना है: इस प्रकार, ग्लेशियर पर डेटा स्टोर करने में बहुत खर्च होता है, लेकिन इस डेटा को वापस पाने के लिए और भी अधिक लागत आती है, क्योंकि यह सेवा डेटा को पहुंच से बाहर रखने के लिए बनाई गई है , उन डेटा को रखने के लिए नहीं जिन्हें आप अक्सर एक्सेस करना चाहते हैं। इसका मतलब है कि यह सेवा डेटा लिखने के लिए कीमतों को उद्धृत करती है, लेकिन उन्हें पढ़ने के लिए भी। इस सेवा की एक बड़ी लागत है, लेकिन यह आपके सबसे समझदार डेटा में से कुछ के लिए एक अच्छा सौदा हो सकता है (यानी: यदि आपके पास कुछ पाठ फ़ाइलें या छवियां हैं जो बहुत समझदार हैं, क्योंकि इस तरह का डेटा आमतौर पर छोटे आकार का होता है, यह एक ग्लेशियर में स्टोर करने के लिए आपको बहुत अधिक लागत नहीं होगी)।

कोल्ड स्टोरेज की कमियाँ : हालाँकि, किसी भी कोल्ड स्टोरेज माध्यम में एक बड़ी खामी है: कोई अखंडता की जाँच नहीं है, क्योंकि कोल्ड स्टोरेज माध्यमों में स्वतः डेटा की अखंडता की जाँच नहीं हो सकती है (वे केवल त्रुटि सुधार योजनाओं को "ठीक" करने के लिए थोड़ा सा लागू कर सकते हैं) भ्रष्टाचार होने के बाद नुकसान हुआ है, लेकिन इसे रोका नहीं जा सकता है और न ही स्वचालित रूप से प्रबंधित किया जा सकता है!) क्योंकि, कंप्यूटर के विपरीत, कंप्यूटरीकरण / जांच / गणना और फाइल सिस्टम को सही करने के लिए कोई प्रसंस्करण इकाई नहीं है। जबकि एक कंप्यूटर और कई स्टोरेज यूनिट्स के साथ, आप अपने अभिलेखागार की अखंडता की जांच स्वचालित रूप से कर सकते हैं और यदि आवश्यक हो तो डेटा संग्रह में कुछ भ्रष्टाचार हुआ (जब तक कि आपके पास एक ही संग्रह की कई प्रतियां हैं) पर स्वचालित रूप से किसी अन्य इकाई पर दर्पण।

लंबे समय तक अभिलेखीय

वर्तमान में उपलब्ध सर्वोत्तम तकनीकों के साथ भी, डिजिटल डेटा को केवल कुछ दशकों (लगभग 20 वर्ष) तक ही संग्रहीत किया जा सकता है। इस प्रकार, लंबे समय में, आप सिर्फ कोल्ड स्टोरेज पर भरोसा नहीं कर सकते हैं: आपको यह सुनिश्चित करने के लिए अपने डेटा संग्रह प्रक्रिया के लिए एक कार्यप्रणाली को सेटअप करने की आवश्यकता है ताकि यह सुनिश्चित किया जा सके कि आपका डेटा भविष्य में प्राप्त किया जा सकता है (यहां तक ​​कि तकनीकी परिवर्तनों के साथ), और यह कि आप जोखिमों को कम करते हैं अपना डेटा खोने के। दूसरे शब्दों में, आपको अपने डेटा के डिजिटल क्यूरेटर बनने की ज़रूरत है , जब वे होते हैं तो भ्रष्टाचारों की मरम्मत करते हैं और ज़रूरत पड़ने पर नई प्रतियों को फिर से बनाते हैं।

कोई मूर्खतापूर्ण नियम नहीं है, लेकिन यहां कुछ स्थापित क्यूरेटिंग रणनीतियां हैं , और विशेष रूप से एक जादुई उपकरण है जो आपके काम को आसान बना देगा:

  • अतिरेक / प्रतिकृति सिद्धांत : अतिरेक एकमात्र उपकरण है जो एन्ट्रापी के प्रभावों को वापस ला सकता है , जो सूचना सिद्धांत पर आधारित एक सिद्धांत है। डेटा रखने के लिए, आपको इस डेटा को डुप्लिकेट करना होगा। त्रुटि कोड वास्तव में अतिरेक सिद्धांत का एक स्वचालित अनुप्रयोग है। हालाँकि, आपको यह भी सुनिश्चित करने की आवश्यकता है कि आपका डेटा निरर्थक है: अलग-अलग डिस्क पर एक ही डेटा की कई प्रतियां, विभिन्न माध्यमों पर कई प्रतियां (ताकि यदि एक माध्यम आंतरिक समस्याओं के कारण विफल हो जाए, तो बहुत कम संभावना है कि अलग-अलग माध्यमों पर अन्य एक ही समय में विफल भी होंगे), आदि विशेष रूप से। , आपके पास हमेशा आपके डेटा की कम से कम 3 प्रतियां होनी चाहिए, जिसे इंजीनियरिंग में 3-मॉड्यूलर अतिरेक भी कहा जाता है, ताकि यदि आपकी प्रतियां दूषित हो जाएं, तो आप अपनी 3 प्रतियों से अपनी फ़ाइलों की मरम्मत के लिए एक साधारण बहुमत वोट डाल सकते हैं। नाविक की कम्पास सलाह को हमेशा याद रखें:

दो कम्पास लाना बेकार है, क्योंकि अगर कोई गलत हो जाता है, तो आप कभी नहीं जान सकते कि कौन सही है, या दोनों गलत हैं। हमेशा एक कम्पास, या तीन से अधिक लें।

  • कोड सुधारने में त्रुटि : यह जादुई उपकरण है जो आपके जीवन को आसान और आपके डेटा को सुरक्षित बनाएगा। त्रुटि सुधार कोड (ईसीसी) एक गणितीय निर्माण है जो डेटा उत्पन्न करेगा जिसका उपयोग आपके डेटा को सुधारने के लिए किया जा सकता है। यह अधिक कुशल है, क्योंकि ECC आपके डेटा की बहुत अधिक मरम्मत कर सकता है , जो साधारण प्रतिकृति की तुलना में बहुत कम संग्रहण स्थान का उपयोग करता है (अर्थात, आपकी फ़ाइलों की कई प्रतियाँ बना रहा है), और वे यह जाँचने के लिए भी उपयोग की जा सकती हैं कि आपकी फ़ाइल में कोई है या नहीं भ्रष्टाचार, और यहां तक ​​कि पता लगा सकते हैं कि वे भ्रष्टाचार कहां हैं। वास्तव में, यह वास्तव में अतिरेक सिद्धांत का एक अनुप्रयोग है, लेकिन प्रतिकृति की तुलना में एक चतुर तरीके से। यह तकनीक आजकल किसी भी लंबी दूरी के संचार में उपयोग की जाती है, जैसे कि 4 जी, वाईमैक्स और यहां तक ​​कि नासा के अंतरिक्ष संचार भी। हालांकि, ECCs दूरसंचार में सर्वव्यापी हैं, वे फ़ाइल मरम्मत में नहीं हैं, शायद इसलिए कि यह थोड़ा जटिल है। हालांकि, कुछ सॉफ्टवेयर उपलब्ध हैं, जैसे कि प्रसिद्ध (लेकिन अब पुराना) PAR2, डीवीडी डिजास्टर (जो ऑप्टिकल डिस्क पर त्रुटि सुधार कोड जोड़ने की पेशकश करता है) और pyFileFixity (जो मैं PAR2 सीमाओं और मुद्दों को दूर करने के लिए विकसित करता हूं)। फाइल सिस्टम भी हैं जो रीड-सोलोमन को वैकल्पिक रूप से लागू करते हैं जैसे कि लिनक्स के लिए जेडएफएस या विंडोज के लिए ReFS, जो तकनीकी रूप से RAID5 का एक सामान्यीकरण है।

  • नियमित रूप से अपनी फ़ाइलों की अखंडता की जाँच करें: अपनी फ़ाइलों को हैश करें, और उन्हें समय-समय पर चेक करें (यानी, प्रति वर्ष एक बार, लेकिन यह भंडारण माध्यम और पर्यावरणीय स्थितियों पर निर्भर करता है)। जब आप देखते हैं कि आपकी फ़ाइलों को भ्रष्टाचार का सामना करना पड़ा है, तो आपके द्वारा किए गए ईसीसी का उपयोग करके मरम्मत करने का समय है, यदि आपने ऐसा किया है, और / या एक नए भंडारण माध्यम पर अपने डेटा की एक नई नई प्रतिलिपि बनाने के लिए। डेटा की जांच करना, भ्रष्टाचार की मरम्मत करना और नई नई प्रतियां बनाना एक बहुत अच्छा परिणाम चक्र है जो यह सुनिश्चित करेगा कि आपका डेटा सुरक्षित है। विशेष रूप से जाँच करना बहुत महत्वपूर्ण है क्योंकि आपकी फ़ाइलों की प्रतियां चुपचाप दूषित हो सकती हैं, और यदि आप फिर छेड़छाड़ की गई प्रतियों की नकल करते हैं, तो आप पूरी तरह से दूषित फ़ाइलों के साथ समाप्त हो जाएंगे। यह ऑप्टिकल स्टोरेज जैसे कोल्ड स्टोरेज माध्यमों के साथ और भी महत्वपूर्ण है, जो डेटा की अखंडता की जांच स्वचालित रूप से नहीं कर सकता (वे पहले से ही ईसीसी को थोड़ा ठीक करने के लिए लागू करते हैं) लेकिन वे स्वचालित रूप से नई ताजी प्रतियाँ नहीं बना सकते और न ही जाँच सकते हैं, यही आपका काम है!)। फ़ाइलों के परिवर्तनों की निगरानी के लिए, आप rfigc.py स्क्रिप्ट का उपयोग कर सकते हैंpyFileFixity या अन्य UNIX उपकरण जैसे md5deep । आप हार्ड ड्राइव सेंटिनल या ओपन सोर्स स्मार्टमूनटूल जैसे टूल का उपयोग करके कुछ स्टोरेज माध्यमों की स्वास्थ्य स्थिति की जांच कर सकते हैं ।

  • विभिन्न स्थानों पर अपने अभिलेखागार माध्यमों को संग्रहीत करें (बाढ़ या आग जैसी वास्तविक जीवन की विनाशकारी घटनाओं से बचने के लिए अपने घर के बाहर कम से कम एक कॉपी के साथ!)। उदाहरण के लिए, आपके काम में एक ऑप्टिकल डिस्क, या क्लाउड-आधारित बैकअप इस आवश्यकता को ध्यान में रखते हुए एक अच्छा विचार हो सकता है (भले ही क्लाउड प्रदाता किसी भी समय बंद हो सकते हैं, जब तक आपके पास अन्य प्रतियां हैं, आप सुरक्षित रहेंगे , क्लाउड प्रदाता केवल आपातकाल के मामले में एक ऑफसाइट आर्काइव के रूप में काम करेंगे)।

  • नियंत्रित पर्यावरणीय मापदंडों के साथ विशिष्ट कंटेनरों में स्टोर करें : ऑप्टिकल माध्यमों के लिए, नमी से बचने के लिए प्रकाश से दूर और पानी से भरे बॉक्स में स्टोर करें। हार्ड ड्राइव और एसडी कार्ड के लिए, ड्राइव को छेड़छाड़ करने के लिए अवशिष्ट बिजली से बचने के लिए विरोधी चुंबकीय आस्तीन में स्टोर करें। आप एयर-टाइट और वाटर-टाइट बैग / बॉक्स में भी स्टोर कर सकते हैं और एक फ्रीज़र में स्टोर कर सकते हैं: धीमी गति से तापमान में तेज़ी आएगी, और आप किसी भी स्टोरेज मीडियम की जीवन अवधि को काफी बढ़ा सकते हैं (बस यह सुनिश्चित कर लें कि पानी जीत गया 'अंदर प्रवेश न करें, अन्यथा आपका माध्यम जल्दी मर जाएगा)।

  • अच्छी गुणवत्ता वाले हार्डवेयर का उपयोग करें और उन्हें पहले से ही जांच लें (जैसे: जब आप एसडी कार्ड खरीदते हैं, तो पूरे कार्ड का परीक्षण सॉफ्टवेयर के साथ करें जैसे कि एचडीडी स्कैन यह जांचने के लिए कि आपका डेटा लिखने से पहले सब कुछ ठीक है)। यह ऑप्टिकल ड्राइव के लिए विशेष रूप से महत्वपूर्ण है, क्योंकि उनकी गुणवत्ता आपके जले हुए डिस्क की गुणवत्ता को काफी बदल सकती है, जैसा कि अभिलेखागार डी फ्रांस अध्ययन (एक खराब डीवीडी बर्नर डीवीडी का उत्पादन करेगा जो बहुत कम समय तक चलेगा)।

  • ध्यान से अपने फ़ाइल स्वरूपों का चयन करें: सभी फाइलें प्रारूप भ्रष्टाचार के खिलाफ लचीला नहीं हैं, कुछ स्पष्ट रूप से कमजोर हैं। उदाहरण के लिए, .jpg चित्र केवल एक या दो बाइट्स से छेड़छाड़ करके पूरी तरह से टूटे और अपठनीय हो सकते हैं। 7zip अभिलेखागार के लिए भी। यह हास्यास्पद है, इसलिए आपके द्वारा संग्रहित फ़ाइलों के फ़ाइल प्रारूप के बारे में सावधान रहें। अंगूठे के एक नियम के रूप में, सरल स्पष्ट पाठ सबसे अच्छा है, लेकिन अगर आपको संपीड़ित करने की जरूरत है, गैर-ठोस ज़िप का उपयोग करें और छवियों के लिए, जेपीईजी 2 (अभी तक खुला-स्रोत नहीं ...) का उपयोग करें। अधिक जानकारी और प्रो डिजिटल क्यूरेटर की समीक्षा यहाँ , यहाँ और यहाँ

  • डेटा को पढ़ने के लिए आवश्यक प्रत्येक सॉफ़्टवेयर और विशिष्टताओं के साथ अपने डेटा अभिलेखागार के साथ स्टोर करें। याद रखें कि विनिर्देश तेज़ी से बदलते हैं, और इस प्रकार भविष्य में आपका डेटा अब पढ़ने योग्य नहीं हो सकता है, भले ही आप फ़ाइल तक पहुंच सकें। इस प्रकार, आपको खुले स्रोत प्रारूप और सॉफ़्टवेयर पसंद करना चाहिए, और अपने डेटा के साथ प्रोग्राम के स्रोत कोड को संग्रहीत करना चाहिए ताकि आप हमेशा नए ओएस या कंप्यूटर से लॉन्च करने के लिए प्रोग्राम को स्रोत कोड से अनुकूलित कर सकें।

  • अन्य तरीकों और दृष्टिकोणों के बहुत सारे यहां , यहां और इंटरनेट के विभिन्न हिस्सों में उपलब्ध हैं

निष्कर्ष

मैं आपको जो कुछ भी हो सकता है, उसका उपयोग करने की सलाह देता हूं, लेकिन हमेशा अतिरेक सिद्धांत का सम्मान करें (4 प्रतियां बनाएं!), और हमेशा नियमित रूप से अखंडता की जांच करें (इसलिए आपको एमडी 5 / एसएचए 1 हैश के डेटाबेस को पहले से तैयार करने की आवश्यकता है), और नया बनाएं भ्रष्टाचार के मामले में प्रतियां। यदि आप ऐसा करते हैं, तो आप तकनीकी रूप से अपने डेटा को तब तक रख सकते हैं जब तक आप चाहते हैं कि आपका भंडारण माध्यम जो भी हो। प्रत्येक चेक के बीच का समय आपके स्टोरेज माध्यमों की विश्वसनीयता पर निर्भर करता है: यदि यह एक फ़्लॉपी डिस्क है, तो हर 2 महीने में जांच करें, अगर यह ब्लू-रे HTL है, तो हर 2/3 साल की जाँच करें।

अब इष्टतम में, मैं ब्लू-रे HTL डिस्क या अभिलेखीय ग्रेड डीवीडी डिस्क का उपयोग करने के लिए कोल्ड स्टोरेज के लिए सलाह देता हूं जो पानी से तंग अपारदर्शी बक्से में संग्रहीत है और एक नए स्थान पर संग्रहीत है। इसके अलावा, आप एसडी कार्ड और क्लाउड-आधारित प्रदाताओं जैसे स्पाइडरऑक का उपयोग अपने डेटा की निरर्थक प्रतियों, या हार्ड ड्राइव को संग्रहीत करने के लिए कर सकते हैं, यदि यह आपके लिए अधिक सुलभ हो।

कोड को सही करने में बहुत सी त्रुटि का उपयोग करें , वे आपका दिन बचाएंगे। इसके अलावा, आप इन ईसीसी फाइलों की कई प्रतियाँ बना सकते हैं (लेकिन आपके डेटा की कई प्रतियाँ ईसीसी की कई प्रतियों की तुलना में अधिक महत्वपूर्ण हैं क्योंकि ईसीसी फाइलें खुद की मरम्मत कर सकती हैं!)।

इन रणनीतियों को उन सभी उपकरणों के सेट का उपयोग करके लागू किया जा सकता है जिन्हें मैं विकसित कर रहा हूं (खुला स्रोत): pyFileFixity । यह टूल वास्तव में इस चर्चा के द्वारा शुरू किया गया था, यह पता लगाने के बाद कि फ़ाइल की शुद्धता को पूरी तरह से प्रबंधित करने के लिए कोई मुफ्त टूल नहीं था। इसके अलावा, कृपया प्रोजेक्ट की रीडमी और विकी के बारे में अधिक जानकारी के लिए फाइल फिक्सेटी और डिजिटल क्यूरेशन देखें।

एक अंतिम नोट पर, मैं वास्तव में आशा करता हूं कि इस समस्या पर अधिक आर एंड डी डाला जाएगा। यह हमारे वर्तमान समाज के लिए एक प्रमुख मुद्दा है, अधिक से अधिक डेटा का डिजिटलीकरण किया जा रहा है, लेकिन बिना किसी गारंटी के कि यह सूचना का द्रव्यमान कुछ वर्षों से अधिक जीवित रहेगा। यह काफी निराशाजनक है, और मुझे वास्तव में लगता है कि इस मुद्दे को बहुत अधिक सामने रखा जाना चाहिए, ताकि यह स्टोरेज डिवाइस बनाने के लिए कंस्ट्रक्टर्स और कंपनियों के लिए एक विपणन बिंदु बन जाए जो भविष्य की पीढ़ियों के लिए पिछले कर सकते हैं।

/ संपादित करें: एक व्यावहारिक अवधि के लिए नीचे पढ़ें


6
बकाया जवाब! इस की जरूरत है अब तक अधिक upvotes।
bwDraco

1
आप अधिक जानकारी जोड़ने की योजना बना रहे हैं? इसे पाठ्यपुस्तक के रूप में प्रकाशित करने पर विचार करें। :-)
फिक्सर 1234

1
@ fixer1234 हाँ मैं और अधिक जानकारी जोड़ने की योजना बना रहा हूँ, और अधिक महत्वपूर्ण बात, अधिक प्रासंगिक और विश्वसनीय जानकारी। फ़ाइल की शुद्धता के क्षेत्र में बहुत सारी गलत धारणाएं और गलत तरीके से सुरक्षित समाधान हैं, इसलिए कहने के लिए बहुत कुछ है। मुझे इस पोस्ट को प्रकाशित करने के बाद इतनी जानकारी मिली है कि एक अपडेट की स्पष्ट रूप से आवश्यकता है, और मैंने पहले ही अपने नोट्स में संदर्भों के साथ सब कुछ संकलित कर लिया है। मुझे यकीन नहीं है कि सुपरयूजर सबसे अच्छी जगह है जहां यह सारा डेटा प्रकाशित किया जाता है, लेकिन मेरा अपना कोई ब्लॉग नहीं है: - / मैं यथासंभव संक्षिप्त होने की कोशिश करूंगा।
गबोरस

3
यदि आपको फ़ेक नहीं मिलता है तो डीवीडी + रुपये काफी विश्वसनीय हैं। सीडी-रुपये इंफ्रारेड से वायलेट तक किसी भी प्रकाश से प्रभावित थे (और इन्फ्रारेड हर जगह है, कभी-कभी बहुत अधिक होता है), डीवीडी + रुपये केवल लाल या छोटे से प्रभावित होते हैं, पहले से ही अधिक कठिन। डीवीडी में प्लास्टिक की दो परतों के बीच की संवेदनशील परत भी होती है, CD में पेंसिल-लिखने योग्य सतह के ठीक नीचे परत होती है !! बीडी-आर डिस्क सबसे अच्छे हैं: आपको उन्हें बर्बाद करने के लिए बैंगनी या पराबैंगनी प्रकाश की आवश्यकता होती है, और उनकी सतह सबसे मजबूत होती है। मैं कहूंगा कि 30 साल बाद सफलता की उच्च संभावना के साथ व्यावहारिक अभिलेखीय के लिए BD-R के साथ जाना चाहिए। लेकिन आपको एक खिलाड़ी की जरूरत है।
फरओ

1
@ ओलाफम हाँ यह सच है, ऑप्टिकल डिस्क की प्रत्येक नई पीढ़ी अपने साथ न केवल अपनी सामग्री में बल्कि उनके तकनीकी सेटअप में भी अधिक विश्वसनीय प्रौद्योगिकियां लाती है (जैसे, जिस तरह से गड्ढे / खांचे लिखे और प्रबंधित किए जाते हैं , त्रुटि सुधार कोड, आदि। ।), लेकिन आपको उन सामग्रियों पर भी ध्यान देना चाहिए जिनमें परतें बनाई गई थीं, सभी ऑप्टिकल डिस्क समान नहीं हैं, और आमतौर पर (लेकिन हमेशा नहीं), अभिलेखीय ग्रेड डिस्क अधिक लचीला सामग्रियों के साथ बनाई जाती हैं।
गाभिन

11

कोई आसान उपाय नहीं है। संग्रह रखरखाव एक प्रक्रिया है , न कि एक बार का काम। वर्तमान में उपलब्ध सभी अभिलेखीय मीडिया प्रकारों के अपने-अपने प्लसस और मिन्यूज़ हैं, हालाँकि ये तर्क सभी मीडिया प्रकारों पर लागू होते हैं:

  1. कोई भी संग्रहीत डीवीडी या हार्ड डिस्क 30 या 100 वर्षों के लिए, स्पष्ट कारणों के लिए नहीं। इसलिए कोई ट्रैक रिकॉर्ड नहीं है और किसी को नहीं पता कि मीडिया की उम्र कैसी होगी। कृत्रिम उम्र बढ़ने के परीक्षण बहुत साबित नहीं होते हैं, और आप विक्रेता के परीक्षण पर भरोसा करते हैं, (निष्पक्ष नहीं)।

  2. आपको सर्वोत्तम परिणामों (निरंतर तापमान / आर्द्रता, कम रोशनी, आदि) के लिए नियंत्रित वातावरण में मीडिया को संग्रहीत करना चाहिए। अन्यथा मीडिया जीवन काफी छोटा हो गया है।

  3. आपको हार्डवेयर और सॉफ्टवेयर को बनाए रखना होगा जो मीडिया को पढ़ता है (उदाहरण के लिए SATA इंटरफेस अब से 30 वर्षों में आसानी से उपलब्ध नहीं हो सकता है)।

इसलिए, मेरी राय में, घरेलू उपयोगकर्ताओं या छोटे व्यवसायों के लिए एकमात्र व्यवहार्य समाधान यह है:

  1. विविध मीडिया प्रकारों (हार्ड डिस्क और डीवीडी दोनों) पर सभी डेटा की कई प्रतियां बनाए रखें
  2. सभी स्थानों (घर पर और आपके बैंकों की सुरक्षा जमा बॉक्स में) में सभी डेटा की कई प्रतियां बनाए रखें।
  3. सभी डेटा को हर बार नए मीडिया में कॉपी करें (जैसे एक नई हार्ड डिस्क पर कॉपी करें और हर 2 साल में नई डीवीडी डिस्क। जैसे-जैसे डेटा घनत्व बढ़ता है, आपको शायद कम डिस्क की भी आवश्यकता होगी।
  4. यदि संभव हो तो सभी महत्वपूर्ण डेटा के लिए कागजी प्रतियां बनाए रखें (जैसे कि आपके व्यवसाय के लिए वार्षिक सामान्य लाईडर्स प्रिंट करें, सबसे कीमती पारिवारिक फोटो प्रिंट करें, आदि)

1
मुझे आश्चर्य है कि अगर वहाँ डीवीडी के लिए RAID है .... यानी .. अगर आप दो साल के लिए डीवीडी स्टोर करते हैं, तो आपको यकीन है कि यकीन है कि उनमें से 80% त्रुटि मुक्त हो जाएगा, तो आप दो समानता डिस्क हो सकता है। Hmmmm। usenet मुझे लगता है कि समता फ़ाइलों का उपयोग करता है। डीवीडी / सीडी / बीडी अभिलेखीय के लिए ऐसा कुछ उपयोग करने लायक हो सकता है।
user606723

1
@ user606723: यह एक बहुत अच्छा विचार है! मुझे लगता है कि PAR2 समता फ़ाइलों के साथ बहु-मात्रा RAR संग्रह (यदि मूल फ़ाइलें वास्तव में बड़ी हैं) जैसे कुछ का उपयोग करने का सुझाव है ...
haimg

4
इंटरफ़ेस संगतता एक बड़ी चिंता होगी; आईबीएम XT को पेश किए हुए लगभग 30 साल हो गए हैं, फिर भी आज कितने कंप्यूटर किसी भी तरह से प्री-एटीए हार्ड डिस्क के साथ इंटरफेस कर सकते हैं? आज बनाए गए कितने कंप्यूटर अतिरिक्त हार्डवेयर (नियंत्रक कार्ड या यूएसबी एडेप्टर) के बिना एक पाटा हार्ड डिस्क के साथ भी इंटरफ़ेस कर सकते हैं?
एक CVn

1
@ user606723 जिसे आप "RAID फॉर डीवीडी" कहते हैं, वह वास्तव में मौजूद है और "एरर करेक्टिंग कोड" के रूप में पहले से लागू है, विशेष रूप से CIRC (क्रॉस-इंटरलीव्ड रीड-सोलोमन कोडिंग) का उपयोग करके। यही कारण है कि छोटे खरोंच या धूल आपको डेटा पढ़ने से नहीं रोकेंगे, क्योंकि यह पहले से ही स्वचालित रूप से सही है। हालाँकि, आप अपने इच्छित अतिरेक के स्तर को निर्दिष्ट नहीं कर सकते, इसलिए यदि आप अधिक लचीला डीवीडी चाहते हैं, तो आपको किसी तृतीय-पक्ष सॉफ़्टवेयर जैसे DVDisaster , PAR2 या pyFileFixity का उपयोग करना होगा ।
गबोरस

11

उपर्युक्त मेरे पिछले उत्तर पर त्वरित अनुवर्ती कार्रवाई , इसे और अधिक संक्षिप्त और अतिरिक्त (लेकिन प्राथमिक महत्व का नहीं) जानकारी और संदर्भों के साथ विस्तारित किया जाएगा जो कि 30K की लंबाई की कमी के कारण मैं पहले उत्तर में नहीं जोड़ सकता।

चूंकि लंबे समय तक अभिलेखीय एक क्यूरेशन प्रक्रिया है, इसलिए यहां कुछ अन्य चीजें हैं जो आप अपनी प्रक्रिया को अधिक कुशल और कम समय (और संसाधनों) का उपभोग करने के लिए ध्यान देना चाह सकते हैं:

  • Deduplication : चूंकि दीर्घकालिक अभिलेखीय सुनिश्चित करने का एकमात्र तरीका जानबूझकर डिज़ाइन किए गए अतिरेक के माध्यम से है, आप बेकार अतिरेक डेटा से बचना चाहते हैं (उदाहरण के लिए, आपके द्वारा अपनी हार्डबेक हार्ड ड्राइव पर अपनी usb कुंजी से प्राप्त फ़ाइलों की प्रतियां, लेकिन आपके पास पहले से ही एक प्रतिलिपि आ रही है अपने मुख्य कंप्यूटर से!)। अनवांटेड निरर्थक डेटा, जिन्हें आमतौर पर डुप्लिकेट कहा जाता है , खराब होते हैं, दोनों स्टोरेज कॉस्ट में (वे अधिक स्टोरेज रिसोर्स लेते हैं लेकिन आपको जरूरत पड़ने पर एक कठिन समय मिलेगा), आपकी प्रक्रिया के लिए (क्या होगा अगर आपके पास एक ही फाइल के अलग-अलग वर्जन हैं? आप कैसे जान सकते हैं कि कौन सी कॉपी सही है?) और आपके समय के लिए (यह ट्रांसफर के समय बढ़ जाएगी जब आप बैकअप को अपने सभी अभिलेखागार में सिंक्रोनाइज़ करेंगे)। यही कारण है कि पेशेवर अभिलेखीय सेवाएं आमतौर पर स्वचालित समर्पण प्रदान करती हैं: फ़ाइलें जो बिल्कुल समान होती हैं उन्हें समान इनोड मिलेगा, और वे कोई अतिरिक्त स्थान नहीं लेंगे। मिसाल के तौर पर स्पाइडरऑक यही करता है। आपके द्वारा उपयोग किए जाने वाले स्वचालित उपकरण हैं, और ZFS (लिनक्स) या ReFS (विंडोज) फाइल सिस्टम आपके लिए इसे स्वचालित रूप से कर सकते हैं।

  • प्राथमिकता / वर्गीकरण : जैसा कि आप देख सकते हैं, दीर्घकालिक अभिलेखीय प्रक्रिया एक समय लेने वाली प्रक्रिया है जिसे नियमित रूप से आयोजित करने की आवश्यकता है (संन्यास की जांच करने के लिए, माध्यमों में अभिलेखागार को सिंक्रनाइज़ करें, मरने वाले को बदलने के लिए नए माध्यमों पर नए अभिलेखागार बनाएं, त्रुटियों को ठीक करने वाले कोड का उपयोग करके मरम्मत फ़ाइलों की मरम्मत करें , आदि।)। आपके द्वारा खर्च किए जाने वाले समय को कम करने के लिए, श्रेणियों के आधार पर आपके डेटा की प्राथमिकता के आधार पर सुरक्षा की विभिन्न योजनाओं को परिभाषित करने का प्रयास करें। विचार यह है कि जब आप अपने कंप्यूटर डेटा को अपने किसी बाहरी हार्ड ड्राइव में उपयोग करते हैं, जिसे आप लंबे समय तक अभिलेखीय रूप से उपयोग करते हैं, तो आप उन्हें सीधे बैकअप प्राथमिकता को परिभाषित करते हुए एक फ़ोल्डर में रखते हैं: "महत्वहीन", "व्यक्तिगत", "महत्वपूर्ण", "क्रिटिकल" "। तब आप प्रत्येक फ़ोल्डर के लिए अलग-अलग बैकअप रणनीतियों को परिभाषित कर सकते हैं: पूर्ण सुरक्षा आरक्षित करें (उदाहरण के लिए, 3 हार्ड ड्राइव पर बैकअप + क्लाउड + एरर करेक्ट कोड + BluRays) केवल उस सबसे महत्वपूर्ण डेटा के लिए जिसे आप अपना संपूर्ण जीवन (महत्वपूर्ण फ़ोल्डर) रखना चाहते हैं , फिर "महत्वपूर्ण" डेटा के लिए एक मध्यम सुरक्षा (उदाहरण के लिए, 3 हार्ड ड्राइव + क्लाउड पर बैकअप) और फिर "व्यक्तिगत" को कम से कम दो बाहरी हार्ड ड्राइव पर कॉपी किया जाता है, और "महत्वहीन" को कोई प्रतिलिपि नहीं मिलती है (या शायद एक हार्ड पर) ड्राइव अगर सिंक्रनाइज़ेशन बहुत लंबा नहीं है ...)। आमतौर पर, आप देखेंगे कि " इंटरनेट या विभिन्न फाइलों और मेडियों से आपके द्वारा डाउनलोड किया गया सारा सामान है जो आपको वास्तव में परवाह नहीं करता है (जैसे सॉफ्टवेयर्स और गेम और फिल्में)। लब्बोलुआब यह है कि:जितनी अधिक फ़ाइलें आप लंबे समय तक संग्रह करना चाहते हैं, उतनी ही कठिन (और समय लेने वाली) होगी , इसलिए उन फ़ाइलों को रखने की कोशिश करें जो इस विशेष उपचार को कम से कम करते हैं।

  • मेटा-डेटा एक महत्वपूर्ण स्थान है: यहां तक ​​कि अच्छी अवधि की रणनीतियों के साथ, आमतौर पर एक चीज है जो संरक्षित नहीं है: मेटा-डेटा। मेटा-डेटा में आपकी फ़ाइलों के बारे में जानकारी शामिल है, उदाहरण के लिए: डायरेक्टरी ट्री (येप, यह केवल कुछ बाइट्स हैं, यदि आप इसे खो देते हैं, तो आपको अपनी फाइलें कुल विकार में मिलती हैं!), फ़ाइल नाम और एक्सटेंशन, टाइमस्टैम्प (यह) आपके लिए महत्वपूर्ण हो सकता है), आदि। यह एक बड़ी बात नहीं लग सकती है, लेकिन निम्नलिखित की कल्पना करें: क्या होगा अगर कल, आपकी सभी फाइलें (सॉफ्टवेयर्स और सामान के साथ भेज दी गई फाइलें) सभी एक फ्लैट फ़ोल्डर के अंदर डाल दी जाती हैं, उनके फ़ाइलनाम के बिना या नहीं विस्तार। क्या आप मैनुअल निरीक्षण द्वारा अपने कंप्यूटर पर अरबों फाइलों की जरूरत वाली फाइलों को पुनर्प्राप्त कर पाएंगे? ऐसा मत सोचो कि यह एक असामान्य परिदृश्य है, यह आसानी से हो सकता है जैसे कि आपको बिजली की आपूर्ति मिलती है या कॉपी के बीच में दुर्घटना होती है: लिखा जा रहा विभाजन पूरी तरह से नष्ट हो सकता है (कुख्यात प्रकार RAW)। इस समस्या को दूर करने के लिए, आपको डेटा रिकवरी के लिए अपना डेटा तैयार करके रखना चाहिए: यह सुनिश्चित करने के लिए कि आप मेटा-डेटा रखते हैं, आप फ़ाइलों का उनके मेटा-डेटा के साथ उपयोग कर सकते हैंनॉन-सॉलिड आर्काइव्स जैसे जिप डिफ्लेट या डीएआर (लेकिन टार नहीं))। कुछ फाइलसिस्टम स्वचालित मेटा-डेटा अतिरेक प्रदान करते हैं, जैसे कि DVDisaster (ऑप्टिकल डिस्क के लिए) और ZFS / ReFS (हार्ड ड्राइव के लिए)। फिर मेटा-डेटा क्रैश के मामले में, आप डायरेक्टरी ट्री और अन्य मेटा-डेटा को पुनर्प्राप्त करने के लिए TestDisk या GetDataBack (आंशिक निर्देशिका ट्री रिकवरी की अनुमति दें) या ISOBuster (ऑप्टिकल डिस्क के लिए) का उपयोग करके अपने विभाजन को पुनर्प्राप्त करने का प्रयास कर सकते हैं। यदि यह सब विफल हो जाता है, तो आप PhotoRec का उपयोग करके फ़ाइलों को क्रैक करने के लिए वापस आ सकते हैं: यह उन सभी फ़ाइलों को निकालेगा जो इसे पहचानती है, लेकिन कुल विकार और फ़ाइल नाम या टाइमस्टैम्प के बिना, केवल डेटा ही पुनर्प्राप्त किया जाएगा। यदि आपने महत्वपूर्ण फ़ाइलों को ज़िप किया है, तो आप ज़िप के अंदर मेटा-डेटा को पुनर्प्राप्त करने में सक्षम होंगे (भले ही ज़िप में अब कोई मेटा-डेटा शामिल नहीं है, कम से कम फ़ाइलों के अंदर अभी भी सही मेटा-डेटा के अधिकारी होंगे)। हालाँकि, आपको समय-समय पर एक-एक करके सभी फाइलों को मैन्युअल रूप से जांचना होगा, जो समय लेने वाली है। इस संभावना के विरुद्ध सुरक्षा के लिए, आप पहले से ही एक अखंडता चेकसम फाइल को pyFileFixity या PAR2 का उपयोग करके उत्पन्न कर सकते हैं, और फिर फ़ाइलों को स्वचालित रूप से पहचानने और उनकी सामग्री के आधार पर फ़ाइलों का नाम बदलने के बाद इस अखंडता चेकसम फाइल का उपयोग कर सकते हैं (यह फ़ाइलों को स्वचालित रूप से मेटा को स्वचालित करने का एकमात्र तरीका है- डेटा रिकवरी, क्योंकि फ़ाइल क्रैकिंग तकनीकी रूप से केवल सामग्री को पुनर्प्राप्त कर सकती है, मेटा-डेटा नहीं)।

  • अपने लिए अपने फ़ाइल स्वरूपों और क्यूरेशन रणनीतियों का परीक्षण करें : लेखों के शब्दों पर भरोसा करने के बजाय कि किस प्रकार का प्रारूप दूसरे से बेहतर है, आप अपने आप से pyFileFixity filetamper.py या बस कुछ में हेक्साडेसिमल वर्णों को प्रतिस्थापित करके अपने आप से प्रयास कर सकते हैं फ़ाइलें: आप देखेंगे कि अधिकांश फ़ाइल प्रारूप 3 अलग-अलग बाइट्स के साथ टूट सकते हैं। तो आपको वास्तव में अपने फ़ाइल स्वरूपों को सावधानीपूर्वक चुनना चाहिए: नोटों के लिए सरल पाठ फ़ाइलों को प्राथमिकता दें, और मेडियास के लिए लचीला फ़ाइल स्वरूपों का उपयोग करें (वे अभी भी MPEG-4 चर त्रुटि सुधार कोड, ffmpeg इसे लागू करते हैं, रेफरी जैसे काम किए जाएंगे। ), या अपनी खुद की त्रुटि कोड को उत्पन्न करने में त्रुटि।

  • सांख्यिकीय अध्ययन पढ़ें, दावों पर विश्वास न करें : जैसा कि मैंने पिछले उत्तर में कहा था, बिना किसी वैज्ञानिक तथ्य के भंडारण माध्यमों की लंबी उम्र के बारे में असाधारण दावे हर समय किए जाते हैं, और आपको विशेष रूप से इस बारे में सावधान रहना चाहिए। वास्तव में, कानून में ऐसा कुछ भी नहीं है जो निर्माता को नकली, और अपरिवर्तनीय के बारे में दावा करने से रोकता है, दीर्घायु पर दावा करता है। हार्ड ड्राइव विफलताओं की दर पर बैकब्लेज की वार्षिक रिपोर्ट जैसे सांख्यिकीय अध्ययनों का संदर्भ लें ।

  • लंबी गारंटीकृत भंडारण माध्यम लें । गारंटी आपके डेटा को वापस नहीं ला सकती है, लेकिन यह आपको इस बारे में बताती है कि निर्माता अपने उत्पाद की विफलता दर का मूल्यांकन कैसे करता है (क्योंकि अगर गारंटी अवधि के दौरान यह दर बहुत अधिक है तो लागत बहुत अधिक होगी)।


मेरे द्वारा उपयोग की जाने वाली योजना पर एक अपडेट: मैं ऊपर वर्णित प्राथमिकता रणनीति लागू करता हूं, और मैंने अपनी योजना में क्लाउड बैकअप सेवा स्पाइडरऑक को जोड़ा, क्योंकि इसमें अनंत भंडारण की योजना है और यह पूरी तरह से एन्क्रिप्टेड है, इसलिए मैं अपने डेटा का एकमात्र स्वामित्व रखता हूं। मैं अपने किसी भी डेटा के लिए अपने एकमात्र बैकअप माध्यम के रूप में उपयोग नहीं करता, यह केवल एक अतिरिक्त परत है।

तो यहाँ मेरी वर्तमान योजना है:

  • 3 हार्ड ड्राइव की प्रतियां नियमित रूप से जाँच की जाती हैं और दो अलग-अलग स्थानों में सिंक्रनाइज़ और संग्रहीत होती हैं और 1 जो हमेशा मुझ पर होती है (मैं इसका उपयोग कचरा संग्रहित करने और त्वरित बैकअप करने के लिए करता हूं)।
  • अनंत भंडारण योजना के साथ स्पाइडरऑक
  • BluRay वास्तव में समझदार डेटा के लिए डिस्क है लेकिन बहुत बड़ा नहीं है (मैं 50 जीबी डेटा को सीमित करता हूं जिसे मैं इन डिस्क पर स्टोर कर सकता हूं)
  • pyFileFixity और मैं वास्तव में लंबे समय में रखने के लिए सुनिश्चित करना चाहते हैं फ़ोल्डर्स के लिए DVDisaster।

मेरी दिनचर्या इस तरह से है: मेरे पास हमेशा एक 2.5 पोर्टेबल USB HDD होता है, जिसका उपयोग मैं महत्वहीन सामान (अपने कंप्यूटर से HDD पर फ़ाइलें स्थानांतरित करने के लिए) या महत्वपूर्ण सामान का बैकअप लेने के लिए कर सकता हूं (HDD में फ़ाइलों की प्रतिलिपि बनाएँ, लेकिन एक प्रति अपने पास रखें संगणक)। वास्तव में महत्वपूर्ण सामान के लिए, मैं स्पाइडरऑक के ऑनलाइन बैकअप को सक्रिय रूप से सक्रिय करता हूं (मेरे कंप्यूटर में महत्वपूर्ण सामान के साथ एक फ़ोल्डर है, इसलिए मुझे बस महत्वपूर्ण फाइलों को स्थानांतरित करने की आवश्यकता है और यह स्वतः स्पाइकर द्वारा सिंक्रनाइज़ हो जाता है)। वास्तव में महत्वपूर्ण फाइलों के लिए, मैं भी pyFileFixity का उपयोग करके एक त्रुटि सुधार फ़ाइल की गणना करता हूं।

इसलिए सारांश करने के लिए, महत्वपूर्ण सामान के लिए, मैं उन पर संग्रहीत करता हूं: पोर्टेबल HDD, स्पाइडरऑक क्लाउड और मेरा कंप्यूटर, इसलिए मेरे पास केवल दो त्वरित क्रियाओं के साथ किसी भी समय 3 प्रतियां हैं (पोर्टेबल HDD की प्रतिलिपि करें और स्पाइडरऑक फ़ोल्डर में स्थानांतरित करें)। यदि एक प्रति दूषित हो जाती है, तो मैं pyFileFixity का उपयोग करके उन्हें ठीक करने के लिए बहुमत से वोट कर सकता हूं। यह बहुत कम लागत वाली योजना है (कीमत और समय दोनों में) लेकिन बहुत ही कुशल और डिजिटल क्यूरेशन के सभी मुख्य सिद्धांतों (ट्रिपल रिडंडेंसी, अलग-अलग स्थानों में अलग-अलग प्रतियां, अलग-अलग माध्यम, अखंडता की जांच और स्पाइडरऑक द्वारा eccments) को लागू करती है।

फिर, हर 3 से 6 महीने में, मैं अपने पोर्टेबल HDD को घर पर अपने दूसरे HDD में सिंक्रनाइज़ करता हूं, और फिर हर 6 से 12 महीने में मैं अपने पोर्टेबल HDD को अपने तीसरे HDD में सिंक्रनाइज़ करता हूं जो कि दूसरे घर पर है। यह रोटेशन का अतिरिक्त लाभ प्रदान करता है (यदि 6 महीने में मुझे एहसास होता है कि मेरे पिछले बैकअप में कुछ गलत हो गया है और मैंने महत्वपूर्ण फ़ाइलों को हटा दिया है, तो मैं उन्हें दो होम एचडीडी में से एक से प्राप्त कर सकता हूं)।

अंत में, मैंने DVDRaster (और pyFileFixity के साथ अतिरिक्त ecc फ़ाइलों का उपयोग करके BluRay डिस्क पर कुछ बहुत ही महत्वपूर्ण फाइलें लिखीं, लेकिन मुझे यकीन नहीं है कि यह आवश्यक था)। मैं उन्हें एक कोठरी में एक एयर-टाइट बॉक्स में संग्रहीत करता हूं। मैं केवल हर कुछ वर्षों में उनकी जांच करता हूं।

तो आप देखते हैं, मेरी योजना वास्तव में एक बड़ा बोझ नहीं है: दैनिक आधार पर, पोर्टेबल HDD और मेरे स्पाइडरऑक फ़ोल्डर में फ़ाइलों को कॉपी करने में कुछ मिनट लगते हैं, और फिर मैं हर 6 महीने में एक या दूसरे होम HDD को सिंक्रनाइज़ करता हूं । यह एक दिन तक ले सकता है, इस पर निर्भर करता है कि कितने डेटा को सिंक्रनाइज़ करने की आवश्यकता है, लेकिन यह सॉफ्टवेयर्स द्वारा स्वचालित है, इसलिए आपको बस एक कंप्यूटर को सॉफ़्टवेयर चलाने देना होगा और आप कुछ और करेंगे (मैं 100 डॉलर की नेटबुक का उपयोग करता हूं जिसे मैंने अभी खरीदा है। ऐसा करें, इसलिए मैं अपने कंप्यूटर को उसी समय कॉपी के बीच में क्रैश करने की चिंता किए बिना अपने मुख्य कंप्यूटर पर काम कर सकता हूं, जो भयानक हो सकता है और आपकी हार्ड ड्राइव को नष्ट कर सकता है जो लिखा जा रहा है )। त्रुटि सुधार कोड और BluRay योजनाएं केवल वास्तव में महत्वपूर्ण डेटा के लिए उपयोग की जाती हैं, इसलिए यह थोड़ा अधिक समय लेने वाला है, लेकिन यह दुर्लभ है।

इस योजना को (हमेशा की तरह) बढ़ाया जा सकता है, उदाहरण के लिए हार्ड ड्राइव पर ZFS / ReFS का उपयोग करके : यह एक स्वचालित रीड-सोलोमन त्रुटि सुधार कोड सुरक्षा और अखंडता जांच (और dittoblocks !) को किसी भी मैनुअल बातचीत के बिना अपने हिस्से पर लागू करेगा pyFileFixity के विपरीत)। हालांकि ZFS विंडोज ओएस (पल के लिए) के तहत नहीं चल सकता है , वहाँ ReFS है जो फाइल सिस्टम स्तर पर समान त्रुटि सुधार नियंत्रण की अनुमति देता है। इसके अलावा, बाहरी HDDs पर इन filesystems का उपयोग करना एक अच्छा विचार हो सकता है! स्वचालित आरएस त्रुटि सुधार और समर्पण के साथ ZFS / ReFS चलाने वाला एक पोर्टेबल HDD भयानक होना चाहिए! (और ZFS काफ़ी तेज़ लग रहा है इसलिए कॉपी जल्दी होनी चाहिए!)।

एक अंतिम नोट: इस सूची में जैसे कि फाइलसिस्टम की ECC क्षमताओं के बारे में दावों से सावधान रहें , क्योंकि अधिकांश के लिए यह केवल मेटाडेटा (जैसे APFS ) या RAID 1 मिररिंग ( btrfs ) तक सीमित है । मेरी जानकारी के लिए, केवल ZFS और ReFS मेटाडेटा और डेटा दोनों के वास्तविक त्रुटि सुधार कोड (और सरल मिररिंग नहीं) प्रदान करते हैं, ZFS सबसे उन्नत (हालांकि अभी भी कुछ हद तक 2018 के रूप में प्रयोगात्मक) होने के कारण, विशेष रूप से क्योंकि ReFS ड्राइव बूट नहीं कर सकते हैं। ।


5

मुझे माइक्रोफिल्म चाहिए। मुझे नहीं पता कि यह अभी भी निर्मित है, लेकिन मुझे आश्चर्य होगा कि अगर यह नहीं था। अगर सही ढंग से संग्रहित किया जाए तो सिल्वर-आधारित नकारात्मक सैकड़ों साल तक चलते हैं। बेशक यह एक बहुत बड़ा निवेश है, और यह फोटोग्राफी और देखने के लिए एक पूरा कमरा लेगा, और यह स्टोरेज की गिनती नहीं है। तो यह केवल अगर आप वास्तव में 100 साल + बिना किसी रखरखाव के MEAN हैं।

यदि नहीं - और संभावना है कि आप तब तक नहीं हैं जब तक आप एक समय कैप्सूल नहीं बनाना चाहते हैं -, बस एचडीडी बैकअप का उपयोग करें, और हर 10-15 वर्षों में पूरे सामान को नए मीडिया पर कॉपी करें। वास्तव में, हर 10 साल या उससे अधिक समय में पूरी चीज़ की नकल करने की तुलना में मध्यम उम्र बढ़ने के खिलाफ कोई बेहतर बीमा नहीं है। माइक्रोफिल्म से बेहतर, मिट्टी की गोलियों से बेहतर, रेगिस्तान की रेत में दबी हुई पत्थर की आकृतियों से बेहतर।


4

5TB (या अधिक?) तक आप सुरक्षित रूप से चुंबकीय टेप उर्फ टेप ड्राइव पर 30 साल तक स्टोर कर सकते हैं । यह समय सिद्ध है। ब्लू-रे रिकॉर्डेबल आपके सामान को 30 साल तक सुरक्षित रूप से स्टोर करेगा, लेकिन इसकी क्षमता लगभग 100GB है।

यदि आपके पास अधिक पैसा है, तो आप इसे ब्लैक / व्हाइट 35 मिमी फिल्म पर संग्रहीत करेंगे। यह माना जाता है कि डेटा को अगले 700 वर्षों के लिए (घनत्व के आधार पर) बहाल किया जा सकता है। ( विकिपीडिया पर जर्मन लिंक )


रिकॉर्ड के लिए, 20-50 ब्लू-रे डिस्क पर लिखना सवाल से बाहर नहीं है।
user606723

मैंने 35 मिमी पर डेटा अभिलेखीय के बारे में कभी नहीं सुना है, हालांकि सिद्धांत स्पष्ट है कि मुझे लगता है। घनत्व कैसा है?
शिन्राई

@Shinrai: मुझे फिल्म का घनत्व पता है, क्षमा करें
तुर्गेनिस्ट

आप शायद प्रति फ्रेम 1 और 10 मेगाबिट्स के बीच कहीं घनत्व का आंकड़ा लगा सकते हैं।
डैनियल आर हिक्स

3
निकॉन का एलएस -9000 ईडी 4000 डीपीआई पर फिल्म को स्कैन करता है, जो आपको 35 मिमी (24 x 36 मिमी) पर 21.4 एमपी / फ्रेम देता है। यदि आप वास्तविक डेटा भंडारण के लिए 1/10 वीं का उपयोग कर सकते हैं (दोनों सिरों पर प्रकाशिकी में फ़ोकस और रिज़ॉल्यूशन की सीमाओं को ध्यान में रखते हुए), तो 2 एमबी / फ्रेम या फिल्म के 36 एक्सपोज़र रोल के लिए 10 एमबी जैसी कोई चीज़। और शुद्ध काला / सफेद यदि स्कैनर का 4000 डीपीआई सीमित कारक है, तो 36-एक्सप रोल के लिए 100 एमबी है। बेशक, आपको अभी भी किसी अन्य तरीके से डेटा को पढ़ने के तरीके के बारे में जानकारी को संरक्षित करना होगा, क्योंकि नग्न आंखों के लिए फ्रेम संभवतः समान रूप से ग्रे दिखाई देंगे।
बजे एक CVn

2

मैं इसकी सतह पर सूक्ष्म रूप से etched जानकारी के साथ एक तीन इंच व्यास निकल डिस्क की सलाह देता हूं।

http://rosettaproject.org/blog/02008/aug/20/very-long-term-backup/


3
क्या इसका ठीक तीन इंच होना जरूरी है? मेरे पास 75 मिमी व्यास की निकेल डिस्क है ...
एक CVn

इस दृष्टिकोण के साथ एकमात्र समस्या यह है कि यह अभी भी छवियों (स्कैन) को संग्रहीत कर सकता है। लेकिन यह वर्तमान में बहुत लंबे समय तक भंडारण (2000 साल तक, मिलेनियस ये!) के लिए सबसे अच्छा तरीका है। ब्लॉग पर कुछ टिप्पणियों द्वारा उजागर एक और कमी यह है कि यह केवल लगभग 50 एमबी डेटा स्टोर कर सकता है।
गाभिन

1

उस तरह के समय के लिए, कुछ भी जो पहले से ही कागज पर है (या बिना जानकारी खोए आसानी से मुद्रित किया जा सकता है) उस रूप में संग्रहीत करना सबसे अच्छा होगा। बस उस कागज और टोनर का ध्यान रखें जो आप हार्डकॉपी के लिए उपयोग करते हैं।

दूसरों के लिए, मैं वर्तमान में उपयोग किए जाने वाले डिजिटल माध्यमों के बारे में नहीं जानता जो कि समय के उन अंतरालों के लिए होगा। यदि आप अपने संग्रह को ताज़ा करने के लिए समय (और इस प्रकार धन) खर्च करते हैं, तो एक चुंबकीय टेप एक व्यवहार्य विकल्प हो सकता है - लेकिन फिर भी आपको कुछ अतिरेक की आवश्यकता होगी, जैसा कि आप अभी पता लगा सकते हैं कि एक टेप खराब हो गया है (या यह) यह हो सकता है कि टेप ड्राइव सिर्फ पढ़ने पर टेप को मसलने के लिए होता है)।

और जब आप वास्तविक मीडिया को समय की कसौटी पर खरा उतरने के लिए तैयार कर सकते हैं, तब भी आपको इस मुद्दे का सामना करना पड़ेगा कि क्या कोई भी कार्यक्रम अब से 30 साल पहले मीडिया को पढ़ सकता है, अब से 100 साल पहले अकेले जाने दें।


1
चुंबकीय टेप कई असफलता मोडों के अधीन है, "प्रिंट थ्रू" से समय के साथ विमुद्रीकरण से ऑक्साइड को केवल टेप से गिरना।
डैनियल आर हिक्स

1

यह सच है कि आम सीडी-रुपये और डीवीडी-रुपये महत्वपूर्ण डेटा संग्रह करने के लिए पर्याप्त विश्वसनीय नहीं हैं। लेकिन आप ऐसी डीवीडी प्राप्त कर सकते हैं जो क्षय करने के लिए इतनी जल्दी न हों:

https://www.google.com/search?q=archival+dvd-r


इस विकल्प को इंगित करने के लिए धन्यवाद, एम-डिस्क का एक अच्छा विकल्प जो डीवीडी रिकॉर्डर के साथ किसी के बारे में भी सुलभ है।
गाभिन

"वर्बटीम गोल्ड आर्किवल डीवीडी-आर [...] को अच्छी तरह से माना गया जर्मन पत्रिका द्वारा पूरी तरह से दीर्घकालिक तनाव परीक्षण में सबसे विश्वसनीय डीवीडी-आर के रूप में दर्जा दिया गया है (16/2008 नहीं, पृष्ठ 116-) 123) [...] 18 साल का न्यूनतम स्थायित्व और 32 से 127 साल की औसत स्थायित्व (25 सी, 50% आर्द्रता पर) प्राप्त करना। इन मूल्यों के करीब कहीं भी कोई अन्य डिस्क नहीं आई, दूसरा सबसे अच्छा डीवीडी-आर था। केवल 5 वर्षों का न्यूनतम स्थायित्व। ", linuxtech.net/tips+tricks/best_safe_long-term_data_storage.html
gaborous

1

मैंने पढ़ा है कि 'M-Disc' ने एक डीवीडी बनाई है, जिसे एक विशेष लेखक की आवश्यकता है जो अभी तक सामान्य डीवीडी पाठकों पर पढ़ने योग्य है। वे दावा करते हैं कि 1000 वर्षों का एक अनुमान्य जीवन काल, यह बताते हुए कि इसका सटीक परीक्षण नहीं किया जा सकता है। सूरज, खरोंच, कई उपयोग आदि के लिए लंबे समय तक संपर्क और डिस्क 100% प्रयोग करने योग्य है। मुझे इस प्रणाली का सामना करने वाले किसी भी व्यक्ति की प्रतिक्रिया में दिलचस्पी होगी।

यहाँ डेल से एक अंश है जो शायद अपने नए लैपटॉप / पीसी में एम-डिस्क ड्राइव स्थापित कर रहे हैं

M-DISC रेडी-ईटेक डेटा को डेटा की हानि को रोकने के लिए एक अकार्बनिक रॉक जैसी सामग्री में ड्राइव करता है, यह सुनिश्चित करता है कि आपकी फाइलें सुरक्षित हैं और 1000 साल तक संग्रहीत की जा सकती हैं, कंपनी का दावा है।

अन्य सभी रिकॉर्ड करने योग्य डीवीडी के विपरीत जो डेटा रखने के लिए कार्बनिक रंगों का उपयोग करते हैं, एम डिस्क समय के साथ फीका या नीचा नहीं होगा।


अधिक जानकारी के साथ पुनर्प्रकाशन करने के बजाय, आपको अपना मूल पद संपादित करना चाहिए।
कज़र्क

आप एक लिंक या कुछ के साथ उद्धरण का हवाला दे सकते हैं? इसके अलावा, आप >इसे ब्लॉक उद्धरण के रूप में प्रारूपित करने के लिए उपयोग कर सकते हैं ।
कज़र्क

1

लंबे जीवन बैकअप प्राप्त करने के लिए आपको विभिन्न तकनीकों, स्थानों और माध्यमों को मिलाना होगा:

  • डीवीडी को जलाएं - कम गति पर धुंधला। उन्हें कम रोशनी, कम अस्थायी, कम आर्द्रता, खरोंच से मुक्त रखें।
  • एक RAID 1, RAID5, Raid6 या Raid10 इकाई में एक प्रति रखें।
  • बाहरी एचडीडी में एक और कॉपी रखें
  • क्लाउड में कॉपी रखें (कार्बोनाइट, क्रैशप्लेन)
  • एम-डिस्क तकनीक पर एक प्रतिलिपि रखें (एमडिस और एमडीस्क बर्नर) Amazon.com पर बहुत अच्छे दामों पर उपलब्ध नहीं हैं। निर्माता कहते हैं कि वे 1000 वर्षों के लिए डेटा रख सकते हैं।

मुझे लगता है कि आपके पांच में से तीन बुलेट पॉइंट वास्तव में एक ही विषय के बदलाव हैं: चुंबकीय हार्ड ड्राइव का भंडारण। आपके अंतिम बिंदु के रूप में, मुद्दा यह नहीं है कि मीडिया कितने समय तक डेटा को बनाए रखेगा (और कम से कम हार्ड डिस्क निर्माता आमतौर पर उन संख्याओं का हवाला देते हैं जो वास्तविकता से कहीं बेहतर हैं) लेकिन कितने समय तक डेटा पढ़ने के लिए उपकरण उपलब्ध होंगे या उन्हें बनाने का ज्ञान उपलब्ध होगा। आपकी सुझाई गई सभी तकनीकें उच्च तकनीक वाली हैं। मान लीजिए वाइकिंग्स ने ब्ल्यू-रे डिस्क पर संग्रहीत डेटा; अब हमें उस डेटा की व्याख्या करने का ज्ञान कैसे होगा?
एक CVn

@ माइकलकॉर्जलिंग एक अतिरिक्त कंप्यूटर है जिसमें सभी बाह्य उपकरणों की आवश्यकता होती है। यदि आवश्यकता हो तो ROM मेमोरी का उपयोग करें।
QuyNguyen2013

1

जैसा कि किसी ने पहले ही उल्लेख किया है कि एम-डिस्क नामक एक नई तकनीक है। वे बहुत विश्वसनीय हैं: http://www.zdnet.com/torture-testing-the-1000-year-dvd-7000023203/ हमने उत्पादन मशीनों डिस्क की छवियों को सुरक्षित करने के लिए उनका उपयोग करना शुरू कर दिया। बाजार पर पहले से ही ब्लू-रे मौजूद हैं। केवल नुकसान यह है कि वे क्लासिक बी-आरडी की तुलना में धीमी हैं।


मुझे ओपी के लिए समान आवश्यकता है और इसके बारे में पढ़ने के बाद, मुझे लगता है कि मैं इसे इस समाधान के लिए कोशिश करूंगा, इस तकनीक को इंगित करने के लिए धन्यवाद! यह केवल एम-डिस्क के साथ संगत एक डीवीडी या ब्लू-रे लेखक खरीदने की आवश्यकता है, और एलजी ने पहले से ही बहुत उत्पादन किया है, इसलिए यह काफी सुलभ और कम लागत वाला है!
गाभिन

1
वास्तव में ऐसा लगता है कि एम-डिस्क उतने विश्वसनीय नहीं हैं जितना वे दिखावा करते हैं। अभिलेखागार डी फ्रांस (आधिकारिक फ्रांस के डेटा अभिलेखीय संस्थान) द्वारा एक स्वतंत्र फ्रेंच अध्ययन सबसे अच्छा डेटा अभिलेखीय समर्थन खोजने के लिए, और उन्होंने पाया कि एम-डिस्क वास्तव में आर्द्रता और तापमान (त्वरित उम्र बढ़ने) के खिलाफ खड़े नहीं होते हैं। मैं यहाँ और अधिक विवरण के साथ एक उत्तर पोस्ट करूँगा।
17

0

यदि आप इस समस्या को हल करने के लिए एक विधि चाहते हैं, तो आपको डिजिटल प्रकाशन क्षेत्र का अध्ययन करना चाहिए।

http://en.wikipedia.org/wiki/Digital_preservation

डिजिटल परिरक्षण डिजिटल सामग्री को जीवित रखने की विधि है ताकि वे उपयोगी रहें क्योंकि तकनीकी विकास मूल हार्डवेयर और सॉफ्टवेयर विनिर्देश को अप्रचलित (विकिपीडिया) प्रस्तुत करते हैं

एक संदर्भ मॉडल भी है: OAIS http://en.wikipedia.org/wiki/Open_Archival_Information_System

इसके साथ कुछ खुले स्रोत और वाणिज्यिक समाधान हैं। पुस्तकालय और अभिलेखागार इस तकनीकों का उपयोग डिजीटल पुस्तकों को लंबे समय तक संरक्षित करने के लिए करते हैं।


डेटा को लंबे समय तक बनाए रखना मीडिया के लिए उस लंबे समय तक जीवित रहने के बराबर नहीं है, जैसा कि पहले से ही कई उच्च मतदान उत्तरों में बताया गया है। डिजिटल संरक्षण का एक प्रमुख हिस्सा मीडिया युगों के रूप में डेटा माइग्रेशन है और अप्रचलित हो जाता है।
एक सीवीएन

धन्यवाद माइकल। केवल ओएआईएस की ओर इशारा करते हुए वास्तविक ऑब्जेक्टिव प्राप्त करने के लिए एक विधि के रूप में।
एजीएम

यह डिजिटल क्यूरेशन रणनीतियों के लिए एक अच्छा जवाब है, लेकिन वास्तव में भंडारण माध्यम का उपयोग नहीं किया जाना चाहिए। OAIS मॉडल बहुत अच्छा है और वास्तव में दुनिया के अधिकांश राष्ट्रीय पुस्तकालयों और अभिलेखागार द्वारा उपयोग किया जाता है, लेकिन मुझे यह थोड़ा अधिक जटिल, सैद्धांतिक और व्यक्तिगत उपयोग के लिए अनावश्यक मेटा-डेटा युक्त लगता है। BagIt मॉडल में थोड़ा और अधिक व्यावहारिक और अधिक उपयोगी, लेकिन अभी भी काफी जटिल है, जैसे सरल उपकरण जहां है PAR2 या pyFileFixity पर्याप्त हो सकता है।
गाबोरस

0

आपका उत्तर सरल है:

https://wiki.openstack.org/wiki/Cinder

ओपनस्टैक लगभग 'अमर' स्टोरेज की एक प्रणाली है, क्योंकि आप भविष्य में अनजानी तकनीकों के साथ भी अब नए दोषों को अपग्रेड या बदल सकते हैं। आपका डेटा इस प्रणाली में एक साथ कम से कम 2, 5 स्थानों तक रहता है, इसलिए पूर्ण संग्रहण नोट्स विफल हो सकते हैं और आप डेटा अभी भी मौजूद हैं। 50 पीबी (सत्यापित) तक स्केल - 110 पीबी। मूल रूप से यह आपके हार्डवेयर पर SW लेयर जोड़ता है और यह आपके स्टोरेज को अनंत बनाता है। यह बहुत बड़े छापे के सेटों के पुनर्निर्माण के समय के साथ छापे सेटों की हमारी वर्तमान ध्वनि बाधा पर काबू पा लेता है। लागत पारंपरिक रेड स्टोरेज सिस्टम का लगभग 50% है। मुझे पता है कि यह एक संदर्भ वास्तुकला के रूप में विशेषता FUJITSU से एक प्रणाली है: CD10000


1
अब आप सिर्फ इतना है कि कंपनी में अपना विश्वास :-) डाल करने के लिए है
einpoklum - को पुनः स्थापित मोनिका

-1

वर्ष 2014 की वर्तमान तकनीक का उपयोग करते हुए व्यावहारिक दीर्घकालिक डेटा भंडारण:

... और यही मैं कर रहा हूं।

बहु-टेराबाइट ड्राइव के दो, उदाहरण के लिए दो ड्राइव 3 टेराबाइट्स। एक टीबी -1 और दूसरा टीबी -2। टीबी -1 के लिए सब कुछ का बैकअप लें। टीबी -1 का समर्थन करने के एक साल बाद, टीबी -2 को फिर से प्रारूपित करें और टीबी -1 को टीबी -2 में कॉपी करें। फिर अगले साल के लिए, टीबी -2 के लिए सब कुछ वापस कर दें। उस वर्ष के बाद, टीबी -1 को फिर से प्रारूपित करें और टीबी -2 को टीबी -1 में कॉपी करें जिससे फिर से द्वि-वार्षिक चक्र शुरू हो।

रिफॉर्मरेटिंग सेक्टर मार्करों की चुंबकीय शक्ति को पुनर्स्थापित करता है। और नकल डेटा की चुंबकीय शक्ति को पुनर्स्थापित करता है।

एक ही सिद्धांत को टेप बैकअप और सीडी बैकअप या किसी अन्य बैकअप के लिए लागू किया जा सकता है। लेकिन सीडी इतनी असुविधाजनक हैं क्योंकि वे एक साल से भी कम समय में खराब हो सकती हैं, और आपको सब कुछ वापस करने के लिए उनमें से कई की आवश्यकता है। इसलिए, हर 5 महीने में सभी बैकअप सीडी की प्रतियां जलाना बहुत काम है। अब तक, मैं अपना पूरा जीवन एक मल्टी-टेराबाइट ड्राइव पर संग्रहीत कर सकता हूं।


2
एक साल से भी कम समय में सीडी का खराब होना? क्या आप कह रहे हैं कि आपके पास 1 साल से ज्यादा पुरानी कोई सीडी नहीं है? मेरे पास एक वर्ष से अधिक समय से डेटा और ऑडियो सीडी है जो मैं आपको आश्वस्त कर सकता हूं, और वे ठीक काम करते हैं!
डेव

1
मेरे पास 1998 से सीडी हैं जो अभी भी ठीक काम करती हैं। हमारे बारे में जानने के बावजूद यह सच नहीं है, आपको क्या लगता है कि यह मामला है? क्या आप अपनी जानकारी का स्रोत बना सकते हैं? धन्यवाद।
मैथ्यू विलियम्स

HDD पर डेटा को फिर से लिखने की कोई आवश्यकता नहीं है, आपको केवल विद्युत चुम्बकीय क्षेत्र को बनाए रखने (या पुनर्स्थापित) करने के लिए एक विद्युत आपूर्ति प्रदान करने की आवश्यकता है। लंबी अवधि के भंडारण के लिए डेटा को फिर से लिखना एसडी / कॉम्पैक्ट कार्ड और एसडीडी के लिए आवश्यक है।
जाबोरस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.