अपनी फ़ाइलों को मिटाए नहीं जाने के लिए आपको कितने पास की आवश्यकता होती है, ताकि वे उन्हें अप्राप्य न बना सकें?


20

यदि आपके पास हाल ही में, सामान्य हार्ड ड्राइव पर एक निजी डेटा है - तो इसे अपरिवर्तनीय बनाने के लिए आपको डेटा को हटाने के लिए कितने पास चाहिए?

इस अर्थ में नहीं, कि 100 मिलियन यूरो या डॉलर के बजट के साथ 20 विशेषज्ञों की एक फोरेंसिक टीम और 80% सटीकता के साथ एक ज्ञात पते से कुछ जोड़े बाइट्स को बहाल करने के लिए, लेकिन कुछ 1000 € / के साथ कुछ लोग $ बजट, जो काम पर दो सप्ताह से अधिक नहीं बिताएंगे, और जो नहीं जानते कि वे ड्राइव पर कहां खोज रहे हैं।

लिनक्स / GNU shredमैनुअल में कहता है:

   -n, --iterations=N
          overwrite N times instead of the default (3)

लेकिन एक तरफ मैंने एनएसए के सुझाव के बारे में 27 बार ओवरराइट करने के बारे में सुना, और दूसरी ओर पेशेवर डेटा रिकवरी फर्मों ने एक बार से मिटाए गए ड्राइव से डेटा को पुनर्प्राप्त नहीं किया।

साक्ष्य, कागजात, प्रमाण?

नोट: यह सवाल क्या है:

  • यह बुरे क्षेत्रों के बारे में नहीं है, जहाँ डेटा के माध्यम से पर्ची हो सकती है
  • यह 90 के दशक की शुरुआत से पुराने एमएफएम / आरएलएल-ड्राइव के बारे में नहीं है
  • यह विभिन्न उपकरणों के बारे में नहीं है
  • यह विधि (यादृच्छिक संख्या 0s, 0xFF और फैंसी पैटर्न) के बारे में इतना नहीं है।
  • यह सुरक्षित रूप से पोंछने के लिए विभिन्न तकनीकों के बारे में नहीं है (चुंबकीय शक्ति, पिघलने, रेत के साथ भरना और मोड़ना)।
  • यह फ्लैश ड्राइव की विशेष समस्याओं के बारे में नहीं है

5
आधुनिक हार्ड ड्राइव पर 1 ओवरराइट के बाद किसी ने भी किसी भी उपयोगी डेटा को पुनर्प्राप्त करने के लिए साबित नहीं किया है। nber.org/sys-admin/overwritten-data-gutmann.html
Moab

जवाबों:


48

एक बार।

आधुनिक चुंबकीय मीडिया काफी कुशल हैं, और पूर्व बिट पदों के बहुत कम सबूतों को पीछे छोड़ देते हैं। क्या पीछे छोड़ दिया जाता है इलेक्ट्रॉन माइक्रोस्कोप और / या उच्च तकनीक मैग्नेटोमेट्रिक (या वे जो भी कहा जाता है) स्कैनर की आवश्यकता होती है। इस तरह के सभी उपकरण भयावह रूप से महंगे हैं, और यहां तक ​​कि सबसे अच्छे उपकरण और सबसे कुशल विशेषज्ञों के साथ, यह समय की एक बड़ी मात्रा में लेता है (एक पलटन के लिए वर्षों का विचार करें; सभी हार्ड डिस्क में कई प्लैटर्स हैं) और बहुत उच्च विफलता दर है।

यदि आप सरकारी रहस्यों (एनएसए के रूप में) के साथ काम कर रहे हैं, तो लिखना-एक बार शायद बहुत अच्छा नहीं है, क्योंकि चीन को इन उपकरणों को प्राप्त करने और उपयोग करने में कोई समस्या नहीं है, और न ही सैकड़ों विशेष विशेषज्ञों की टीमों को उनका उपयोग करने के लिए नियोजित करना।

यदि, दूसरी ओर, आप केवल व्यक्तिगत बैंकिंग पासवर्ड और अपने गुप्त pr0n स्टैश के साथ काम कर रहे हैं, तो किसी भी व्यावहारिक साधनों से डेटा को पूरी तरह से अप्राप्य प्रदान करने के लिए एक एकल पास पर्याप्त है।

उस ने कहा, आधुनिक डिस्क काफी तेज हैं, और जब तक आप हार्ड ड्राइव की संपूर्णता को मिटा नहीं देते हैं, तब तक कई बार इतना कम समय लगता है कि वास्तव में ऐसा करने का कोई कारण नहीं है। इस प्रकार, जबकि पास होने के जटिल पैटर्न के साथ आपको कई बार ओवरराइट करना पड़ता है, यह व्यापक रूप से व्यापक है कि सभी "सुरक्षित विलोपन" सॉफ़्टवेयर कई पासों को डिफॉल्ट करते हैं, उन डिफॉल्ट्स को ओवरराइड करने के लिए वास्तव में बहुत कम बिंदु हैं। जब मैंने उपयोग किया shred(डिफ़ॉल्ट संख्या पास: 3) मैंने इसे अपने 3 पास करने दिया; जब मैं विंडोज पर इरेज़र का उपयोग करता हूं (किसी फ़ाइल पर पास की डिफ़ॉल्ट संख्या: 35), तो मैंने इसे अपने 35 पास करने दिया। (हार्ड ड्राइव पर खाली स्थान हटाने पर इरेज़र केवल एक पास को डिफॉल्ट करता है; यह भी, मैं डिफ़ॉल्ट रूप से चलने देता हूं।)

तो आपके प्रश्न का उत्तर (कितने पास आवश्यक हैं?) है: "एक।" आपके निहित प्रश्न का उत्तर (क्या मुझे श्रेय के डिफ़ॉल्ट 3 पास को ओवरराइड करना चाहिए?) है: "नाह।"

दूसरी ओर, यदि आप एक गुप्त सरकारी एजेंट हैं, ठीक है, कोई एक उत्तीर्ण वास्तव में पर्याप्त है क्योंकि आप नहीं है कर अपने डेटा के बाद चीन की है। यदि यह मामला है, हालांकि, आपको अपने बेहतर / हैंडलर से पूछना चाहिए कि आपकी एजेंसी के नियम संवेदनशील डेटा को हटाने के बारे में क्या हैं, एसयू नहीं। ;-)

कैविएट: फ्लैश-आधारित मीडिया डिवाइस के जीवन का विस्तार करने के लिए "वियर लेवलिंग" नामक एक प्रणाली को नियोजित करता है। शब्द का अर्थ क्या है या इसके पीछे के कारणों के बारे में जाने के बिना, इसका मतलब है कि आप वास्तव में फ्लैश-आधारित मीडिया पर फ़ाइलों को सुरक्षित रूप से हटा नहीं सकते हैं जब तक कि आप पूरे मीडिया को सुरक्षित रूप से मिटा नहीं देते हैं, और यहां तक ​​कि हमेशा गारंटी नहीं दे सकते हैं कि पहनने-लेवलिंग एल्गोरिदम ने अन-वाइप किए गए डेटा को पीछे नहीं छोड़ा जो आप लिख नहीं सकते थे। फ्लैश-आधारित मीडिया के मामले में, आपका सबसे अच्छा दांव किसी भी और सभी संवेदनशील डेटा को एन्क्रिप्ट करना है जो उस पर जाता है, एक मजबूत पासवर्ड का उपयोग करके।

TrueCrypt के प्रलेखन में इस समस्या की एक उत्कृष्ट चर्चा , और इसे हल करने के तरीके शामिल हैं।


कई, एक भयानक जवाब के लिए कई प्लस। बहुत बुरा मुझे केवल एक ही देना है। :(
काजुनलुक

4
कि यह पूरी तरह से nailed। मैं भी जोड़ना चाहते हैं, वर्ष 35 पास ग्रहण वाइप Guttman आप नहीं पता था कि ड्राइव आप किस प्रकार का इस्तेमाल किया, और एम एफ एम और अन्य अप्रचलित डिजाइन के लिए इस तरह भागा पैटर्न विशिष्ट के रूप में
जर्नीमैन गीक

डिस्क के संबंध में एक कैविएट यह है कि सिद्धांत रूप में ड्राइव को गर्म या ठंडा होने पर लिखे गए डेटा को लेने के लिए सिर को ऑफसेट करके कुछ डेटा को पुनर्प्राप्त किया जा सकता है और इसलिए सिर को थोड़ा अलग तरीके से तैनात किया गया था। लेकिन मैंने कभी इस तकनीक के बारे में नहीं सुना है जो वास्तव में कार्यरत हो (एनएसए के बाहर, कम से कम)।
डेनियल आर हिक्स

1
@Kromey - आधुनिक ड्राइव हेड पोजिशनिंग के लिए सर्वो फीडबैक का उपयोग करते हैं जो कि एक तापमान क्षतिपूर्ति तकनीक है। एक समय में पुरानी ड्राइव में स्टेपर मोटर्स का इस्तेमाल होता था। इनमें से एक के साथ, आप एक गैर-गरम गैरेज में रात भर बिना किसी कंप्यूटर को छोड़ सकते हैं और क्या यह ट्रैक 0 खोजने में पूरी तरह से असमर्थ है। कंप्यूटर को शुरू करें और इसे आधा घंटा चलने दें, इसे रीसेट करें और यह बूट हो जाएगा क्योंकि प्लेट लगाने के लिए पर्याप्त वृद्धि हुई है पढ़ने / लिखने के सिर के नीचे वापस ट्रैक। यही कारण है कि हमने अपनी दुकान में रात भर सर्वर को छोड़ दिया।
फियास्को लैब्स

1
मुझे पसंद है कि इस आदमी ने "यदि आप गुप्त एजेंट हैं" परिदृश्य को कवर किया है।
दुष्यंत बंगाल

16

यह एक पुराना प्रश्न है, लेकिन मुझे लगा कि मेरे दो सेंट में मुझे फेंकने के लिए मजबूर होना पड़ा, क्योंकि मेरे पास फोरेंसिक डेटा रिकवरी अनुभव है।

जो प्रश्न पूछा जा रहा है वह विशुद्ध रूप से अकादमिक है, इसलिए यह उत्तर भी विशुद्ध रूप से अकादमिक है। व्यावहारिक रूप से, स्वीकृत उत्तर सही है; एक पास अप्राप्य ड्राइव पर डेटा बनाने के लिए पर्याप्त है। हालाँकि, एक कारण है कि सरकारें कई पासों को अनिवार्य करती हैं।

लोग हार्ड ड्राइव को एक डिजिटल डिवाइस समझते हैं; चुम्बकीय बिट्स को एक तंग पैटर्न में व्यवस्थित किया जाता है और ड्राइव हेड द्वारा "फ़्लिप" किया जाता है। लेकिन वास्तव में, एक हार्ड ड्राइव एक एनालॉग डिवाइस है जहां तक ​​चुंबकीय मीडिया के भौतिकी का संबंध है। प्लैटर्स की सतह को चुंबकीय द्विध्रुवों से भरे एक सब्सट्रेट के साथ लेपित किया जाता है जो डिजिटल 'बिट' की तुलना में छोटा होता है। एक ओर उन्मुखीकरण में इन द्विध्रुवों की पर्याप्त संख्या बनाम दूसरा व्यक्तिगत स्तर पर एक शुद्ध विद्युत प्रतिरोध का गठन करता है। यह प्रतिरोध की दहलीज है जो यह निर्धारित करता है कि क्या बिट को 1 या 0 के रूप में व्याख्या की गई है, न कि 'ऑन' या 'ऑफ' ध्रुवीयता पर एक डिजिटल '।

जहां तक ​​ड्राइव के इलेक्ट्रॉनिक्स का सवाल है, सिर से आने वाला इलेक्ट्रिकल सिग्नल एक मॉडिफाइड साइन वेव है, जो कि 1 और 0 के बिट स्ट्रीम नहीं है। यह ठीक उसी तरह है जिस तरह से दशकों पहले चुंबकीय संकेतों ने ऑडियो सिग्नल रिकॉर्ड किए थे - केवल अब सब्सट्रेट कहीं अधिक सघन है और हम एनालॉग 'शोर' से डिजिटल सिग्नल निकालने के लिए गणित का उपयोग कर रहे हैं।

अब, शारीरिक रूप से 100% परफेक्ट प्लेटर का निर्माण करना असंभव है, और भले ही आप ऑपरेटिंग वातावरण कभी भी 100% सही न हो। भौतिकी के जिस पैमाने पर आधुनिक हार्ड ड्राइव काम करते हैं, वहाँ शाब्दिक रूप से सैकड़ों कारक हैं जो सिग्नल में सूक्ष्म खामियों का निर्माण करते हैं, और वे एक समस्या को पर्याप्त रूप से महत्वपूर्ण बनाते हैं जो एक विशिष्ट ड्राइव पर 1-2% तक की जगह है। उनसे निपटने के लिए त्रुटि सुधार पर "व्यर्थ"। आपकी हार्ड ड्राइव वस्तुतः हर समय त्रुटियों से उबर रही है । सामान्य हार्ड ड्राइव ऑपरेशन वास्तव में एक संभावना गेम है जिसमें "अच्छा" क्षेत्र केवल एक%% संभावना है कि वहां एन्कोड किया गया डेटा सटीक है।


अब हम बुरे क्षेत्रों के मामले को देखते हैं, और आप देख सकते हैं कि उसी तकनीक को अच्छे लोगों पर कैसे लागू किया जा सकता है।

यदि किसी क्षेत्र को "खराब" (नियंत्रक द्वारा, ओएस द्वारा नहीं) के रूप में चिह्नित किया जाता है, तो इसका मतलब है कि किसी विशेष क्षेत्र के सभी डेटा बिट्स की संभावना, जब पूरे के रूप में लिया जाता है, गणितीय पुनर्प्राप्ति की सीमा से नीचे गिर गया है ड्राइव की त्रुटि सुधार एल्गोरिदम द्वारा। इसका मतलब यह नहीं है कि बिट्स वास्तव में मर चुके हैं; केवल यही कि नियंत्रक यह सुनिश्चित नहीं कर सकते कि वे सही हैं।

हालाँकि, आप एक खराब सेक्टर को सैकड़ों, या संभवतः हजारों बार पढ़कर यह जान सकते हैं कि नुकसान कितना बुरा है। "खराब" सेक्टर पर सिर के प्रत्येक पास के साथ, सेक्टर थोड़ा अलग तरीके से पढ़ता है। प्लेटर डगमगाना, तापमान, कंपन, घड़ी तिरछा, आदि सभी कुछ अलग हो सकते हैं। लेकिन यदि आप प्रत्येक पास की तुलना हज़ारों पास की तुलना में पर्याप्त समय से पहले कर सकते हैं, तो आप पुनर्प्राप्त कर सकते हैं (पूर्ण निश्चितता से थोड़ा कम के साथ) इससे पहले कि आपके द्वारा खट्टा होने से पहले खराब क्षेत्र में क्या डेटा निहित है। यह ठीक उसी तरह है जैसे कि डेटा रिकवरी सॉफ़्टवेयर जैसे स्पिनराइट काम करता है।

अब उस तर्क को "अच्छे" क्षेत्र में लागू करते हैं। जब आप ड्राइव को सिंगल पास से मिटाते हैं, तो नियंत्रक 100% निश्चित होता है कि प्रत्येक क्षेत्र में जो भी बिट पैटर्न आप ड्राइव से भरते हैं। लेकिन उन रीड्स में अभी भी त्रुटियां हैं, और नियंत्रक अभी भी उन्हें सही कर रहे हैं। उन त्रुटियों में से कुछ पर्यावरणीय हैं, लेकिन इस बात की अच्छी संभावना है कि उनमें से कई सेक्टर के अधिलेखित होने से पहले जो भी डेटा थे, उसके अवशेष भी हैं।

याद रखें कि हम उसी तकनीक के बारे में बात कर रहे हैं जिसका उपयोग हमने यहां दशकों से ऑडियो टेप पर किया है। उन सभी चुंबकीय द्विध्रुवों को उस एकल पास में नहीं मिला, इसलिए शोर में अभी भी एक "भूत" संकेत है।

एडम सैवेज (माइथबस्टर्स का) उद्धृत करने के लिए: "मैं आपकी वास्तविकता को अस्वीकार करता हूं और अपने खुद के स्थानापन्न करता हूं।" यदि आप ड्राइव के कंट्रोलर (यह मिटाए गए डेटा पैटर्न की गणितीय निश्चितता के साथ) को समीकरण से बाहर निकालते हैं और ड्राइव के इलेक्ट्रॉनिक्स से आने वाली साइन वेव को देखते हैं, तो ड्राइव पर मौजूद डेटा को फिर से बनाना सिद्धांत में संभव हो सकता है इससे पहले कि यह मिटा दिया गया था - जैसे हम ऑडियो टेप के साथ करते थे जो "मिट" गया था।

या शायद नहीं। यह निक्सन वाटरगेट टेप के लापता 18 मिनट के साथ मदद नहीं करता था ... या यह किया था? ;-)


अब, क्या यह व्यावहारिक है? क्या ऐसा करने में सक्षम डिवाइस वास्तव में मौजूद है? शायद। शायद नहीं। यदि यह किया जाता है, तो यह निश्चित रूप से एक राज्य रहस्य होगा। लेकिन चूंकि यह सैद्धांतिक रूप से संभव है, इसलिए आपको इसके खिलाफ सैद्धांतिक रूप से पहरा देना होगा। इसका मतलब है कि कई बिट पैटर्न के साथ कई पास करने के लिए उस भूत संकेत को जितना संभव हो सके हाथापाई करें।

यदि आप वर्गीकृत डेटा को पोंछने की कोशिश कर रहे हैं, तो यह विचार करना महत्वपूर्ण है। यदि यह आपके गुप्त pr0n स्टैश है तो यह संभवतः नहीं है (जब तक कि आपकी पत्नी एनएसए के लिए काम नहीं करती है)।


3
बहुत विचार और प्रयास यह नहीं अप करने के लिए।
डेमन

Btw अगर मैं एक हार्ड ड्राइव पर राज्य रहस्य था मैं इस पर ओवरराइट की किसी भी राशि पर भरोसा नहीं करेगा। मैं या तो एक कोण बनाने की मशीन या एक उड़ानेवाला के लिए संसाधन होगा।
मार्क.2377
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.