कोई बैकअप के साथ एक खो वेबसाइट पुनर्प्राप्त?


262

दुर्भाग्य से, हमारे होस्टिंग प्रदाता ने 100% डेटा हानि का अनुभव किया, इसलिए मैंने दो होस्ट ब्लॉग वेबसाइटों के लिए सभी सामग्री खो दी है:

(हां, हां, मुझे पूरी तरह से ऑफसाइट बैकअप करना चाहिए था। दुर्भाग्य से, मेरे सभी बैकअप सर्वर पर ही थे। इसलिए व्याख्यान को सहेजें; आप 100% बिल्कुल सही हैं, लेकिन यह फिलहाल मेरी मदद नहीं करता है। यहाँ सवाल पर ध्यान केंद्रित!

मैं वेब क्रॉलर कैश से वेबसाइट को पुनर्प्राप्त करने की धीमी, दर्दनाक प्रक्रिया शुरू कर रहा हूं।

वाररिक की तरह इंटरनेट वेब स्पाइडर (याहू, बिंग, गूगल, इत्यादि) से एक वेबसाइट को पुनर्प्राप्त करने के लिए कुछ स्वचालित उपकरण हैं , लेकिन मेरे पास इसके उपयोग के कुछ बुरे परिणाम थे:

  • मेरे आईपी पते का उपयोग करने के लिए Google से जल्दी से प्रतिबंधित कर दिया गया था
  • मुझे बहुत सारी 500 और 503 त्रुटियाँ मिलीं और "5 मिनट प्रतीक्षा की जा रही है ..."
  • अंत में, मैं हाथ से पाठ सामग्री को तेजी से पुनर्प्राप्त कर सकता हूं

Google कैश के माध्यम से क्लिक करने और प्रत्येक व्यक्तिगत फ़ाइल को HTML के रूप में सहेजने के लिए, मैंने सभी ब्लॉग पोस्टों की एक सूची का उपयोग करके बहुत बेहतर भाग्य प्राप्त किया है। जब बहुत सारे ब्लॉग पोस्ट होते हैं, तो बहुत सारे नहीं होते हैं , और मुझे लगता है कि मैं एक बेहतर बैकअप रणनीति न होने के लिए कुछ आत्म-प्रचार के लायक हूं। वैसे भी, महत्वपूर्ण बात यह है कि मुझे इस तरह से ब्लॉग पोस्ट पाठ प्राप्त करने का सौभाग्य मिला है, और मैं निश्चित रूप से वेब पेजों के पाठ को इंटरनेट कैश से बाहर निकालने में सक्षम हूं। अब तक जो मैंने किया है, उसके आधार पर, मुझे विश्वास है कि मैं सभी खोए हुए ब्लॉग पोस्ट पाठ और टिप्पणियों को पुनर्प्राप्त कर सकता हूं

हालाँकि, प्रत्येक ब्लॉग पोस्ट के साथ जाने वाली छवियां साबित हो रही हैं ... और अधिक कठिन।

इंटरनेट कैश से वेबसाइट पेजों को पुनर्प्राप्त करने के लिए कोई सामान्य सुझाव, और विशेष रूप से, वेबसाइट पेजों से संग्रहीत छवियों को पुनर्प्राप्त करने के लिए स्थान ?

(और, फिर, कृपया, कोई बैकअप व्याख्यान नहीं। आप पूरी तरह से, पूरी तरह से पूरी तरह से सही हैं! लेकिन सही होने से मेरी तत्काल समस्या का समाधान नहीं हो रहा है ... जब तक आपके पास समय मशीन नहीं है ...)


96
जब जेफ एटवुड जैसा कोई व्यक्ति खुद दो पूरी वेबसाइट खो सकता है तो एक झपट्टा मारना ... खैर। मैं अपनी स्वयं की बैकअप प्रक्रियाओं की समीक्षा करने जा रहा हूं, एक के लिए: P

240
@ घोषी: जेफ़ के पास कोडिंग हॉरर पर बैकअप पर कुछ अच्छे लेख हैं। आपको उन्हें जल्दी पढ़ने देना चाहिए।

34
जोशंट ने एक (1) इंटरनेट जीता। यह ऑफ़र अन्य ऑफ़र के साथ संयुक्त नहीं हो सकता है, एक्सचेंज किया जा सकता है या प्रतिस्थापित किया जा सकता है। कोई बारिश नहीं।
एडम डेविस

28
कुछ लोगों की लंबाई एसयू पर रेप करने के लिए जाएगी ...

26
कृपया इसका उल्लेख न करें कि आपने "बैकअप" के रूप में क्या किया है - यदि वे फाइलें एक ही सर्वर पर हैं, तो वे किसी भी तरह से "बैकअप" नहीं हैं।

जवाबों:


220

यहाँ मेरे अंधेरे में जंगली छुरा है: हर छवि अनुरोध के लिए 304 वापस करने के लिए अपने वेब सर्वर को कॉन्फ़िगर करें, फिर भीड़-स्रोत को कहीं न कहीं यूआरएल की सूची पोस्ट करके और अपने सभी पाठकों के लिए पॉडकास्ट पर पूछकर प्रत्येक URL को लोड करने और किसी भी चित्र को क्रॉप करने के लिए। कि उनके स्थानीय कैश से लोड। (यह केवल आपके द्वारा HTML पृष्ठों को पुनर्स्थापित करने के बाद ही काम कर सकता है, <img ...>टैग के साथ पूरा , जो आपके प्रश्न का अर्थ है कि आप ऐसा करने में सक्षम होंगे।)

यह मूल रूप से कहने का एक फैंसी तरीका है, "इसे अपने पाठकों के वेब ब्राउज़र कैश से प्राप्त करें।" आपके पास कई पाठक और पॉडकास्ट श्रोता हैं, इसलिए आप बड़ी संख्या में ऐसे लोगों को प्रभावी रूप से जुटा सकते हैं, जिनके लिए हाल ही में आपकी वेब साइट को देखने की संभावना है। लेकिन विभिन्न वेब ब्राउज़रों के कैश से मैन्युअल रूप से चित्र ढूंढना और निकालना मुश्किल है, और यह संपूर्ण दृष्टिकोण सबसे अच्छा काम करता है यदि यह इतना आसान हो कि बहुत से लोग इसे आज़माएँ और सफल हों। इस प्रकार 304 दृष्टिकोण। पाठकों के लिए यह आवश्यक है कि वे लिंक की एक श्रृंखला पर क्लिक करें और अपने वेब ब्राउज़र (या राइट-क्लिक और सेव-अस, आदि) में लोड करने वाली किसी भी छवि को खींचें और फिर उन्हें आपको ईमेल करें या उन्हें अपलोड करें केंद्रीय स्थान जिसे आप सेट करते हैं, या जो भी हो। इस दृष्टिकोण का मुख्य दोष यह है कि वेब ब्राउज़र कैश उस समय तक वापस नहीं जाता है। लेकिन यह केवल एक पाठक को लेता है जो पिछले कुछ दिनों में 2006 से एक पोस्ट को लोड करने के लिए हुआ, यहां तक ​​कि एक बहुत पुरानी छवि को बचाने के लिए। बड़े पर्याप्त दर्शकों के साथ, कुछ भी संभव है।


52
सबसे रचनात्मक दृष्टिकोण के लिए +1। वास्तव में काम कर सकता है क्योंकि CH के पास कई पाठक हैं।

16
यहां लागू किया गया? diovo.com/2009/12/…
जेफ एटवुड

3
मुझे लगता है कि आप छवि टैग के लिए अपनी स्थिर फ़ाइलों को क्रॉल कर सकते हैं और उन सभी को छवियों के एक विशाल पृष्ठ में कॉपी कर सकते हैं, बजाय हर लिंक को क्लिक करने के। Diovo.com कार्यान्वयन बहुत प्रभावशाली दिखता है, आशा है कि यह आपके लिए काम करता है।

2
वाह, यह एक दुष्ट जादूगर बकवास है मैं <3
अहमद अल्फी

4
वास्तव में, आपको canvasAJAX द्वारा घर भेजने और उपयोग करने वाली छवियों को पुनः प्राप्त करने में सक्षम होना चाहिए ।
टॉम ज़ातो

65

हममें से कुछ लोग RSS रीडर के साथ आपका अनुसरण करते हैं और कैश साफ़ नहीं करते हैं। मेरे पास ब्लॉग पोस्ट हैं जो 2006 तक वापस जाते हैं। मैं जो देख सकता हूं, उससे कोई चित्र नहीं, लेकिन अब आप जो कर रहे हैं, उससे बेहतर हो सकता है।


+1 निश्चित रूप से। Google रीडर नहीं करता है, लेकिन मैं शर्त लगाता हूं कि कोई डेस्कटॉप-आधारित होगा।

2
आप लोगों से अपने ब्राउज़र कैश की जांच करने के लिए भी कह सकते हैं। जो लोग कोडिंग हॉरर रेट्रो-शैली को देखते हैं, उनमें कुछ छवियों को कैश किया जा सकता है।

मुझे ग्रैडर में 2005 तक ब्लॉग पोस्ट मिल गए हैं, लेकिन दुर्भाग्य से, उनके पास चित्र नहीं हैं, और वे मुझे उन पृष्ठों की एक श्रृंखला के रूप में निर्यात नहीं करने देंगे ... मैं उन्हें आपको ईमेल कर सकता हूं, हालांकि, जेफ। ..
ग्लेन सोल्सबेरी

हाँ, एक निहित था "अगर आप इसके लिए पूछेंगे तो मैं आपको भेजूंगा।" मेरे उत्तर में भी।

3
बहुत से RSS पाठक मानते हैं कि चित्र कभी नहीं मरेंगे। मुझे पता है कि मेरा काम करता है :(

62

(1) HTML बैकअप से सभी लापता छवियों के फ़ाइलनाम की एक सूची निकालें। आपको कुछ इस तरह छोड़ दिया जाएगा:

  • रहने-Puft-मार्शमैलो-man.jpg
  • इंटरनेट-गुण-dialog.png
  • याहू-होमपेज-small.png
  • पासवर्ड शो-animated.gif
  • tivo2.jpg
  • माइकल-Abrash-ग्राफिक्स कार्यक्रम

(2) उन फ़ाइलनामों के लिए एक Google छवि खोज करें। ऐसा लगता है कि उनमें से कई अन्य ब्लॉगर्स द्वारा "उमर" मिरर किए गए हैं और लेने के लिए परिपक्व हैं क्योंकि उनके पास एक ही फ़ाइल नाम है

(3) आप इसे एक स्वचालित फैशन में कर सकते हैं यदि यह 10+ छवियों के लिए सफल साबित होता है।


बहुत विडंबना होगी अगर उसे वास्तव में इस तरह से कोई चित्र वापस मिले।
हाशिम

51

पर जाकर Google छवि खोज और टाइपिंग site:codinghorror.comआप कम से कम अपनी छवियों के सभी के लघु छवि बनाई संस्करणों पा सकते हैं। नहीं, यह जरूरी मदद नहीं करता है, लेकिन यह आपको उन हजारों छवियों को पुनः प्राप्त करने के लिए एक प्रारंभिक बिंदु देता है।

कोडिंगहोर इमेज

ऐसा लगता है कि Google कुछ मामलों में बड़ा थंबनेल संग्रहीत करता है :

Google बनाम बिंग

Google बाईं ओर है, दाईं ओर बिंग है।


2
हाँ, सबसे खराब स्थिति, हमें Google से थंबनेल को स्केल करना होगा। मैं बिंग दुकानों बड़े थंबनेल सुन, हालांकि?
जेफ एटवुड 20

मुझे नहीं पता; मैं आदमी की तरह नहीं हूँ। मुझे यह भी पता नहीं है कि वे Google की तरह छवि खोज करते हैं। मैं पता लगाऊंगा और कहा पोस्ट अपडेट करूंगा।
जॉर्ज स्टॉकर

18
मुझे नहीं पता कि यह आप हैं। लेकिन Imageshack में आपके ब्लॉग की कई छवियां हैं। profile.imageshack.us/user/codinghorror
निक बरार्डी

उन्हें लगता है कि 456 छवियां क्या हैं जो पूर्ण आकार की हैं। यह सब कुछ ठीक करने के लिए सबसे अच्छा दांव हो सकता है। शायद वे आपको एक डंप भी प्रदान कर सकते हैं।
निक बर्र्डी

28
प्रारंभ के रूप में Google थंबनेल का उपयोग करें, फिर यह देखने के लिए tineye.com का उपयोग करें कि क्या कोई भी एक प्रति होस्ट कर रहा है।
sep332

40

ब्लॉग्स के बारे में सुनने के लिए क्षमा करें। व्याख्यान देने नहीं जा रहे हैं। लेकिन मैंने पाया कि Imageshack पर आपके चित्र क्या प्रतीत होते हैं। क्या वे वास्तव में तुम्हारे हैं या कोई उनके चारों ओर एक प्रति रख रहा है।

http://profile.imageshack.us/user/codinghorror

उन्हें लगता है कि 456 छवियां क्या हैं जो पूर्ण आकार की हैं। यह सब कुछ ठीक करने के लिए सबसे अच्छा दांव हो सकता है। शायद वे आपको एक डंप भी प्रदान कर सकते हैं।


37

जेफ़, मैंने यहाँ आपके लिए कुछ लिखा है

संक्षेप में, मैं आपको जो प्रस्ताव देता हूं वह है:

  1. प्रत्येक छवि अनुरोध के लिए 304 वापस करने के लिए वेब सर्वर कॉन्फ़िगर करें। 304 का अर्थ है कि फ़ाइल संशोधित नहीं है और इसका मतलब है कि ब्राउज़र फ़ाइल को अपने कैश से प्राप्त करेगा यदि यह वहां मौजूद है। ( साभार : यह सुपरयूजर उत्तर )

  2. वेबसाइट के प्रत्येक पृष्ठ में, छवि डेटा पर कब्जा करने और इसे सर्वर पर भेजने के लिए एक छोटी स्क्रिप्ट जोड़ें।

  3. सर्वर में छवि डेटा सहेजें।

  4. देखा!

आप दिए गए लिंक से स्क्रिप्ट प्राप्त कर सकते हैं।


सुपर उपयोगकर्ता उत्तर लिंक नहीं है।
नथानिएल

@ नथानियल: फिक्स्ड
अलेक्जेंडरपस

28

Wayback मशीन पर इस क्वेरी का प्रयास करें :

http://web.archive.org/web/*sa_re_im_/http://codinghorror.com/*

यह आपको सभी चित्र codinghorror.com से मिलेगा। इसे संग्रहीत किया गया है। यह 3878 छवियां देता है, जिनमें से कुछ डुप्लिकेट हैं। यह पूरा नहीं होगा, लेकिन एक अच्छी शुरुआत कम नहीं है।

शेष छवियों के लिए, आप खोज इंजन कैश से थंबनेल का उपयोग कर सकते हैं, और फिर http://www.tineye.com/ पर इनका उपयोग करके रिवर्स लुक-अप कर सकते हैं । आप इसे थंबनेल छवि देते हैं, और यह आपको वेब पर पाए जाने वाले मिलान चित्रों का पूर्वावलोकन और एक संकेतक देगा।


1
अब 404 लौटाता है?
रॉगरडैक

मैंने स्वचालित रूप से वेबैक मशीन से एक बैकअप प्राप्त करने के लिए एक उपकरण बनाया है: github.com/hartator/wayback-machine-downloader
हार्टअटर

26

+1 ddअनुशंसा पर यदि (1) कच्ची डिस्क कहीं उपलब्ध है; और (2) छवियां साधारण फाइलें थीं। तब आप एक फॉरेंसिक 'डेटा-नक्काशी' टूल का उपयोग कर सकते हैं (उदाहरण के लिए) सभी विश्वसनीय रेंजों को बाहर निकालें जो जेपीजी / पीएनजी / जीआईएफ दिखाई देते हैं। मैंने एक iPhone पर 95% + फ़ोटो पुनर्प्राप्त किए हैं जो इस तरह से मिटा दिए गए थे।

खुला स्रोत उपकरण 'सबसे महत्वपूर्ण' और इसके उत्तराधिकारी 'स्केलपेल' का उपयोग इसके लिए किया जा सकता है:

http://foremost.sourceforge.net/

http://www.digitalforensicssolutions.com/Scalpel/


2
एक बार dd इमेज प्राप्त करने के बाद Photorec का भी उपयोग हो सकता है।

सबसे महत्वपूर्ण फेडोरा पर यम के माध्यम से उपलब्ध है

26

सौभाग्य से, आने वाली पीढ़ियां ठीक होंगी।

यहां तक ​​कि केवल इस बड़ी चट्टान के साथ, वैज्ञानिकों / भाषाविदों ने बहुत कुछ पता लगाया।

रॉसेटा स्टोन

अगर कुछ तस्वीरें गायब हैं, तो इसे किसी को दो हज़ार साल में निकालने के लिए छोड़ दें।

उम्मीद है, आप थोड़ा हंस रहे होंगे। :)


5
ठीक है, आपको मुझसे कम से कम एक

21

आप हमेशा आर्काइव.ऑर्ग की कोशिश कर सकते हैं। Wayback मशीन का उपयोग करें। मैंने अपनी वेबसाइटों से चित्र पुनर्प्राप्त करने के लिए इसका उपयोग किया है।


3
कम से कम कोडिंगहोर के लिए कैश का ज्यादा हिस्सा नहीं लगता। मैं ब्लॉग के लिए छवियों को देखते हैं। हालांकि।

मैंने एक बार इंटरनेट वेन्बैक मशीन का उपयोग करके एक वेबसाइट का निर्माण किया, लेकिन मैंने कुछ समय बाद कोशिश की और यह वास्तव में बहुत अधिक साइटों को संग्रहीत नहीं करता है ...
djangofan

ऐसा लगता है कि यह 2004 तक यहाँ वापस जाता है। web.archive.org/web * / codinghorror.com

धन्यवाद अच्छा है कि यह एक robots.txt फ़ाइल नहीं थी? :)
२०

14

इसलिए, सबसे खराब स्थिति, आप एक चीज़ को पुनर्प्राप्त नहीं कर सकते। अरे नहीं।

मिनीकृत Google लोगों को हथियाने की कोशिश करें, और उन्हें रिवर्स इमेज सर्च इंजन TinEye के माध्यम से डालें । उम्मीद है कि इसे लोगों द्वारा बनाए गए किसी डुप्लिकेट या रीहॉस्ट को हथियाना चाहिए।


14

यह एक लंबा शॉट है, लेकिन आप इस पर विचार कर सकते हैं:

  • आपके द्वारा गायब की गई चित्र की सटीक सूची पोस्ट करना
  • आपके सभी पाठकों के इंटरनेट कैश के माध्यम से पुनर्प्राप्ति प्रक्रिया को क्राउड-सोर्सिंग।

उदाहरण के लिए, Nirsoft मोज़िला कैश व्यूअर देखें :

वैकल्पिक शब्द
(स्रोत: nirsoft.net )

यह जल्दी से किसी भी "blog.stackoverflow.com" चित्र को खोद सकता है, जो अभी भी एक साधारण कमांड लाइन के माध्यम से हो सकता है:

MozillaCacheView.exe -folder "C:\Documents and Settings\Administrator\Local Settings\Application Data\Mozilla\Firefox\Profiles\acf2c3u2.default\Cache" 
/copycache "http://blog.stackoverflow.com" "image" /CopyFilesFolder "c:\temp\blogso" /UseWebSiteDirStructure 0

नोट: उनके पास क्रोम के लिए समान कैश एक्सप्लोरर है

वैकल्पिक शब्द
(स्रोत: nirsoft.net )

(मेरे पास ब्लॉग में 15 दिनों का मूल्य होना चाहिए। इस पृष्ठ पर चित्र। com)

और इंटरनेट एक्सप्लोरर , या ओपेरा


फिर सार्वजनिक सूची को अद्यतन करने के लिए कि पाठक अपने कैश में क्या रिपोर्ट करते हैं, प्रतिबिंबित करें।


12

अतीत में मैंने कैश्ड चित्रों को खींचने के लिए http://www.archive.org/ का उपयोग किया है । यह हिट या मिस की तरह है लेकिन इसने मेरे लिए काम किया है।
इसके अलावा, जब मैं एक पुरानी साइट पर उपयोग किए गए स्टॉक फोटो को पुनर्प्राप्त करने की कोशिश कर रहा हूं, तो www.tineye.com बहुत अच्छा है जब मेरे पास केवल थंबनेल हैं और मुझे पूर्ण आकार की छवियों की आवश्यकता है।

मैं आशान्वित हूं कि इससे आपको सहायता मिलेगी। शुभ लाभ।


मैंने कुछ मिनट पहले codinghorror.com छवियों के लिए आर्काइव.ऑर्ग के माध्यम से देखा और जिन कुछ पोस्टों को मैंने क्लिक किया, उनमें कोई दिखावा नहीं था।
जॉर्ज स्टॉकर 20

संग्रह के पहले महीने के बाद डेटा संग्रहीत करता है।
क्रिश्चियन

10

यह शायद सबसे आसान या सबसे पूर्ण-प्रूफ समाधान नहीं है, लेकिन एवरनोट जैसी सेवाएं आम तौर पर एप्लिकेशन के अंदर संग्रहीत होने पर टेक्स्ट और छवियों दोनों को बचाती हैं - शायद कुछ सहायक पाठक जो आपके लेखों को सहेजते हैं, वे छवियों को बचा सकते हैं और उन्हें आपको वापस भेज सकते हैं। ?


10

मुझे आर्काइव.ऑर्ग के साथ बहुत अच्छे अनुभव हुए हैं । यहां तक ​​कि अगर आप साइट से अपने सभी ब्लॉग पोस्ट निकालने में सक्षम नहीं हैं , तो वे समय-समय पर स्नैपशॉट रखते हैं:

वैकल्पिक शब्द

इस तरह आप प्रत्येक पृष्ठ को देख सकते हैं और आपके द्वारा किए गए ब्लॉग पोस्ट देख सकते हैं। सभी पोस्ट के नाम के साथ आप आसानी से उन्हें Google के कैश में पा सकते हैं यदि आर्काइव.ऑर्ग के पास यह नहीं है। पुरालेख छवियों को रखने की कोशिश करता है, Google कैश में छवियां होंगी, और मैंने हाल ही में अपने कैश को खाली नहीं किया है इसलिए मैं आपको और अधिक ब्लॉग विषयों के साथ मदद कर सकता हूं :)


मैंने उस कंपनी की वेबसाइट से कुछ डेटा प्राप्त करने की कोशिश की, जो मैं कुछ समय पहले काम करता था। यह पाठ के लिए अच्छा था, छवियों के लिए कम। लेकिन YMMV
क्रिस

मेरा मानना ​​है कि Google वेब कैश छवियों को संग्रहीत नहीं करता है ।
नथानिएल

8

क्या आपने अपने स्थानीय ब्राउज़र कैश की कोशिश की है? बहुत अच्छा मौका कुछ और हालिया सामान अभी भी है। http://lifehacker.com/385883/resurrect-images-from-my-web-browser-cache

(या आप सभी लापता छवियों की सूची संकलित कर सकते हैं और हर कोई अपने कैश की जांच कर सकता है यह देखने के लिए कि क्या हम रिक्त स्थान भर सकते हैं)


8

भविष्य के लिए एक सुझाव: मैं ब्लॉगिंग के लिए विंडोज लाइव राइटर का उपयोग करता हूं और यह ब्लॉग पर प्रकाशित करने के अलावा, मेरी मशीन पर पोस्ट की स्थानीय प्रतियों को सहेजता है।


साथ ही, विंडोज लाइव राइटर का उपयोग करना अच्छा सामान्य ज्ञान है।

7

लगभग पांच साल पहले, एक बाहरी हार्ड ड्राइव का एक प्रारंभिक अवतार जिस पर मैं अपने सभी डिजिटल फोटो स्टोर कर रहा था बुरी तरह से विफल हो गया। मैंने हार्ड ड्राइव का उपयोग करके एक छवि बनाई ddऔर जेपीईजी छवि की तरह दिखने वाली किसी भी चीज़ को पुनर्प्राप्त करने के लिए एक अल्पविकसित उपकरण लिखा। मेरी अधिकांश तस्वीरें उसी में से मिलीं।

तो, सवाल यह है कि क्या आप वर्चुअल मशीन डिस्क छवि की एक प्रति प्राप्त कर सकते हैं जो छवियों को रखती है?



7

मैं आर्काइव.ऑर्ग के संयोजन और [टॉर] [2] जैसे एक अनुरोध अनाम का सुझाव देता हूं। मैं गुमनाम नाम का उपयोग करने का सुझाव देता हूं क्योंकि इस तरह से आपके प्रत्येक अनुरोध में एक यादृच्छिक आईपी और स्थान होगा और इस तरह आप असामान्य रूप से उच्च संख्या के अनुरोधों के लिए आर्काइव.ऑर्ग (जैसे गूगल ने किया) पर प्रतिबंध लगाने से बच सकते हैं।

गुड लक, उस ब्लॉग में बहुत सारे रत्न हैं।


यह देखते हुए कि जेफ आर्काइव.ऑर्ग के लिए एक दान करना चाहते हैं, इसलिए अनाम का दुरुपयोग करना बिल्कुल अस्वीकार्य नहीं हो सकता है। लेकिन मैं अभी भी आपको इसके लिए एक किक देना चाहता हूं। : - |

6

Wayback मशीन कुछ होगा। Google कैश और समान कैश में कुछ होंगे।

सबसे प्रभावी चीजों में से एक आप कर सकते हैं, मूल पोस्टर ईमेल करने के लिए है, मदद के लिए पूछ रहा है।

मेरे पास वास्तव में कुछ अवसंरचनात्मक सिफारिशें हैं, क्योंकि इसके बाद यह सब साफ हो जाता है। मूल समस्या वास्तव में बैकअप नहीं है, यह साइट प्रतिकृति की कमी और ऑडिटिंग की कमी है। यदि आप मुझे निजी ईमेल फ़ील्ड की सामग्री पर ईमेल करते हैं, तो बाद में, जब आप अपने पैरों पर वापस आते हैं, तो मैं आपके साथ इस विषय पर चर्चा करना पसंद करूंगा।


6

यदि आपकी छवियों को फ़्लिकर या सीडीएन (जैसा कि आपके पॉडकास्ट में से एक में उल्लेख किया गया है) जैसी बाहरी सेवा पर संग्रहीत किया गया था, तो आपके पास अभी भी छवि संसाधन हो सकते हैं।

कुछ छवियों को Google छवियों पर खोजा जा सकता है और "समान छवियां ढूंढें" पर क्लिक करें , हो सकता है कि अन्य साइटों पर प्रतियां हों।


5

आर्काइव.ऑर्ग कभी-कभी छवियों को छुपाता है। प्रत्येक URL को मैन्युअल रूप से प्राप्त करें (या एक छोटी स्क्रिप्ट लिखें) और उन्हें इस तरह से क्वेरी करें:

string.Format ("GET / * / {0}", nextUri)

बेशक यह काफी दर्द होने वाला है।

मेरे पास मेरे ब्राउज़र कैश में कुछ हो सकता है। अगर मैं करता हूँ तो मैं उन्हें कहीं होस्ट करूँगा।


4

यदि आप उपयोगकर्ताओं के कैश को परिमार्जन करने की कोशिश कर रहे हैं, तो आप 304 Not Modifiedसभी सशर्त-जीईटी ('अगर-संशोधित-चूंकि' या 'यदि-कोई नहीं-मैच') अनुरोधों का जवाब देने के लिए सर्वर सेट करना चाहते हैं, तो कौन से ब्राउज़र का उपयोग करते हैं उनकी कैश्ड सामग्री को अमान्य करें।

यदि छवियों की तरह स्थिर सामग्री पर आपके प्रारंभिक कैशिंग हेडर बहुत उदार थे - चीजों को दिनों या महीनों के लिए कैश करने की अनुमति देता है - तो आप कुछ समय के लिए अमान्य अनुरोध प्राप्त कर सकते हैं। उन अनुरोधों पर एक कुकी सेट करें, और उन उपयोगकर्ताओं से अपील करें कि वे अभी भी अपने पास मौजूद छवियों को निकालने के लिए अपने कैश के खिलाफ एक स्क्रिप्ट चलाएं।

खबरदार, हालांकि: जब आप इनलाइन संसाधनों के साथ कोई पाठ्य सामग्री डालना शुरू करते हैं जो अभी तक मौजूद नहीं हैं, तो आप उन कैश्ड संस्करणों को मिटा सकते हैं, क्योंकि रिवालिडेटर्स ने 404 मारा।


4

आप इस्तेमाल कर सकते हैं TinEye को अपने चित्रों के डुप्लीकेट ढूंढना द्वारा गूगल कैश के साथ थंबनेल खोज । यह केवल उन छवियों के साथ मदद करेगा जो आपने दूसरों की साइट से ली हैं, हालाँकि।


1
नहीं, यह उन छवियों के साथ मदद करेगा जो दूसरों ने CH से ली हैं।
असंतुष्टगीत

@DisgruntledGoat: मैंने पहली बार में ऐसा सोचा भी नहीं था: D

4

स्पष्ट इंगित करने के जोखिम में, छवियों के लिए अपने कंप्यूटर के बैकअप को खनन करने का प्रयास करें । मुझे पता है कि मेरी बैकअप रणनीति इतनी भारी है कि मेरे पास बाहरी ड्राइव्स, जली हुई डिस्क, और ज़िप / टार फ़ाइलों में बहुत सारी फ़ाइलों की कई प्रतियाँ हैं। सौभाग्य!


4

मैं हिम तेंदुए पर अपने सफारी कैश से इन फ़ाइलों को पुनर्प्राप्त करने में कामयाब रहा हूं:

bad-code-offset-back.jpg
bad-code-offset-front.jpg
code-whitespace-invisible.png
code-whitespace-visible.png
coding-horror-official-logo-small.png
coding-horror-text.png
codinghorror-search-logo1.png
crucial-ssd-128gb-ct128m225.jpg
google-microformat-results-forum.png
google-microformat-results-review.png
kraken-cthulhu.jpg
mail.png
powered-by-crystaltech-web-hosting.png
ssd-vs-magnetic-graph.png

अगर कोई और कोशिश करना चाहता है, तो मैंने उन्हें ~ / कोडिंगहोर / फ़ाइल नाम पर निकालने के लिए एक पायथन स्क्रिप्ट लिखी है, जिसे मैंने यहाँ ऑनलाइन डाला है

आशा है कि ये आपकी मदद करेगा।


3

क्या आपको यह देखने का मौका मिला कि, आपके होस्टिंग प्रदाता के पास कोई बैकअप है (कुछ पुराने संस्करण)?


यह अच्छा नहीं लगता है .. उनका बैकअप प्रोग्राम वर्चुअल मशीन हार्ड ड्राइव फ़ाइलों का बैकअप लेने में असमर्थ था, इसलिए बैकअप नहीं हैं।
जेफ एटवुड

2

यह डेटा आपके लिए कितना उपयोगी है? यदि यह एक महत्वपूर्ण राशि (हजारों डॉलर) के बराबर है, तो अपने होस्टिंग प्रदाता से अपनी वेबसाइट के लिए डेटा को संग्रहीत करने के लिए उपयोग किए जाने वाले हार्ड ड्राइव (हार्डवेयर की विफलता के कारण डेटा हानि के मामले में) पर विचार करें। फिर आप ड्राइव को ऑनट्रैक या किसी अन्य डेटा रिकवरी सेवा पर ले जा सकते हैं ताकि आप देख सकें कि आप ड्राइव से क्या प्राप्त कर सकते हैं। यह ड्राइव पर अन्य लोगों के अपरिवर्तित डेटा की संभावना के कारण बातचीत करने के लिए मुश्किल हो सकता है, लेकिन अगर आप वास्तव में इसके बारे में परवाह करते हैं तो आप शायद इसे काम कर सकते हैं।


सर्वर एक VM था जहाँ तक मुझे पता है।
21

1
@ splattne यहां तक ​​कि, एक गैर-शून्य मौका है जिसमें बहुत अधिक डेटा पुनर्प्राप्त किया जा सकता है।

एक अति विशिष्ट सेवा होगी।

2

यह सुनकर मुझे बहुत अफ़सोस हुआ और मैं आपके लिए बहुत नाराज़ हो गया और टाइमिंग - मुझे आपकी कुछ पोस्टों की ऑफलाइन कॉपी चाहिए थी और आपकी पूरी साइट पर HTTrack किया था लेकिन बाहर जाना पड़ा (यह कुछ हफ्ते पहले था) और मैंने उसे रोका।

यदि मेजबान आधा वंशज है - और इस तथ्य से कि मैं अनुमान लगा रहा हूं कि आप एक अच्छे ग्राहक हैं ... मैं उनसे या तो आपको हार्ड ड्राइव भेजने के लिए कहूंगा (जैसा कि मैं अनुमान लगा रहा हूं कि उन्हें RAID का उपयोग करना चाहिए) या स्वयं कुछ पुनर्प्राप्ति करें।

जब तक यह एक तेज़ प्रक्रिया नहीं हो सकती है, मैंने एक क्लाइंट के लिए एक होस्ट के साथ ऐसा किया था और पूरे डेटाबेस को ठीक करने में सक्षम था (... मूल रूप से, होस्ट ने कंट्रोल पैनल के लिए एक अपग्रेड की कोशिश की थी जो वे उपयोग कर रहे थे और इसे गड़बड़ कर दिया था .. लेकिन कुछ भी नहीं लिखा गया था)।

जो भी हो - SO साइटों पर अपने सभी प्रशंसकों से शुभकामनाएँ!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.