मेरे पास हाल ही में एक हैक था जिसने मेरी साइट पर कई हजार फर्जी पेज जोड़े थे।
मैंने Google खोज कंसोल (जिसे पहले वेबमास्टर टूल कहा जाता था) में एक सही साइटमैप प्रस्तुत किया और सभी लिंक को 410 में बदल दिया, लेकिन Google अभी भी उनमें से अधिकांश अनुक्रमित था।
मैंने वेबमास्टर टूल्स - बल्क यूआरएल को हटाने के लिए स्वचालित रूप से यूआरएल जमा करने के लिए क्रोम एक्सटेंशन को हटा दिया। यह मूल रूप से एक स्क्रिप्ट है जो URLs की एक सूची लेती है, फिर उन्हें आपके लिए सबमिट करती है, एक बार में। उन सभी को प्रस्तुत करने में घंटों लगेंगे, लेकिन कम से कम आपको इसे स्वयं नहीं करना होगा। यहां इसका उपयोग कैसे करें पर एक लेख है ।
आप उन URL की एक सूची प्राप्त कर सकते हैं जो Google खोज कंसोल से सीधे डेटा डाउनलोड करके अनुक्रमित कर रहे हैं। स्थिति> इंडेक्स कवरेज पर जाएं और मान्य परिणाम चुनें और फिर नीचे स्क्रॉल करें। आप देखेंगे कि Google ने उन URL का एक टन अनुक्रमित किया है जो आपके साइटमैप में नहीं हैं। आप पहले 1000 परिणाम डाउनलोड कर सकते हैं। जाहिरा तौर पर उन सभी को पाने के लिए एक गोल चक्कर रास्ता है, न केवल पहले हजार, लेकिन इसमें एक्सेल से एपीआई कॉल शामिल हैं। मैंने प्रत्येक हजार के बीच कुछ दिनों का इंतजार किया, क्योंकि वे धीरे-धीरे सूचकांक से बाहर हो गए।
एक अन्य मार्ग के लिए एक WP प्लगइन एक साइटमैप बनाना है, फिर पीडीएफ या जो भी आप लक्षित कर रहे हैं उसे फ़िल्टर करें। आपको शायद यहाँ मैनुअल कॉपी / पेस्ट / डिलीट का थोड़ा सा काम करना होगा। बस सुरक्षित होने के लिए, मैंने धीरे-धीरे अपनी लगभग 2,700 स्पैम URL की सूची को स्क्रॉल किया और वैध URL हटा दिए। इसमें केवल 20 मिनट लगे।
यदि आप स्पैम की तरह स्थायी रूप से कुछ करने की कोशिश नहीं कर रहे हैं, और इसके बजाय प्रीमियम संसाधनों को बाधित करने की कोशिश कर रहे हैं, तो आपको उन तरीकों का उपयोग करने से रोकने के लिए अन्य तरीकों का उपयोग करना चाहिए, जैसे कि रोबोट फ़ाइल। लेकिन अगर यह पता चलता है कि Google ने नहीं सुना या आपने गेंद को गिरा दिया, तो कम से कम अब आप समस्या को ठीक कर सकते हैं और कुछ ही दिनों में उन्हें सूचकांक से हटा सकते हैं।
मेरी विशेष परिस्थिति में, मैं सोच रहा हूँ कि Google के पास टाइम मशीन बटन, या पूर्ववत या रीसेट क्यों नहीं है। विचार यह है कि मैं बता सकता हूं कि कुछ दिन पहले साइट हैक हो गई थी, लेकिन हमने इसकी मरम्मत की है, इसलिए क्रॉलिंग और इंडेक्सिंग के अंतिम दिनों की संख्या को पूर्ववत करें। लेकिन यह बहुत आसान होगा।