सिंडिकेशन के साथ rel = canonical का उपयोग करना


21

मैं एक साइट पर काम करता हूं जो सामग्री के सिंडिकेशन (एपीआई और डेटा डंप के माध्यम से) की अनुमति देता है। हम पा रहे हैं कि हमारी खोज को पुनः प्रकाशित करने वाली कई साइटें Google खोज परिणामों में उच्च प्रदर्शित हो रही हैं, भले ही हम मूल प्रकाशक हों। यह निराश करने वाला है।

हम rel=canonical अपनी अटेंशन आवश्यकताओं का हिस्सा बनाने पर विचार कर रहे हैं । Google का कहना है कि इसे पूरे डोमेन और सिंडिकेशन परिदृश्यों में उपयोग करना वैध है।

क्या आपने ऐसा किया है, और क्या Google खोज रैंकिंग में विहित URL पर विचार करता है? क्या यह ऐसे SERP "स्पैम" को कम करने में हमारी मदद करेगा?


1
आप जो वर्णन कर रहे हैं वह स्पैम नहीं है। यह लोग वही कर रहे हैं जो आप उन्हें करने के लिए कह रहे हैं - अपनी सामग्री का सिंडिकेटिंग। स्पैम अनचाही ई-मेल विज्ञापन और वेबपेज हैं जो केवल मूल्य का कुछ भी बनाने के बजाय विज्ञापनों वाले लोगों पर बमबारी करने के उद्देश्य से बनाए गए हैं। यदि वे साइटें आपकी सामग्री को सिंडिकेट करने के प्रकार हैं, तो आपको अपने सिंडिकेशन मॉडल पर पुनर्विचार करने की आवश्यकता है, या जो आपकी साइट पर खराब दिखाई देगा (बस एसोसिएशन के माध्यम से)। लेकिन बस आप की तुलना में बेहतर खोज रैंकिंग होने से साइट स्पैम नहीं होती है।
लेजे मेजेस्टे

@ सचमुच? इन साइटों "बहुत कम या मूल सामग्री" नियम खुद गूगल द्वारा स्थापित के प्रत्यक्ष उल्लंघन होने लगते हैं google.com/support/webmasters/bin/answer.py?answer=66361
जेफ Atwood

@ जेफ़: आप किन साइटों का विशेष रूप से जिक्र कर रहे हैं? मैं स्वयं वेब सिंडिकेशन का उपयोग करने के अधिनियम के बारे में बात कर रहा हूं, जो कि कुछ वैध साइटें हैं। एक स्पैम साइट को सिंडिकेटेड सामग्री का उपयोग नहीं करना पड़ता है, और बस सिंडिकेटेड सामग्री का उपयोग करने से साइट को स्पैम साइट नहीं बनाया जाता है (भले ही वे आपसे बेहतर रैंकिंग प्राप्त करें)। बिंदु में मामला, कई प्रमुख समाचार प्रकाशन एपी से सिंडिकेटेड सामग्री का उपयोग अपनी सामग्री के पूरक के लिए करते हैं। क्या यह डुप्लिकेट सामग्री है? हाँ। लेकिन क्या यह स्पैम है? नहीं और मुझे नहीं लगता कि एपी या तो स्पैमिंग को बढ़ावा दे रहा है।
लेस मेजेस्टे

@ यहाँ महत्वपूर्ण शब्द अपनी सामग्री के पूरक हैं । यदि सभी सामग्री की प्रतिलिपि बनाई गई है, तो मूल्य या ब्याज का क्या बनाया जा रहा है, बिल्कुल?
जेफ एटवुड

1
@ जेफ: यह मैट के सवाल से स्पष्ट नहीं है कि वे जिन साइटों का जिक्र कर रहे हैं। उन्होंने बस इतना कहा कि उनकी सामग्री (जो एक सिंडिकेशन एपीआई प्रदान करने का उद्देश्य है) को पुनः प्रकाशित करने वाली साइटें हैं जो मूल सामग्री से अधिक रैंकिंग हैं। मेरे लिए, इसका मतलब यह नहीं है कि ये (आवश्यक) स्पैम साइट्स हैं। लेकिन शायद सवाल की मेरी व्याख्या गलत है।
लेजे मेजेस्टे

जवाबों:


10

जेफ ने जो कुछ कहा उसमें 100% सही है।

उपयोग करने के लिए एक सिंडिकेशन साइट का अनुरोध करने के साथ एक और मुद्दा <link rel="canonical" href="http://example.com/foo">यह है कि यह Google को बताता है कि सिंडिकेशन पेज को कोई पेज रैंक नहीं http://example.com/fooमिलनी चाहिए और इसके बजाय सभी को प्राप्त करना चाहिए।

यह दो प्रमुख मुद्दों को बनाता है।

  1. सिंडिकेशन पेज Google खोजों पर बिल्कुल भी दिखाई नहीं देगा क्योंकि इसकी कोई पेज रैंक नहीं है। सिंडिकेशन साइट इस बारे में सबसे कम खुश नहीं होगी। यह संभावना नहीं है कि वे बदलाव करने के लिए तैयार होंगे अगर वे भी कर सकते हैं।
  2. यह आपकी साइट को आपके द्वारा पसंद किए जाने के तरीके को प्रभावित नहीं कर सकता है क्योंकि आप प्रभावी रूप से सिंडिकेशन साइट से लिंक नहीं कर रहे हैं। मुझे आश्चर्य होगा कि Google इसे कैसे हैंडल करेगा। यह सच है कि वे क्रॉस साइट rel = "canonical" के लिए अनुमति देते हैं, लेकिन मेरा मानना ​​है कि इसका उद्देश्य साइट माइग्रेशन के लिए है और एक ही सामग्री के साथ एक होस्ट के तहत एक से अधिक साइटों के लिए एक समान / समान पृष्ठों का एक गुच्छा बनाम एक डिक्टैक्टो पृष्ठ है।

वे कुछ अच्छे बिंदु हैं। मुझे लगता है कि सिंडिकेशन एक ऐसा क्षेत्र है जहां डुप्लिकेट सामग्री होने का एक वैध कारण है। इस मामले में, डुप्लिकेट सामग्री को अकेले छोड़ना और यह स्वीकार करना बेहतर है कि सिंडिकेशन क्या है। बेशक, आदर्श रूप से Google को सिंडिकेशन भागीदारों के पृष्ठों के बजाय मूल पृष्ठ को वरीयता देनी चाहिए। शायद एक नए टैग को बनाने की आवश्यकता है जो rel="canonical"HTML5 <cite>टैग के बीच कुछ है । इस तरह से खोज इंजन यह जान सकते हैं कि कौन सा पेज वैध डुप्लिकेट सामग्री के लिए मूल है।
लेज़े मेजेस्टे

पुष्टि की, नीचे मैट कट्स से मेरी प्रतिक्रिया देखें।
जेफ एटवुड

14

मेरे शोध ने संकेत दिया कि एक लिंक वापस की आवश्यकता है - और यह लिंक शून्य नहीं है - अब तक सबसे महत्वपूर्ण मानदंड था।

यदि "सिंडिकेटिंग" साइट मूल के साथ लिंक के साथ सामग्री को वापस नहीं लेती है जो कि खोज इंजनों का पालन करने के लिए मान्य है, तो खोज इंजन में बहुत कठिन समय ट्रेसिंग होता है जहां सामग्री उत्पन्न हुई थी, और इसे लागू करना होगा जटिल "डुप्लिकेट पाठ सामग्री ढूंढें। पूरे इंटरनेट पर "उत्तराधिकार।

मुझे यकीन नहीं है कि इससे अधिक कोई भी आवश्यक है।

संबंधित मैट कट्स वीडियो

http://www.youtube.com/watch?v=x8XdFb6LGtM

मैट ने कहा कि यह उस पृष्ठ पर वापस लौटने के लिए rel = "canonical" का उपयोग करने के लिए एक अच्छा विचार होगा जहां लेख की उत्पत्ति हुई है - जैसे कि उन्होंने अक्सर सुझाव दिया है कि सिंडिकेटेड लेखों में पारंपरिक लिंक (यानी एक <a>noror टैग) शामिल हैं जो वापस इंगित करते हैं। मूल लेख।

ध्यान रखें कि विहित केवल rel="canonical"एक <a>टैग पर थप्पड़ नहीं है ; यह इस तरह है:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...

तो इसके लिए एक अलग तरह के काम की आवश्यकता होती है, आपको प्रत्येक पृष्ठ हेडर को संशोधित करना होगा। मुझे यकीन नहीं है कि इनमें से कई "सिंडिकेटर्स" के पास स्रोत के नियंत्रण का एक साधारण लिंक ( sans nofollow!) स्तर होगा ।


मैं इस विषय पर जेफ के ब्लॉग प्रविष्टि को पढ़ने का सुझाव भी दूंगा
स्कॉट मिशेल

@ ध्यान दें कि हमें मूल रूप से एक लिंक की आवश्यकता नहीं थी , लेकिन हमने इसे बदल दिया क्योंकि Google का मकड़ी सामान गायब था जो हमारे डेटा में था, जिसमें से कुछ स्क्रेपर्स का उपयोग करते हैं ... और एक गायब लिंक जो nofollowed है, उसे वापस लाने में मदद नहीं करता है Google के सूचकांक में!
जेफ एटवुड

@ जेफ़: एक मामूली स्पर्शरेखा पर, एक चीज़ जिसने मुझे गुदगुदाया है वह यह है कि स्टैकवॉयरफ़्लो उत्तर के लिंक में rel = "nofollow" है। क्या एक निश्चित प्रतिनिधि वाले उपयोगकर्ताओं को उनके द्वारा पोस्ट किए गए लिंक पर कोई rel = "nofollow" का लाभ नहीं मिलना चाहिए?
स्कॉट मिशेल

@ अपनी प्रोफ़ाइल में वेबसाइट फ़ील्ड को देखें, किसी भी स्टैक एक्सचेंज वेबसाइट पर शिष्टाचार के रूप में 2k प्रतिनिधि पर हटाए गए nofollow हैं।
जेफ एटवुड

1
@ जेफ, मैं एक Stackoverflow जवाब में लिंक के बारे में बात कर रहा हूँ। उदाहरण के लिए, यदि मैं इस पृष्ठ पर एक दृश्य / स्रोत करता हूं तो मुझे आपके उत्तर में लिंक दिखाई देते हैं (जैसे कि YouTube के लिए) में rel = "nofollow" है। मुझे लगता है कि यह शुक्राणुओं को खत्म करने के लिए है, लेकिन साथ ही ऐसा लगता है जैसे आप दूसरों के लिए खोज परिणामों की प्रासंगिकता में सुधार करने का अवसर याद कर रहे हैं, न कि उस व्यक्ति को "क्रेडिट देने" (Google की नजर में) जिसका उल्लेख उसने लिखा है लेख / ब्लॉग प्रविष्टि / आदि से जोड़ा जा रहा है।
स्कॉट मिशेल

2

एक और उत्तर जोड़ना क्योंकि मुझे इस पर मैट कट्स से एक निश्चित प्रतिक्रिया मिली :

rel=canonicalडोमेन पर काम करता है, लेकिन यह मूल रूप से 301 [रीडायरेक्ट] की तरह काम करता है , इसलिए लक्ष्य साइट के पृष्ठ सीधे Google में आपकी साइट पर जाएंगे। आपकी सामग्री का उपयोग करने वाली कोई भी साइट मूल रूप से खोज इंजन से मिटा दी जाएगी।

जैसा मैट कहते हैं सबसे अच्छा तरीका है के बारे में सोचना rel=canonicalएक के रूप में है 301 स्थाई रीडायरेक्ट

इस प्रकार, rel=canonicalएट्रिब्यूशन शर्तों के एक सेट के रूप में क्रॉस-डोमेन की आवश्यकता होती है, जो आपको 301 रीडायरेक्ट करने के लिए कहेंगे! आउच। : पी

यह जानते हुए, यह स्पष्ट है कि rel=canonicalकेवल उन साइटों पर उपयोग के लिए है जिनका आप व्यक्तिगत रूप से नियंत्रण रखते हैं - जैसे जब आप डोमेन स्थानांतरित करते हैं और दूसरे को बदलने के लिए आपको एक डोमेन की सामग्री की आवश्यकता होती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.