जूमला में डुप्लिकेटेड कंटेंट / यूआरएल से कैसे निपटें?


11

मुझे अभी एक प्रमुख एसईओ मुद्दा मिला और जब तक मैं इसे हल कर चुका हूं; मैं यह पता लगाने की कोशिश कर रहा हूं कि यह पहले स्थान पर क्यों हुआ होगा और अगर गलती थी या यह जुमला के साथ ही कुछ करना है। पहला मुद्दा:

जब मैंने मोज़ेज़ के साथ एक साइट क्रॉल की, तो उसने मुखपृष्ठ के लिए चार डुप्लिकेट सामग्री दिखाईं जो अप्रत्याशित थी। उदाहरण के लिए होमपेज http://www.foo.com के लिए यह निम्नलिखित की तरह डुप्लिकेट सामग्री URL दिखा रहा था:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

और ये सभी लिंक केवल मुखपृष्ठ सामग्री लोड कर रहे थे फिर भी मेटा विवरण लेख से थे। यह स्पष्ट रूप से इंगित करता है कि जूमला लिंक बनाने वाला ऑटो था और मुझे 4 लिंक के लिए समान पाया गया। लेख का लिंक इस प्रकार था:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Itemid = 1होमपेज पर मेनू आइटम जो बताता है कि क्यों होमपेज पर लोड हो रहा है था से मेल खाती है। मैंने इस मुद्दे को फिर से बनाने की कोशिश की लेकिन नहीं कर सका। सामग्री को जोड़ने वाले लोगों के अनुसार, यहां उन लेखों और लिंक को बनाते समय किए गए कदम हैं:

  1. लेख बनाएँ
  2. सामग्री संपादक में 'अनुच्छेद' टैब का उपयोग करके अन्य लेखों के लिए लिंक जोड़ें।
  3. लेख के लिए मेनू आइटम बनाएँ

तो मैं सोच रहा था कि क्या यहाँ कुछ स्पष्ट रूप से गलत है। मैं भ्रमित हूं क्योंकि 100 से अधिक लेख हैं फिर भी यह केवल लगभग 5 लेखों में हुआ है। धन्यवाद।

जवाबों:


15

इस उत्तर का TOC:

  1. एक ही आइटम आईडी के तहत सामग्री
  2. डुप्लिकेट सामग्री कैसे बनाई जाती है / डायनामिक पेज / URL
  3. एसईओ परिप्रेक्ष्य
  4. जूमला में डुप्लिकेट सामग्री से निपटना
  5. संदर्भ और लिंक

1. क्यों लेख एक ही आइटम के तहत प्रदर्शित किए जा रहे हैं

सबसे पहले, यह समस्या नहीं है कि आपको डुप्लिकेट यूआरएल क्यों मिल रहे हैं। लेख होम-पेज के आइटम आईडी का उपयोग कर रहे हैं, क्योंकि उनके लिए कोई अन्य आइटम आईडी निर्दिष्ट नहीं है।

इसके बारे में और पढ़ें:

और यह भी व्यावहारिक हो सकता है:



2. "डुप्लिकेट कंटेंट" कैसे बनाया जाता है / डायनामिक पेज / यूआरएल

यह वास्तव में डायनामिक वेबसाइटों के लिए एक मानक व्यवहार है जो फ़ील्ड-वैल्यू जोड़े के रूप में क्वेरी स्ट्रिंग्स के निर्माण के लिए URL मापदंडों का उपयोग करके अपने पेज उत्पन्न करता है । सर्वर / एप्लिकेशन को क्वेरी प्राप्त होगी, इसे संसाधित करें और ब्राउज़र को साहचर्य सामग्री लौटाएं।

इसे बेहतर ढंग से समझने के लिए, आप जूमला वेबसाइट में SEF Urls को निष्क्रिय कर सकते हैं और एक पृष्ठ के गैर-SEF Url का थोड़ा अध्ययन कर सकते हैं:

उदाहरण:

index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & CatID = 9 & Itemid = 101

उपरोक्त क्वेरी को फ़ील्ड-मूल्य जोड़े में विभाजित करते हुए हम देखते हैं:

  • विकल्प = com_content
  • दृश्य = लेख
  • आईडी = ३
  • catid = 9
  • आइटमिड = 101

ये क्षेत्र-मूल्य हैं जिन्हें जूमला समझता है और निम्न सामग्री को वापस करने की कोशिश करेगा:

यह com_content घटक में क्वेरी करेगा और id 101 के साथ मेनू आइटम का उपयोग करके, श्रेणी id 9 के id 3 के साथ सामग्री आइटम (लेख) को प्रदर्शित करने के लिए एक लेख दृश्य का उपयोग करेगा।


1 पृष्ठ के लिए कई URL रूपांतर

हालाँकि एक ही लेख को और भी अधिक क्षेत्र-मूल्यों के संयोजन के साथ प्रदर्शित किया जा सकता है:

कुछ संभावित संयोजन हो सकते हैं:

  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & CatID = 9
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & Itemid = 101
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & Itemid = 102
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & Itemid = 103
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & lang = hi
  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & CatID = 9 & Itemid = 101 & lang = hi

  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & CatID = 9 & Itemid = 101 & lang = hi & प्रिंट = 1

  • index.php? विकल्प = com_content और दृश्य = लेख और आईडी = 3 & CatID = 9 & Itemid = 101 & lang = hi & Tmpl = घटक

जैसा कि आप देख सकते हैं, उपरोक्त सभी सिस्टम से एक ही डेटा का अनुरोध कर रहे हैं, जो कि आईडी = 3 के साथ लेख है। ये इस तथ्य की ओर जाता है कि एक ही सामग्री / पृष्ठ को विभिन्न विभिन्न यूआरएल के माध्यम से और कुछ मामलों में एक्सेस किया जा सकता है विभिन्न लेआउट में प्रदर्शित।

* जूमला में एसईएफ यूआरएल सक्षम होने के साथ , उपरोक्त संभावित रूप से एक ही लेख / सामग्री के लिए 1 से अधिक यूआरएल यूआरएल का अनुवाद हो सकता है।



3. एसईओ परिप्रेक्ष्य

आधुनिक खोज इंजन और Google विशेष रूप से, इस व्यवहार के बारे में जानते हैं। आमतौर पर वे अपने खोज परिणामों को एक पृष्ठ के लिए सबसे उपयुक्त URL को अनुक्रमित करने और रखने के लिए अपनी पूरी कोशिश करेंगे। इसके अलावा, Google ने खुलासा किया है कि इसके कारण डुप्लिकेट सामग्री के लिए कोई वास्तविक " जुर्माना " नहीं है ।

हालांकि, इस मामले में मुख्य मुद्दा यह है कि एक ही सामग्री / पृष्ठ को एक से अधिक बार अनुक्रमित किया गया है, यह है कि आप संभवतः पेज रैंकिंग और सबसे अच्छा संभव एसईओ प्रदर्शन खो रहे हैं , क्योंकि पेज रैंकिंग 1 के बजाय 1 से अधिक पृष्ठ में विभाजित हो जाएगी ।

इसे ध्यान में रखते हुए, इससे निपटना बुद्धिमानी है, बजाय इसके कि खोज इंजन अनुक्रमणिक url को यह बताने का प्रयास करने दें कि क्या अलग-अलग url समान या अलग-अलग सामग्री दिखाते हैं।
इसके अलावा, अपने यूआरएल को नियंत्रित करना और एसई को क्या सूचकांक करना चाहिए, इससे आपको बेहतर उपयोगकर्ता अनुभव प्राप्त करने में मदद मिल सकती है, क्योंकि साइट उपयोगकर्ताओं को केवल 1 मानक यूआरएल के तहत एक ही पृष्ठ मिलेगा, और यह एक वेबसाइट और इसके प्रबंधन के लिए एक अधिक ठोस संरचना का उत्पादन कर सकता है। ।



4. डुप्लिकेट सामग्री से कैसे निपटें

  • अपने पन्नों के लिए Canonical URL का उपयोग करना।
    Canonical Urls उस खोज इंजन को निर्देश देगा जिसके बारे में माना जाता है कि वह एक पृष्ठ का सही url है जिसे उन्हें क्रॉल करना चाहिए और अपने सूचकांक में रखना चाहिए।

  • INDEX / NOINDEX, FOLLOW / NOFOLLOW मेटाडेटा का उपयोग करना। अपने पृष्ठों में ऐसे मेटाडेटा का उपयोग करते हुए, खोज इंजन को निर्देश देगा कि यदि आप उन्हें किसी पृष्ठ की सामग्री को अनुक्रमणित करना चाहते हैं या नहीं और उस पर पाए गए लिंक का पालन करना या नहीं करना चाहते हैं।

  • 301 पुनर्निर्देश / htaccess का उपयोग करना।
    आप मुख्य रूप से इच्छित सभी अन्य URL को पुनर्निर्देशित कर सकते हैं। इसे SEF एक्सटेंशन्स या htaccess से हासिल किया जा सकता है । दोनों महान शक्ति प्रदान करते हैं, हालांकि htaccess में सभी प्रकार के पुनर्निर्देशनों के लिए नियमित अभिव्यक्ति का उपयोग करने की क्षमता पर विचार करने या mod_rewrite का उपयोग करके फिर से लिखने की क्षमता है। जे एक्सटेंशन्स के बारे में, जब जरूरत पड़ती है, मैं आमतौर पर sh404SEF का उपयोग करता हूं ।

    अपडेट: जैसा कि @Neil रॉबर्टसन ने टिप्पणियों में उल्लेख किया है: एक महत्वपूर्ण पुनर्निर्देशन वेबसाइट के गैर-www संस्करण से वेबसाइट के www संस्करण या इसके विपरीत है। गैर-www के लिए .htaccess फ़ाइल को www पुनर्निर्देशन में जोड़ें।

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Google वेबमास्टर टूल का उपयोग करना Google वेबमास्टर टूल के
    पास यह समायोजित करने के विकल्प हैं कि क्रॉलर को आपके URL मापदंडों के साथ कैसा व्यवहार करना चाहिए ।

  • साइटमैप
    सबमिट का उपयोग करके खोज को आपकी साइट की URL संरचना से जोड़ा जाता है।

  • Robots.txt फ़ाइल का उपयोग करके
    Google और अन्य प्रमुख SE आपके Robots.txt का सम्मान कर रहे हैं। आप उन्हें विशिष्ट निर्देशिकाओं / url पथों को क्रॉल नहीं करने का निर्देश दे सकते हैं।

वांछित परिणाम उत्पन्न करने के लिए उपरोक्त सभी विकल्पों को जोड़ा जा सकता है।

* हर जगह की तरह, इसलिए जूमला में, अच्छी योजना और सामग्री संगठन हमेशा बेहतर परिणाम तक पहुंचने में मदद करते हैं। विशेष रूप से जूमला के साथ, इसमें एक स्वच्छ सामग्री वर्गीकरण और मेनू आइटम संरचना भी शामिल है।



5. संदर्भ और लिंक

जूमला एसईओ एक्सटेंशन

आमतौर पर जूमला में यदि आप इसे कुशलता से निपटना चाहते हैं तो आप एक 3-पक्ष एसईओ-एसईएफ एक्सटेंशन स्थापित करना चाहेंगे।



अधिक पढ़ने:


1
इस मंच पर सबसे अच्छा जवाब में से एक :) बहुत मददगार। धन्यवाद @ फ्रीविन
जूमलर

1
यह एक उत्कृष्ट उत्तर है। :) पूर्णता के लिए, वेबसाइट के गैर-www संस्करण को वेबसाइट के www संस्करण पर पुनर्निर्देशित करने या इसके विपरीत में कुछ जानकारी जोड़ना अच्छा हो सकता है। यह अक्सर के बारे में भूल जाता है, लेकिन शायद सभी वेबसाइटों (न केवल जुमला) पर डुप्लिकेट सामग्री का मुख्य कारण है।
नील रॉबर्टसन

ऐसा लग रहा है कि नया राउटर आखिरकार जूमला 3.8 में दिन की रोशनी को देखेगा और इससे तीसरे तीसरे विस्तार की आवश्यकता के बिना यूआरएल को सरल बनाने में मदद मिलेगी।
नील रॉबर्टसन

1
@NeilRobertson: मुझे अभी भी लगता है कि जूमला पर SEF URL / डुप्लिकेट के प्रबंधन के लिए एक पूर्ण और कुशल समाधान के लिए इस पर अभी और सुधार की आवश्यकता है।
FFrewin

@ FFFrewin मैं सहमत हूँ। ऐसा लगता है कि नए राउटर का लाभ उठाने के लिए कुछ थर्ड पार्टी एक्सटेंशन को भी अपडेट करना पड़ सकता है।
नील रॉबर्टसन

0

यदि मेरे पास एक ही सामग्री में कई मेनू आइटम हैं, तो मैं मेनू प्रबंधक में स्थित सिस्टम लिंक / मेनू आइटम उपनाम का उपयोग करता हूं। यहाँ इसके बारे में एक पुराना लेख है; लेकिन विधि आज भी मौजूद है: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alas

@ नहीं, मैं डुप्लिकेट के रूप में पढ़ा जा रहा गैर-www बनाम www सामग्री के बारे में 100% सहमत हूं। यहां वह कोड है जो www को गैर-www होने के लिए मजबूर करता है। इसे अपनी htaccess फ़ाइल में रखें। साथ ही, यह https सुरक्षा प्रोटोकॉल भी जोड़ता है। यह कोड एकमात्र तरीका नहीं है, लेकिन यह वही है जो मैं कई साइटों पर सफलतापूर्वक उपयोग करता हूं।

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.