क्या URL पथ संवेदनशील होना चाहिए?


11

वर्तमान में मेरी वेबसाइट के URL केस-असंवेदनशील हैं। उदाहरण के लिए, निम्न लिंक दोनों एक ही पृष्ठ दिखाते हैं:

  • http://example.com/about
  • http://example.com/About

हालाँकि, wordpress.org वेबसाइट पर एक नज़र डालने पर, मैंने देखा कि URL केस-सेंसिटिव हैं। उदाहरण के लिए, नीचे दिया गया दूसरा लिंक 404 त्रुटि पृष्ठ है:

  • http://wordpress.org/about
  • http://wordpress.org/About

मेरे विचार मेरी वेबसाइट के URL के मामले को संवेदनशील बनाने के लिए हैं। डुप्लिकेट सामग्री से बचने के स्पष्ट मुद्दे के अलावा, केस-संवेदी URL होने के पक्ष और विपक्ष क्या हैं?

अपडेट करें

Google अपने स्वयं के URL पर केस-संवेदी URL नीति संचालित करता है। उदाहरण के लिए, नीचे दिया गया दूसरा लिंक 404 है:

  • http://google.com/doodles
  • http://google.com/Doodles

अपडेट २

आपके उत्तर के लिए धन्यवाद। मैंने स्वीकार किए गए उत्तर में वर्णित सलाह लेने और जहां आवश्यक हो, 301 रीडायरेक्ट को लागू करने का निर्णय लिया। जब से मैं वर्डप्रेस के साथ काम कर रहा हूं, मेरा कोड समाधान इस प्रकार है (यदि कोई दिलचस्पी रखता है):

function force_lowercase_urls() {

    if ( is_admin() )
        return;

    if ( preg_match( '/[A-Z]/', $_SERVER['REQUEST_URI'] ) ) {

        wp_redirect( strtolower( $_SERVER['REQUEST_URI'] ), 301 );
        exit();
    }

}
add_action( 'init', 'force_lowercase_urls' );

1
But wouldn't that result in duplicate content? – henrywrightआपको डुप्लिकेट लिंक के बारे में चिंता करने की आवश्यकता नहीं है अगर आपकी साइट कैनोनिकल लिंक का सही उपयोग करती है और आपके पास 1 पेज तक एक मिलियन तरीके से पहुंच सकते हैं और डुप्लिकेट सामग्री के लिए कभी भी प्रभावित नहीं हो सकते हैं।
साइमन हैटर

@ यदि आप एक पृष्ठ लाखों तरीकों से एक्सेस करते हैं, तो Googlebot आपकी साइट को अच्छी तरह से क्रॉल नहीं कर पाएगा। एक पृष्ठ के बाद पहुँचा एक मुट्ठी तरीके से चोट की संभावना नहीं है।
स्टीफन Ostermiller

जवाबों:


6

वेब सामग्री की सेवा के लिए दो सबसे व्यापक रूप से उपयोग किए जाने वाले ऑपरेटिंग सिस्टम फ़ाइल सिस्टम में डिफ़ॉल्ट रूप से URL की संवेदनशीलता के लिए बहुत अलग सेटिंग्स हैं। आपके URL केस संवेदी हैं या नहीं, इस बात की संभावना है कि आप इसका उपयोग कर रहे हैं:

  • Microsoft IIS विंडोज पर चल रहा है - असंवेदनशील यूआरएल - कैपिटलाइज़ेशन की परवाह किए बिना एक ही सामग्री दिखाता है।
  • लिनक्स पर चल रहे अपाचे HTTPD सर्वर - संवेदनशील संवेदनशील URL - गलत कैपिटलाइज़ेशन के लिए 404 त्रुटि नहीं मिली।

मेरी राय में, न तो डिफ़ॉल्ट आदर्श है:

  • पूंजीकरण की परवाह किए बिना एक ही सामग्री दिखाना आपके वेब साइट को कठिन बनाता है। खोज इंजन, एकाधिक URL पर समान सामग्री को डुप्लिकेट सामग्री मानते हैं।
  • गलत पूंजीकरण के लिए त्रुटि पृष्ठ दिखाना उपयोगकर्ता के अनुकूल नहीं है। उपयोगकर्ता आमतौर पर कैपिटलाइज़ेशन के बारे में नहीं सोचते हैं जब वे टाइप करते हैं।

आदर्श समाधान केवल पृष्ठ को दिखाना होगा जब URL सही ढंग से कैपिटल में हो। गलत पूंजीकरण के लिए, उपयोगकर्ता को पसंदीदा पूंजीकरण के लिए 301 पुनर्निर्देशित किया जाना चाहिए। कुछ तरीके हैं जिनसे इसे पूरा किया जा सकता है:


1
मुझे लगता है कि यह डॉस और विंडोज की एक विरूपण साक्ष्य है जो पिछले संवेदनशीलता के मामले में यूनिक्स वातावरण में है।
सूर्य

1
क्या Apache उन अनुरोधों के लिए केस-संवेदी है, जो फाइलसिस्टम के लिए मैप अंतर्निहित फाइलसिस्टम पर निर्भर है, अपाचे ही नहीं। यदि विंडोज पर अपाचे चल रहा है तो अनुरोध /iNdEx.HtMlया /InDeX.hTmlदोनों वापस आ जाएगा /index.html(यह प्रदान /index.htmlकरना फ़ाइल सिस्टम पर एक भौतिक फ़ाइल है)।
MrWhite

1
वास्तव में, यह IIS के लिए समान प्रतीत होगा ।
MrWhite

1
खैर, IIS हमेशा विंडोज (AFAIK) पर चलता है, इसलिए फाइलसिस्टम अनुरोध हमेशा केस-असंवेदनशील होगा। हालांकि, कई साइटें किसी प्रकार के फ्रंट कंट्रोलर के माध्यम से URL को फिर से लिख देंगी - इस मामले में अनुरोध शायद फाइलसिस्टम पर एक भौतिक फ़ाइल के लिए मैप नहीं करता है और इसलिए URL संभवतः केस-संवेदी है (जब तक कि ऐप विशेष रूप से इसे केस नहीं करता है -insensitive) - जो मूल रूप से Apache (विंडोज पर चलने पर) के समान है। (?)
MrWhite

2
मैं वास्तव में हाल ही में व्यस्त / " क्यों URLs केस-सेंसिटिव हैं? " पर शोध करते हुए यहां से गुज़रा । ऐसा लगता है कि "आईआईएस केस-असंवेदनशील" (कई बार उस दूसरे सूत्र में उल्लेखित) जैसे वाक्यांश इतने व्यापक हैं कि आम धारणा यह है कि IIS पर URL हमेशा केस-असंवेदनशील होते हैं - कम से कम मुझे यह आभास हो रहा है कि - मैं ऐसा प्रतीत नहीं होता है।
MrWhite

4

यहां एक संग्रहीत लाइव चैट सत्र से Google की स्थिति है (लिंक अब मृत है):

* क्या URL के असंगत कैपिटलाइज़ेशन से डुप्लिकेट सामग्री समस्याएँ और पेज रैंक कमजोर पड़ने का कारण बनता है? उदाहरण के लिए www.site.com/abc बनाम www.site.com/Abc। विंडोज होस्ट पर, ये एक ही पेज हैं, लेकिन यूनिक्स होस्ट पर अलग-अलग पेज हैं।

जॉनमु: हाय जॉन, मौजूदा मानकों के आधार पर, URL केस-संवेदी होते हैं, इसलिए हाँ, इन्हें अलग URL के रूप में देखा जाएगा। चूंकि URL पर सामग्री समान है, इसलिए हम आम तौर पर इसे पहचानेंगे और उनमें से केवल एक को ही रखेंगे। हालाँकि, हम अनुशंसा करेंगे कि आप सभी लिंक URL के एक संस्करण में रखने का प्रयास करें। ध्यान रखें कि यह robots.txt फ़ाइलों पर भी लागू होता है। *

IE टीम एक फ़ाइल आवरण सम्मेलन को चुनने और इसे सख्ती से पालन करने की सलाह देती है क्योंकि यह प्रदर्शन में सुधार कर सकता है।


-2

RFC 3986 6.2.2.1 URI को केस-असंवेदनशील के रूप में परिभाषित करता है, इसलिए उन्हें wordpress.org की तरह केस-सेंसिटिव बनाना अच्छा नहीं है।


लेकिन इसका परिणाम डुप्लिकेट सामग्री में नहीं होगा?

वास्तव में नहीं, क्योंकि खोज इंजन को केस-असंवेदनशील भी काम करना चाहिए।

मुझे लगता है कि अब सवाल यह है कि यह कैसे पता लगाया जाए कि क्या खोज इंजन ऊपरी और निचले-आवरण वाले URL को समकक्ष के रूप में देखते हैं? उदाहरण के लिए Google को लें: google.com/Doodles और google.com/doodles

10
वह RFC केवल URL के तीन भागों के मामले को संबोधित करता है। 1 - प्रोटोकॉल ( http://) - असंवेदनशील, कम मामले के लिए सामान्य। 2 - होस्ट नाम ( example.com) - असंवेदनशील, कम मामले के लिए सामान्य। 3. प्रतिशत एन्कोडेड वर्ण ( %3F) - केस असंवेदनशील, ऊपरी मामले के लिए सामान्य। यूआरएल के बाकी आम तौर पर है केस संवेदी
स्टीफन Ostermiller
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.