सीधे शब्दों में कहें क्योंकि आपकी श्रेणीबद्ध विशेषता (यहां स्थान) का एक स्तर प्रतिगमन के लिए डमी एन्कोडिंग के दौरान संदर्भ समूह बन जाता है और बेमानी है। मैं यहाँ प्रपत्र उद्धृत कर रहा हूँ "K श्रेणियों का एक वैरिएबल चर, या स्तर, आमतौर पर K-1 डमी चर के अनुक्रम के रूप में एक प्रतिगमन में प्रवेश करता है। यह स्तर पर एक रेखीय परिकल्पना के बराबर है।"
यह पहले से ही इस पर चर्चा की है बहुत अच्छा आँकड़े । स्टैकएक्सचेंज उत्तर ।
मुझे बताया गया था कि कैंडेरा में यांडेक्स द्वारा एक उन्नत पाठ्यक्रम है जो इस विषय को अधिक विवरण में शामिल करता है यदि आपको अभी भी संदेह है, तो यहां देखें । ध्यान दें कि आप हमेशा पाठ्यक्रम की सामग्री को मुफ़्त में ऑडिट कर सकते हैं। ;-)
एक और अच्छी पोस्ट यदि आप सांख्यिकीय परिप्रेक्ष्य के साथ बहुत सारे उदाहरणों के साथ पूरी तरह से स्पष्टीकरण चाहते हैं और केवल डमी कोडिंग तक सीमित नहीं हैं, तो इसे यूसीएलए (आर) से देखें
ध्यान दें कि यदि आप उपयोग कर रहे हैं pandas.get_dummies
, तो एक पैरामीटर है, drop_first
ताकि पहले स्तर को हटाकर k-1 डमी को k श्रेणीबद्ध स्तरों से बाहर निकाला जा सके। कृपया ध्यान दें default = False
, जिसका अर्थ है कि संदर्भ नहीं गिराया गया है और k dummies k श्रेणीगत स्तरों से बाहर बनाया गया है!