नाममात्र / श्रेणीबद्ध डेटा के लिए "डमी चर" बनाम "संकेतक चर"


15

"डमी चर" और "संकेतक चर" लेबल हैं जिनका उपयोग अक्सर 0/1 कोडिंग वाली श्रेणी में सदस्यता का वर्णन करने के लिए किया जाता है; आमतौर पर 0: श्रेणी का सदस्य नहीं, 1: श्रेणी का सदस्य।

11/26/2014 को scholar.google.com पर एक त्वरित खोज (उद्धरण चिह्नों के साथ) से पता चलता है कि "डमी चर" का उपयोग लगभग 318,000 लेखों में किया जाता है, और लगभग 112,000 लेखों में "संकेतक चर" का उपयोग किया जाता है। "डमी वैरिएबल" शब्द का अर्थ " बाउंड वेरिएबल " के गैर-सांख्यिकीय गणित में भी है, जो कि अनुक्रमणित लेखों में "डमी वैरिएबल" के अधिक उपयोग में योगदान दे रहा है।

मेरे शीर्ष-जुड़े प्रश्न:

  1. क्या ये शब्द हमेशा पर्यायवाची हैं (आँकड़ों के भीतर)?
  2. क्या इनमें से कोई भी शब्द कभी भी श्रेणीबद्ध कोडिंग के अन्य रूपों (जैसे प्रभाव कोडिंग , हेल्मर्ट कोडिंग, आदि ) पर लागू होते हैं?
  3. किसी एक शब्द को दूसरे पर पसंद करने के लिए कौन से सांख्यिकीय या अनुशासनात्मक कारण हैं?

4
मैं बाइनरी परिस्थितियों के लिए "संकेतक चर" का उपयोग करता हूं, उदाहरण के लिए सेक्स maleको मूल्यों के साथ कोडित किया जा सकता है 1या 0। यदि 2 से अधिक श्रेणियों के साथ एक श्रेणीगत चर है जो तब प्रत्येक स्तर में सदस्यता के लिए संकेतक चर में विस्तारित होता है, तो मैं संकेतक चर के उस सेट का वर्णन करने के लिए "डमी चर" का उपयोग करूंगा।
ग्रेगर - मोनिका

2
मुझे लगता है कि आपका मतलब है कि सेक्स को 1 या 0 के रूप में एन्कोड किया जा सकता है, लिंग एक अधिक जटिल निर्माण है। (उस बात के लिए सेक्स अधिक जटिल हो सकता है);)
एलेक्सिस

2
अच्छी तरह से लिया बिंदु, को संपादित किया sex
ग्रेगर - मोनिका

2
मैं इस तरह के एक संकेतक चर को कॉल करता हूं male, जहां 1 का मतलब सच है (इस मामले में पुरुष) और 0 का मतलब गलत है (इस मामले में महिला)। यदि मैं चर नाम का उपयोग करता sexहूं, तो मुझे यह देखना होगा कि मैंने उस चर को कैसे कोडित किया है जो मैं उस डेटासेट पर वापस लौटता हूं।
मार्टन बुइस

4
मैंने "डमी वैरिएबल" की विभिन्न कहानियों को बेतहाशा और दुर्भाग्य से गलत तरीके से गैर-तकनीकी दर्शकों द्वारा तिरस्कार या तिरस्कार के रूप में सुना है। वे शर्मनाक थे और मुझे इस शब्द के खिलाफ होने के लिए काफी आश्वस्त कर रहे थे। "सूचक" मेरे लिए स्पष्ट और सीधा है।
निक कॉक्स

जवाबों:


12

मैं कहता हूँ कि "डमी वैरिएबल" एक सामान्य तरीका है जिसमें से एक (संख्यात्मक) वेरिएबल का प्रतिनिधित्व करता है (एक साथ) एक श्रेणीबद्ध भविष्यवक्ता का प्रतिनिधित्व करता है; इसलिए अवधि Helmert और प्रभाव कोडिंग में इस्तेमाल किया उन लोगों के लिए भी लागू होता है । यह मुख्य रूप से "डमी" के सामान्य उपयोग के कारण "स्टैंड-इन" है। "संकेतक चर" मैं सूचक कार्यों से संबंधित उन है, ताकि केवल होने या कुछ संपत्ति नहीं होने से संकेत मिलता है एक या शून्य हो सकता है; इसलिए अवधि केवल संदर्भ के स्तर के कोडिंग में इस्तेमाल किया उन लोगों के लिए लागू होता है । बेशक कुछ लोग "रेफ़रेंस-लेवल कोडिंग" का अर्थ "डमी कोडिंग" करते हैं; वे संभवतः "डमी वैरिएबल" की अधिक प्रतिबंधित परिभाषा है, या किसी भी दर पर होना चाहिए।

Don't और अगर आप उन "डमी" को नहीं कहते हैं, तो क्या करते हैं आप उन्हें कहते हैं?

‡ तो जैसे डमी जब लिए एक संकेत चर रहा है मैं वें व्यक्ति यू मैं (सेट के एक सदस्य पुरुष है एम ): x मैं = 1 एम ( यू मैं ) = { 1 डब्ल्यू एच एन यू मैंएम 0 डब्ल्यू एच एन यू मैंएमएक्समैंमैंयूमैं

एक्समैं=1(यूमैं)={1wn यूमैं0wn यूमैं

जहां की सदस्यता के लिए सूचक समारोह है एम1()

※ या, जैसा कि @gung ने बताया है, स्तर-साधन कोडिंग है।


2
हुह ... क्या आप कुछ संसाधनों को प्रेरित करने के लिए लिंक प्रदान कर सकते हैं? मेरे अनुभव में "डमी वैरिएबल" का उपयोग 0/1 के लिए एक महान कोडिंग के लिए किया जाता है। निश्चित नहीं है कि मैंने आपके सुझाव के अनुसार डमी का उपयोग किया है, और पता है कि अन्य लोग इसका विपरीत अर्थ में उपयोग करते हैं। उदाहरण के लिए, अल्खरूसी, एच। (2012) "रिग्रेशन एनालिसिस में श्रेणीबद्ध चर: अ डमी एंड इफ़ेक्ट कोडिंग की तुलना" इंटरनेशनल जर्नल ऑफ़ एजुकेशन 4 (2): 202-210।
एलेक्सिस

2
मैंने यह नहीं कहा कि "डमी वैरिएबल" का उपयोग 0/1 कोडिंग के लिए नहीं किया गया है, बस इसका उपयोग अधिक सामान्य अर्थों में किया जा सकता है।
Scortchi - को पुनः स्थापित मोनिका

1
वास्तव में आप जिस पेपर का हवाला देते हैं, वह कहता है कि, प्रभाव कोडिंग का उपयोग करते हुए, "डमी वैरिएबल 1, 0, और -1 मानों पर चलते हैं"। (बेशक मुझे लगता है कि वे कुछ और ही करता है, तो वे कहते हैं कि कहने के लिए जा रहे हैं "कोडिंग डमी" कहा जाता है चाहिए।)
Scortchi - को पुनः स्थापित मोनिका

1
मिल गया ... आपके डगमगाए हुए सुपरस्क्रिप्ट से प्रश्न के रूप में, मैं उन्हें "एक्सएक्सएक्स कोडिंग का उपयोग करके श्रेणीबद्ध चर" कहना चाहता हूं।
एलेक्सिस

2
बिंदु सबसे अच्छा में नुथ द्वारा किया जाता है arxiv.org/abs/math/9205211 वह KE इवर्सन के विचार जिम्मेदार बताते हैं। संक्षेप में, हमें एक संकेतक फ़ंक्शन का आविष्कार या आह्वान करने की आवश्यकता नहीं है, लेकिन औपचारिक चर्चा में हमारा सॉफ्टवेयर हमारे लिए क्या करता है।
निक कॉक्स

6

@Scortchi ने यहां अच्छा जवाब दिया है। एक छोटी सी बात जोड़ दूं। यहां तक ​​कि सूचक चर की कठोर परिभाषा का उपयोग करते हुए, यह अभी भी एक प्रतिगमन-प्रकार के मॉडल में श्रेणीबद्ध डेटा के लिए (कम से कम) दो अलग-अलग कोडिंग योजनाओं के साथ जुड़ा हो सकता है: अर्थात। संदर्भ स्तर कोडिंग और स्तर का मतलब कोडिंग है । स्तर के साथ कोडिंग का मतलब है, आपके पास एक श्रेणीबद्ध चर है वे स्तर जिनके साथ प्रतिनिधित्व किया जाता है सूचक चर, लेकिन आप के एक वेक्टर शामिल नहीं है 1इंटरसेप्ट के लिए s (यानी, इंटरसेप्ट को दबा दिया गया है)। (उदाहरण के लिए, मॉडल मैट्रिसेस के साथ एक पूर्ण खोज के लिए, मेरा उत्तर यहां देखें: लॉजिस्टिक रिग्रेशन में एक फैक्टरियल प्रेडिक्टर और कोई इंटरसेप्ट कैसे हो सकता है? ) जब केवल एक श्रेणीबद्ध चर होता है, तो यह एक तरह से मॉडल आउटपुट देता है जो सरल और हो सकता है? कुछ लोगों द्वारा पसंद किया जाता है। (एक उदाहरण के लिए जहां इस योजना का उपयोग ब्याज की तुलना की सुविधा प्रदान करता है, मेरा जवाब यहां देखें: एक बेस्ट लाइनर अनबाइंड प्रेडिक्टर (BLUP) से अनुमानित मूल्य एक सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक (BLUE) से भिन्न क्यों हैं? )

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.