क्रमिक स्वतंत्र चर के साथ निरंतर निर्भर चर


17

एक क्रमिक चर X 1 सहित एक सतत निर्भर चर y और स्वतंत्र चर को देखते हुए , मैं एक रैखिक मॉडल में कैसे फिट हो सकता हूं ? क्या इस प्रकार के मॉडल के बारे में कागजात हैं?R

जवाबों:


30

@ स्कोर्टची आपको एक आदेशित कोवरिएट के लिए कोडिंग पर इस उत्तर के साथ कवर किया गया है । मैं पर सिफारिश दोहराया गया है मेरा उत्तर करने के लिए सर्वेक्षण जवाब पर दो जनसांख्यिकीय IVs का प्रभाव (Likert पैमाने पर) । विशेष रूप से, सैद्धांतिक पृष्ठभूमि और सिमुलेशन अध्ययन के लिए Gertheiss ' (2013) ordPens पैकेज का उपयोग करने के लिए , और Gertheiss और Tutz (2009a) का उल्लेख करना है ।

विशिष्ट कार्य जो आप चाहते हैं वह है ordSmooth* । यह अनिवार्य रूप से डमी गुणांक को क्रमिक चर के स्तरों पर समीपस्थ रैंकों के लिए कम से अलग करता है, जो ओवरफिटिंग को कम करता है और पूर्वानुमानों में सुधार करता है। यह आम तौर पर या तो (या कभी-कभी) अधिकतम संभावना (यानी, इस मामले में साधारण कम से कम वर्गों) से बेहतर प्रदर्शन करता है, जब डेटा वास्तव में क्रमिक होते हैं तो निरंतर (या उनकी शर्तों, मीट्रिक) डेटा के लिए प्रतिगमन मॉडल का अनुमान। यह सामान्यीकृत रैखिक मॉडल के सभी प्रकार के साथ संगत प्रतीत होता है, और आपको नाममात्र और निरंतर भविष्यवाणियों को अलग-अलग मैट्रिसेस के रूप में दर्ज करने की अनुमति देता है।

गर्थे, टुट्ज़ और सहयोगियों से कई अतिरिक्त संदर्भ उपलब्ध हैं और नीचे सूचीबद्ध हैं। इनमें से कुछ में विकल्प हो सकते हैं - यहां तक ​​कि गेर्थिस और टुट्ज़ (2009 ए) रिज रीरफिंग को दूसरे विकल्प के रूप में चर्चा करते हैं। मैंने इसे अभी तक सभी के माध्यम से नहीं खोदा है, लेकिन यह कहने के लिए पर्याप्त है @ ऑर्डिनल भविष्यवक्ताओं पर बहुत कम साहित्य की एरिक की समस्या!

संदर्भ

- गेर्थिस, जे। (2013, 14 जून)। ordPens: क्रमिक भविष्यवक्ताओं का चयन और / या चौरसाई , संस्करण 0.2-1। Http://cran.r-project.org/web/packages/ordPens/ordPens.pdf से लिया गया ।
- गेर्थिस, जे।, होगर, एस।, ओबेरहॉसर, सी।, और टुट्ज़, जी। (2011)। कामकाजी कोर सेट के अंतर्राष्ट्रीय वर्गीकरण के लिए अनुप्रयोगों के साथ सामान्य रूप से स्केल किए गए स्वतंत्र चर का चयन। रॉयल स्टैटिस्टिकल सोसायटी का जर्नल: सीरीज़ सी (एप्लाइड स्टैटिस्टिक्स), 60 (3), 377-395।
- गेर्थिस, जे।, और टुट्ज़, जी। (2009 ए)। क्रमिक भविष्यवक्ताओं के साथ दंडित प्रतिगमन। अंतर्राष्ट्रीय सांख्यिकीय समीक्षा, 77 (3), 345–365। Http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf से लिया गया ।
- गेर्थिस, जे।, और टुट्ज़, जी। (2009 बी)। ब्लॉकवाइज बूस्टिंग द्वारा मास स्पेक्ट्रोमेट्री-आधारित प्रोटिओमिक प्रोफाइलिंग में पर्यवेक्षित फीचर का चयन। जैव सूचना विज्ञान, 25 (8), 1076–1077।
- गेर्थिस, जे।, और टुट्ज़, जी। (2009 सी)। परिवर्तनीय स्केलिंग और निकटतम पड़ोसी विधियां। केमोमेट्रिक्स जर्नल, 23 (3), 149-151। - गेर्थिस, जे। एंड टुट्ज़, जी। (2010)। श्रेणीबद्ध व्याख्यात्मक चर का विरल मॉडलिंग। द एनल्स ऑफ एप्लाइड स्टैटिस्टिक्स, 4 , 2150–2180।
- हॉफनर, बी।, होथोर्न, टी।, कनीब, टी।, और श्मिट, एम। (2011)। बढ़ावा देने के आधार पर निष्पक्ष मॉडल चयन के लिए एक रूपरेखा। कम्प्यूटेशनल और ग्राफिकल स्टैटिस्टिक्स जर्नल, 20 (4), 956–971। Http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf से लिया गया ।
- ओलेकर, एम। आर।, गर्थेइस, जे।, और टुट्ज़, जी। (2012)। सामान्यीकृत रैखिक मॉडल में श्रेणीबद्ध भविष्यवाणियों और प्रभाव संशोधक के साथ नियमितीकरण और मॉडल का चयन। सांख्यिकी विभाग: तकनीकी रिपोर्ट, संख्या 122Http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf से लिया गया ।
- ओलेकर, एम। आर।, और टूट्ज़, जी (2013)। सामान्यीकृत संरचित मॉडल में विभिन्न प्रकार के दंडों के संयोजन के लिए दंड का एक सामान्य परिवार। सांख्यिकी विभाग: तकनीकी रिपोर्ट, संख्या 139Http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf से लिया गया ।
- पेट्री, एस।, फ्लेक्सिडर, सी।, और टुट्ज़, जी (2011)। पेयरवाइज फ्यूज़्ड लासो। सांख्यिकी विभाग: तकनीकी रिपोर्ट, नंबर 102Http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf से लिया गया ।
- रूफिबच, के। (2010)। एक सक्रिय सेट एल्गोरिदम आदेशित भविष्यवक्ताओं के साथ सामान्यीकृत रैखिक मॉडल में मापदंडों का अनुमान लगाने के लिए। कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण, 54 (6), 1442-1456। Http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail से लिया गया ।
- टुट्ज़, जी। (2011, अक्टूबर)। श्रेणीबद्ध डेटा के लिए नियमितीकरण के तरीके। म्यूनिख: लुडविग-मैक्सिमिलियंस-यूनिवर्सिटेट। Http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf से लिया गया ।
- टुट्ज़, जी।, और गर्टेहिस, जे। (2013)। भविष्यवाणियों के रूप में रेटिंग का पैमाना - पैमाने के स्तर का पुराना सवाल और कुछ जवाब।साइकोमेट्रिका , 1-20।


15

जब कई भविष्यवक्ता होते हैं, और ब्याज के पूर्वसूचक क्रमिक होते हैं, तो अक्सर यह तय करना मुश्किल होता है कि चर को कैसे कोडित किया जाए। इसे श्रेणीबद्ध के रूप में कोड करना आदेश की जानकारी खो देता है, जबकि इसे संख्यात्मक के रूप में कोड करना आदेशित श्रेणियों के प्रभावों पर रैखिकता को लागू करता है जो उनके वास्तविक प्रभावों से दूर हो सकते हैं। पूर्व के लिए, आइसोटोनिक प्रतिगमन को गैर-अखंडता को संबोधित करने के तरीके के रूप में प्रस्तावित किया गया है, लेकिन यह एक डेटा-संचालित मॉडल चयन प्रक्रिया है, जो कई अन्य डेटा-संचालित प्रक्रियाओं की तरह है, अंतिम फिट मॉडल और महत्व का सावधानीपूर्वक मूल्यांकन की आवश्यकता है इसके मापदंडों के। उत्तरार्द्ध के लिए, स्प्लिन आंशिक रूप से कठोर रैखिकता धारणा को कम कर सकते हैं, लेकिन संख्याओं को अभी भी ऑर्डर की गई श्रेणियों को सौंपा जाना चाहिए, और परिणाम इन विकल्पों के प्रति संवेदनशील हैं। हमारे पेपर में (ली और शेफर्ड, 2010, परिचय, पैराग्राफ 3-5),

Yएक्सजेडYजेडएक्सजेडYएक्स

एक्सजेड

हमने एक R पैकेज, PResiduals विकसित किया है, जो CRAN से उपलब्ध है। पैकेज में रैखिक और क्रमिक परिणाम प्रकारों के लिए हमारे दृष्टिकोण का प्रदर्शन करने के लिए कार्य शामिल हैं। हम अन्य परिणाम प्रकार (जैसे, गणना) और सुविधाओं (जैसे, इंटरैक्शन की अनुमति) को जोड़ने के लिए काम कर रहे हैं। पैकेज में विभिन्न अवशिष्ट मॉडल के लिए, हमारे अवशिष्ट की गणना के लिए कार्य शामिल हैं, जो कि एक संभावना-पैमाने पर अवशिष्ट है।

संदर्भ

ली, सी। और शेफर्ड, बीई (2010)। दो सेरिनल चरों के बीच जुड़ाव का परीक्षण जबकि कोवरिएट्स के लिए समायोजन। JASA, 105, 612–620।

ली, सी। और शेफर्ड, बीई (2012)। क्रमिक परिणामों के लिए एक नया अवशिष्ट। बायोमेट्रिक 99, 473–480।


7

आम तौर पर अध्यादेशीय चर पर बहुत अधिक साहित्य होता है जो आश्रितों के रूप में उपयोग करने पर निर्भर और थोड़ा होता है। सांख्यिकीय अभ्यास में उन्हें आमतौर पर या तो निरंतर या श्रेणीबद्ध माना जाता है। आप यह जांच सकते हैं कि अवशिष्ट के रूप में एक निरंतर चर के रूप में भविष्यवक्ता के साथ एक रैखिक मॉडल एक अच्छा फिट दिखता है।

उन्हें कभी-कभी संचयी रूप से भी कोडित किया जाता है। एक उदाहरण एक सामान्य चर X1 के लिए होगा, जिसमें 1,2 और 3 का स्तर X1> 1 के लिए डमी बाइनरी वैरिएबल d1 और X1> 2 के लिए डमी बाइनरी वैरिएबल d2 होगा। फिर d1 के लिए गुणांक वह प्रभाव है जो आपको तब मिलता है जब आप अपने आर्डिनल को 2 से 3 के लिए बढ़ाते हैं और d2 के लिए गुणांक वह प्रभाव होता है जो आपको 2 से 3 तक होने पर प्राप्त होता है।

इससे व्याख्या अक्सर अधिक आसानी से हो जाती है, लेकिन यह व्यावहारिक उद्देश्यों के लिए एक स्पष्ट चर के रूप में उपयोग करने के बराबर है।

गेलमैन का यह भी सुझाव है कि कोई भी मॉडल के लचीलेपन को बढ़ाने के लिए क्रमिक कारक (मुख्य प्रभावों के लिए) और निरंतर चर (बातचीत के लिए) के रूप में क्रमिक भविष्यवक्ता का उपयोग कर सकता है।

मेरी व्यक्तिगत रणनीति आमतौर पर यह देखना है कि क्या उन्हें निरंतर के रूप में व्यवहार करने से समझ में आता है और एक उचित मॉडल में परिणाम होता है और केवल यदि आवश्यक हो तो उन्हें स्पष्ट के रूप में उपयोग करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.