मैं मान लूंगा कि "श्रेणीबद्ध" चर वास्तव में एक क्रमिक चर के लिए है; अन्यथा यह इसे एक निरंतर के रूप में व्यवहार करने के लिए बहुत मायने नहीं रखता है, जब तक कि यह @Rob द्वारा इंगित के रूप में एक द्विआधारी चर (कोडित 0/1) नहीं है। फिर, मैं कहूंगा कि समस्या यह नहीं है कि हम वैरिएबल के इलाज के लिए बहुत अधिक हैं, हालांकि श्रेणीबद्ध डेटा विश्लेषण के कई मॉडल अब तक विकसित किए गए हैं - उदाहरण के लिए, क्रमबद्ध डेटा का विश्लेषण: एक अवलोकन और हाल ही में एक सर्वेक्षण लिउ और एग्रेस्टी से घटनाक्रम -, अंतर्निहित माप पैमाने से हम मानते हैं। मेरी प्रतिक्रिया इस दूसरे बिंदु पर केंद्रित होगी, हालांकि मैं सबसे पहले चर श्रेणियों या स्तरों के संख्यात्मक अंकों के असाइनमेंट पर संक्षेप में चर्चा करूंगा।
क्रमिक चर के एक सरल संख्यात्मक पुनरावर्तन का उपयोग करके, आप मान रहे हैं कि चर में अंतराल गुण हैं (स्टीवंस द्वारा दिए गए वर्गीकरण के अर्थ में, 1946)। माप सिद्धांत के नजरिए से (मनोविज्ञान में), यह अक्सर एक बहुत मजबूत धारणा हो सकती है, लेकिन बुनियादी अध्ययन के लिए (यानी जहां एक एकल वस्तु का उपयोग स्पष्ट शब्दों के साथ दैनिक गतिविधि के बारे में किसी की राय व्यक्त करने के लिए किया जाता है) किसी भी मोनोटोन स्कोर को तुलनीय परिणाम देना चाहिए । कोचरन (1954) ने पहले ही बताया था
किसी भी सेट का स्कोर एक वैध
परीक्षा देता है , बशर्ते कि वे प्रयोग के परिणामों के परामर्श के बिना निर्मित हों। यदि अंकों का सेट खराब है, तो यह बुरी तरह से एक संख्यात्मक पैमाने को विकृत करता है जो वास्तव में आदेशित वर्गीकरण को पूरा करता है, परीक्षण संवेदनशील नहीं होगा। इसलिए, जिस तरह से वर्गीकरण का निर्माण और उपयोग किया गया था, उसके बारे में उपलब्ध सर्वोत्तम अंतर्दृष्टि को स्कोर करना चाहिए। (पृष्ठ ४३६)
(इस टिप्पणी के बारे में मुझे याद दिलाने के लिए @whuber को बहुत-बहुत धन्यवाद, जिसके कारण मुझे एगेस्टी की पुस्तक को फिर से पढ़ना पड़ा, जहाँ से यह उद्धरण आता है।)
वास्तव में, कई परीक्षण इस तरह के वैरिएबल को अंतराल तराजू के रूप में मानते हैं: उदाहरण के लिए, एक रैखिक प्रवृत्ति (सरल स्वतंत्रता के विकल्प के रूप में) के परीक्षण के लिए सांख्यिकीय एक सहसंबंधी दृष्टिकोण ( , एगेस्टी, 2002, पी। 87)।एम 2 = ( एन - 1 ) आर 2म2म2= ( n - 1 ) आर2
ठीक है, आप अपने चर को एक अनियमित सीमा पर फिर से विभाजित करने या इसके कुछ स्तरों को एकत्र करने का निर्णय ले सकते हैं, लेकिन इस मामले में पुनरावर्ती श्रेणियों के बीच मजबूत असंतुलन सांख्यिकीय परीक्षणों को विकृत कर सकता है, जैसे कि उपरोक्त प्रवृत्ति परीक्षण। श्रेणियों के बीच दूरी निर्दिष्ट करने के लिए एक अच्छा विकल्प पहले से ही @ जेरोमी द्वारा प्रस्तावित किया गया था, अर्थात् इष्टतम स्केलिंग।
अब, आइए, मेरे द्वारा किए गए दूसरे बिंदु पर चर्चा करें, जो कि अंतर्निहित माप मॉडल है। जब मैं इस तरह के प्रश्न को देखता हूं, तो मैं "साइकोमेट्रिक्स" टैग को जोड़ने में हमेशा संकोच करता हूं, क्योंकि माप तराजू का निर्माण और विश्लेषण साइकोमेट्रिक थ्योरी (नूननली और बर्नस्टीन, 1994, एक साफ अवलोकन के लिए) के तहत आता है। मैं उन सभी मॉडलों पर ध्यान केंद्रित नहीं करूंगा जो वास्तव में आइटम रिस्पॉन्स थ्योरी के तहत नेतृत्व कर रहे हैं , और मैं कृपया इच्छुक पाठक को I. पार्टचेव के ट्यूटोरियल, आइटम प्रतिक्रिया सिद्धांत के लिए एक दृश्य गाइड का संदर्भ देता हूं।आईआरटी के लिए एक सौम्य परिचय के लिए, और संभव आईआरटी टैक्सोनॉमी के लिए अंत में सूचीबद्ध संदर्भ (5-8)। बहुत संक्षेप में, विचार यह है कि परिवर्तनशील श्रेणियों के बीच मनमानी दूरी को निर्धारित करने के बजाय, आप एक अव्यक्त पैमाने को मानते हैं और उस निरंतरता पर उनके स्थान का अनुमान लगाते हैं, साथ में व्यक्तियों की क्षमता या देयता। एक सरल उदाहरण बहुत गणितीय संकेतन के लायक है, तो आइए निम्न आइटम पर विचार करें ( EORTC QLQ-C30 स्वास्थ्य से संबंधित जीवन प्रश्नावली से आ रहा है):
तुमने चिंता की?
जिसे चार बिंदुओं पर कोडित किया गया है, "नॉट ऑल" से लेकर "टू वेरी"। कच्चे स्कोर की गणना 1 से 4 के स्कोर के आधार पर की जाती है। समान पैमाने से संबंधित वस्तुओं पर स्कोर को एक साथ जोड़ा जा सकता है ताकि एक तथाकथित स्केल स्कोर प्राप्त किया जा सके, जो अंतर्निहित निर्माण (यहाँ, एक मानसिक स्वास्थ्य घटक) पर एक रैंक देता है )। स्कोरिंग सुगमता (व्यवसायी या नर्स के लिए) के कारण इस तरह के सममित पैमाने स्कोर बहुत व्यावहारिक हैं, लेकिन वे एक असतत (आदेशित) पैमाने से अधिक कुछ नहीं हैं।
हम यह भी विचार कर सकते हैं कि किसी दिए गए प्रतिक्रिया श्रेणी के समर्थन की संभावना कुछ प्रकार के लॉजिस्टिक मॉडल का पालन करती है, जैसा कि I. पार्टचेव के ट्यूटोरियल में वर्णित है, ऊपर वर्णित है। मूल रूप से, यह विचार एक प्रकार की थ्रेशोल्ड मॉडल का है (जो आनुपातिक या संचयी बाधाओं के मॉडल के समतुल्य सूत्रीकरण का नेतृत्व करता है) और हम एक प्रतिक्रिया श्रेणी में होने की बाधाओं को मॉडल करते हैं, बल्कि एक के ऊपर एक या स्कोरिंग की बाधाओं को अव्यक्त विशेषता पर विषयों की स्थिति पर कुछ श्रेणी, सशर्त। इसके अतिरिक्त, हम यह भी लगा सकते हैं कि प्रतिक्रिया श्रेणियां समान रूप से अव्यक्त पैमाने पर (यह रेटिंग स्केल मॉडल है) - जो कि हम नियमित रूप से स्थानिक संख्यात्मक स्कोर असाइन करके करते हैं - या नहीं (यह आंशिक क्रेडिट मॉडल है) ।
स्पष्ट रूप से, हम क्लासिकल टेस्ट थ्योरी में बहुत अधिक नहीं जोड़ रहे हैं, जहां क्रमिक चर को संख्यात्मक के रूप में माना जाता है। हालांकि, हम एक संभाव्य मॉडल का परिचय देते हैं, जहां हम एक निरंतर पैमाने (अंतराल गुणों के साथ) को मानते हैं और जहां माप की विशिष्ट त्रुटियों को ध्यान में रखा जा सकता है, और हम किसी भी प्रतिगमन मॉडल में इन तथ्यात्मक स्कोर को प्लग कर सकते हैं।
संदर्भ
- एसएस स्टीवंस। माप के तराजू के सिद्धांत पर। विज्ञान , 103 : 677-680, 1946।
- χ2
- जे नूननली और आई बर्नस्टीन। साइकोमेट्रिक थ्योरी । मैकग्रा-हिल, 1994
- एलन अग्रेस्टी। श्रेणीबद्ध डेटा विश्लेषण । विली, 1990।
- सीआर राव और एस सिंहराय, संपादक। सांख्यिकी की पुस्तिका, वॉल्यूम। 26: साइकोमेट्रिक्स । एल्सेवियर साइंस बी.वी., नीदरलैंड, 2007।
- ए बूमस्मा, एमएजे वैन ड्यूजेन और टीएबी स्निजर्स। आइटम रिस्पांस थ्योरी पर निबंध । स्प्रिंगर, 2001।
- डी थाटसेन और एल स्टाइनबर्ग। आइटम प्रतिक्रिया मॉडल का एक वर्गीकरण। साइकोमेट्रिका , 51 (4) : 567-577, 1986।
- पी मैयर और आर हत्जिंगर। विस्तारित रस्च मॉडलिंग: आरआर में आईआरटी मॉडल के आवेदन के लिए ईआरएम पैकेज । जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर , 20 (9) , 2007।