क्या यह कभी स्पष्ट डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है?


57

असतत और निरंतर डेटा पर इस सवाल का जवाब देने में मैंने गौर किया कि यह शायद ही कभी डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है।

इसके चेहरे पर जो स्वयं स्पष्ट प्रतीत होता है, लेकिन अंतर्ज्ञान अक्सर आंकड़ों के लिए एक गरीब मार्गदर्शक है, या कम से कम मेरा है। तो अब मैं सोच रहा हूँ: क्या यह सच है? या क्या ऐसे स्थापित विश्लेषण हैं जिनके लिए श्रेणीबद्ध डेटा से कुछ निरंतरता में परिवर्तन वास्तव में उपयोगी है? अगर डेटा ऑर्डिनल होता तो क्या इससे कोई फर्क पड़ता?


20
यह सवाल और इसकी प्रतिक्रियाएं हमें याद दिलाती हैं कि कैसे चर के इस पुरातन विभाजन को श्रेणीबद्ध-क्रमिक-अंतराल-अनुपात में वास्तव में सीमित है। यह सांख्यिकीय रूप से भोले का मार्गदर्शन कर सकता है, लेकिन विचारशील या अनुभवी विश्लेषक के लिए यह एक बाधा है, चर को उन तरीकों से व्यक्त करने के तरीके में बाधा है जो डेटा और उनके साथ किए जाने वाले निर्णयों के लिए उपयुक्त हैं। इस बाद के दृष्टिकोण से काम करने वाला कोई व्यक्ति स्वतंत्र रूप से श्रेणीबद्ध और "निरंतर" डेटा अभ्यावेदन के बीच चला जाएगा; उनके लिए, यह सवाल भी नहीं उठ सकता है! इसके बजाय, हमें पूछना चाहिए: यह कैसे मदद करता है?
whuber

@whuber (+1) बहुत कम से कम, एक ही समय में माप विश्वसनीयता और नैदानिक ​​सटीकता का अनुकूलन करना मुश्किल लगता है।
chl

जवाबों:


34

मैं मान लूंगा कि "श्रेणीबद्ध" चर वास्तव में एक क्रमिक चर के लिए है; अन्यथा यह इसे एक निरंतर के रूप में व्यवहार करने के लिए बहुत मायने नहीं रखता है, जब तक कि यह @Rob द्वारा इंगित के रूप में एक द्विआधारी चर (कोडित 0/1) नहीं है। फिर, मैं कहूंगा कि समस्या यह नहीं है कि हम वैरिएबल के इलाज के लिए बहुत अधिक हैं, हालांकि श्रेणीबद्ध डेटा विश्लेषण के कई मॉडल अब तक विकसित किए गए हैं - उदाहरण के लिए, क्रमबद्ध डेटा का विश्लेषण: एक अवलोकन और हाल ही में एक सर्वेक्षण लिउ और एग्रेस्टी से घटनाक्रम -, अंतर्निहित माप पैमाने से हम मानते हैं। मेरी प्रतिक्रिया इस दूसरे बिंदु पर केंद्रित होगी, हालांकि मैं सबसे पहले चर श्रेणियों या स्तरों के संख्यात्मक अंकों के असाइनमेंट पर संक्षेप में चर्चा करूंगा।

क्रमिक चर के एक सरल संख्यात्मक पुनरावर्तन का उपयोग करके, आप मान रहे हैं कि चर में अंतराल गुण हैं (स्टीवंस द्वारा दिए गए वर्गीकरण के अर्थ में, 1946)। माप सिद्धांत के नजरिए से (मनोविज्ञान में), यह अक्सर एक बहुत मजबूत धारणा हो सकती है, लेकिन बुनियादी अध्ययन के लिए (यानी जहां एक एकल वस्तु का उपयोग स्पष्ट शब्दों के साथ दैनिक गतिविधि के बारे में किसी की राय व्यक्त करने के लिए किया जाता है) किसी भी मोनोटोन स्कोर को तुलनीय परिणाम देना चाहिए । कोचरन (1954) ने पहले ही बताया था

किसी भी सेट का स्कोर एक वैध परीक्षा देता है , बशर्ते कि वे प्रयोग के परिणामों के परामर्श के बिना निर्मित हों। यदि अंकों का सेट खराब है, तो यह बुरी तरह से एक संख्यात्मक पैमाने को विकृत करता है जो वास्तव में आदेशित वर्गीकरण को पूरा करता है, परीक्षण संवेदनशील नहीं होगा। इसलिए, जिस तरह से वर्गीकरण का निर्माण और उपयोग किया गया था, उसके बारे में उपलब्ध सर्वोत्तम अंतर्दृष्टि को स्कोर करना चाहिए। (पृष्ठ ४३६)

(इस टिप्पणी के बारे में मुझे याद दिलाने के लिए @whuber को बहुत-बहुत धन्यवाद, जिसके कारण मुझे एगेस्टी की पुस्तक को फिर से पढ़ना पड़ा, जहाँ से यह उद्धरण आता है।)

वास्तव में, कई परीक्षण इस तरह के वैरिएबल को अंतराल तराजू के रूप में मानते हैं: उदाहरण के लिए, एक रैखिक प्रवृत्ति (सरल स्वतंत्रता के विकल्प के रूप में) के परीक्षण के लिए सांख्यिकीय एक सहसंबंधी दृष्टिकोण ( , एगेस्टी, 2002, पी। 87)।एम 2 = ( एन - 1 ) आर 222=(n-1)आर2

ठीक है, आप अपने चर को एक अनियमित सीमा पर फिर से विभाजित करने या इसके कुछ स्तरों को एकत्र करने का निर्णय ले सकते हैं, लेकिन इस मामले में पुनरावर्ती श्रेणियों के बीच मजबूत असंतुलन सांख्यिकीय परीक्षणों को विकृत कर सकता है, जैसे कि उपरोक्त प्रवृत्ति परीक्षण। श्रेणियों के बीच दूरी निर्दिष्ट करने के लिए एक अच्छा विकल्प पहले से ही @ जेरोमी द्वारा प्रस्तावित किया गया था, अर्थात् इष्टतम स्केलिंग।

अब, आइए, मेरे द्वारा किए गए दूसरे बिंदु पर चर्चा करें, जो कि अंतर्निहित माप मॉडल है। जब मैं इस तरह के प्रश्न को देखता हूं, तो मैं "साइकोमेट्रिक्स" टैग को जोड़ने में हमेशा संकोच करता हूं, क्योंकि माप तराजू का निर्माण और विश्लेषण साइकोमेट्रिक थ्योरी (नूननली और बर्नस्टीन, 1994, एक साफ अवलोकन के लिए) के तहत आता है। मैं उन सभी मॉडलों पर ध्यान केंद्रित नहीं करूंगा जो वास्तव में आइटम रिस्पॉन्स थ्योरी के तहत नेतृत्व कर रहे हैं , और मैं कृपया इच्छुक पाठक को I. पार्टचेव के ट्यूटोरियल, आइटम प्रतिक्रिया सिद्धांत के लिए एक दृश्य गाइड का संदर्भ देता हूं।आईआरटी के लिए एक सौम्य परिचय के लिए, और संभव आईआरटी टैक्सोनॉमी के लिए अंत में सूचीबद्ध संदर्भ (5-8)। बहुत संक्षेप में, विचार यह है कि परिवर्तनशील श्रेणियों के बीच मनमानी दूरी को निर्धारित करने के बजाय, आप एक अव्यक्त पैमाने को मानते हैं और उस निरंतरता पर उनके स्थान का अनुमान लगाते हैं, साथ में व्यक्तियों की क्षमता या देयता। एक सरल उदाहरण बहुत गणितीय संकेतन के लायक है, तो आइए निम्न आइटम पर विचार करें ( EORTC QLQ-C30 स्वास्थ्य से संबंधित जीवन प्रश्नावली से आ रहा है):

तुमने चिंता की?

जिसे चार बिंदुओं पर कोडित किया गया है, "नॉट ऑल" से लेकर "टू वेरी"। कच्चे स्कोर की गणना 1 से 4 के स्कोर के आधार पर की जाती है। समान पैमाने से संबंधित वस्तुओं पर स्कोर को एक साथ जोड़ा जा सकता है ताकि एक तथाकथित स्केल स्कोर प्राप्त किया जा सके, जो अंतर्निहित निर्माण (यहाँ, एक मानसिक स्वास्थ्य घटक) पर एक रैंक देता है )। स्कोरिंग सुगमता (व्यवसायी या नर्स के लिए) के कारण इस तरह के सममित पैमाने स्कोर बहुत व्यावहारिक हैं, लेकिन वे एक असतत (आदेशित) पैमाने से अधिक कुछ नहीं हैं।

हम यह भी विचार कर सकते हैं कि किसी दिए गए प्रतिक्रिया श्रेणी के समर्थन की संभावना कुछ प्रकार के लॉजिस्टिक मॉडल का पालन करती है, जैसा कि I. पार्टचेव के ट्यूटोरियल में वर्णित है, ऊपर वर्णित है। मूल रूप से, यह विचार एक प्रकार की थ्रेशोल्ड मॉडल का है (जो आनुपातिक या संचयी बाधाओं के मॉडल के समतुल्य सूत्रीकरण का नेतृत्व करता है) और हम एक प्रतिक्रिया श्रेणी में होने की बाधाओं को मॉडल करते हैं, बल्कि एक के ऊपर एक या स्कोरिंग की बाधाओं को अव्यक्त विशेषता पर विषयों की स्थिति पर कुछ श्रेणी, सशर्त। इसके अतिरिक्त, हम यह भी लगा सकते हैं कि प्रतिक्रिया श्रेणियां समान रूप से अव्यक्त पैमाने पर (यह रेटिंग स्केल मॉडल है) - जो कि हम नियमित रूप से स्थानिक संख्यात्मक स्कोर असाइन करके करते हैं - या नहीं (यह आंशिक क्रेडिट मॉडल है) ।

स्पष्ट रूप से, हम क्लासिकल टेस्ट थ्योरी में बहुत अधिक नहीं जोड़ रहे हैं, जहां क्रमिक चर को संख्यात्मक के रूप में माना जाता है। हालांकि, हम एक संभाव्य मॉडल का परिचय देते हैं, जहां हम एक निरंतर पैमाने (अंतराल गुणों के साथ) को मानते हैं और जहां माप की विशिष्ट त्रुटियों को ध्यान में रखा जा सकता है, और हम किसी भी प्रतिगमन मॉडल में इन तथ्यात्मक स्कोर को प्लग कर सकते हैं।

संदर्भ

  1. एसएस स्टीवंस। माप के तराजू के सिद्धांत पर। विज्ञान , 103 : 677-680, 1946।
  2. χ2
  3. जे नूननली और आई बर्नस्टीन। साइकोमेट्रिक थ्योरी । मैकग्रा-हिल, 1994
  4. एलन अग्रेस्टी। श्रेणीबद्ध डेटा विश्लेषण । विली, 1990।
  5. सीआर राव और एस सिंहराय, संपादक। सांख्यिकी की पुस्तिका, वॉल्यूम। 26: साइकोमेट्रिक्स । एल्सेवियर साइंस बी.वी., नीदरलैंड, 2007।
  6. ए बूमस्मा, एमएजे वैन ड्यूजेन और टीएबी स्निजर्स। आइटम रिस्पांस थ्योरी पर निबंध । स्प्रिंगर, 2001।
  7. डी थाटसेन और एल स्टाइनबर्ग। आइटम प्रतिक्रिया मॉडल का एक वर्गीकरण। साइकोमेट्रिका , 51 (4) : 567-577, 1986।
  8. पी मैयर और आर हत्जिंगर। विस्तारित रस्च मॉडलिंग: आरआर में आईआरटी मॉडल के आवेदन के लिए ईआरएम पैकेजजर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर , 20 (9) , 2007।

19

यदि केवल दो श्रेणियां हैं, तो उन्हें (0,1) में बदलना समझ में आता है। वास्तव में, यह आमतौर पर किया जाता है जहां परिणामी डमी चर प्रतिगमन मॉडल में उपयोग किया जाता है।

यदि दो से अधिक श्रेणियां हैं, तो मुझे लगता है कि यह केवल तभी समझ में आता है जब डेटा सामान्य हो, और उसके बाद केवल बहुत ही विशिष्ट परिस्थितियों में। उदाहरण के लिए, यदि मैं प्रतिगमन कर रहा हूं और क्रमिक-सह-सांख्यिक चर के लिए एक nonparametric nonlinear फ़ंक्शन फिट करता हूं, तो मुझे लगता है कि यह ठीक है। लेकिन अगर मैं रैखिक प्रतिगमन का उपयोग करता हूं, तो मैं क्रमिक चर के निरंतर मूल्यों के बीच अंतर के बारे में बहुत मजबूत धारणाएं बना रहा हूं, और मैं आमतौर पर ऐसा करने के लिए अनिच्छुक हूं।


1
"[टी] मुर्गी मैं क्रमिक चर के लगातार मूल्यों के बीच अंतर के बारे में बहुत मजबूत धारणाएं बना रहा हूं।" मुझे लगता है कि यह महत्वपूर्ण बिंदु है। यानी आप कितनी दृढ़ता से यह तर्क दे सकते हैं कि समूह 1 और 2 के बीच का अंतर 2 और 3 के बीच की तुलना में है?
फ्रेया हैरिसन

मुझे लगता है कि आपको इस बारे में कुछ धारणा बनानी चाहिए कि निरंतर चर को कैसे वितरित किया जाना चाहिए और फिर प्रत्येक श्रेणीगत चर आवृत्ति के इस "स्यूडोहिस्टोग्राम" को फिट करने का प्रयास करें (मेरा मतलब है कि बिन चौड़ाई जो इसे एक फिटेड हिस्टोग्राम में बदल देगी)। फिर भी, मैं इस क्षेत्र का विशेषज्ञ नहीं हूं, इसका तेज और गंदा विचार है।

बाइनरी श्रेणियों को {0,1} के रूप में पुन: उपयोग करना समझ में आता है, लेकिन इसे निरंतर [0,1] अंतराल में बदलना एक छलांग की तरह लगता है। व्यापक मोर्चे पर, मैं पूरी तरह से वजन अध्यादेशों के प्रति आपकी अनिच्छा के साथ समान रूप से हूं जब तक कि मॉडल से शक्तिशाली तर्क नहीं हैं।
वॉकीटॉकी

18

निरंतर के रूप में कई श्रेणियों के साथ क्रमबद्ध वैरिएबल का इलाज करना आम बात है। इसके उदाहरण:

  • 100 आइटम परीक्षण पर वस्तुओं की संख्या सही है
  • एक सारांशित मनोवैज्ञानिक पैमाना (उदाहरण के लिए, पाँच बिंदु पैमाने पर प्रत्येक 10 आइटम का मतलब है)

और "निरंतर के रूप में व्यवहार करके" मेरा मतलब है कि एक मॉडल में चर शामिल है जो एक सतत यादृच्छिक चर मानता है (जैसे, रैखिक प्रतिगमन में एक आश्रित चर के रूप में)। मुझे लगता है कि इस मुद्दे के लिए एक उचित सरलीकरण धारणा होने के लिए कितने पैमाने के बिंदु आवश्यक हैं।

कुछ अन्य विचार:

  • बहुपत्नी सहसंबंध दो अव्यक्त निरंतर चर के संदर्भ में दो क्रमिक चर के बीच संबंध को मॉडल करने का प्रयास करता है।
  • इष्टतम स्केलिंग आपको ऐसे मॉडल विकसित करने की अनुमति देता है जहां एक डेटा चर तरीके से स्केलिंग का विकास किया जाता है, जो कि आप जिस भी पैमाने पर बाधा डालते हैं, उसका सम्मान करते हुए (जैसे, क्रमबद्धता)। अच्छे परिचय के लिए डी लीउव और मेरा (2009) देखें

संदर्भ

  • डी लीउव, जे।, और मेरा, पी। (2009)। R में इष्टतम स्केलिंग के लिए Gifi विधियाँ: पैकेज होमल्स। सांख्यिकीय सॉफ्टवेयर जर्नल, आगामी, 1-30। पीडीएफ

7

एक बहुत ही सरल उदाहरण को अक्सर अनदेखा किया जाता है जो कई पाठकों के अनुभव के भीतर झूठ बोलना चाहिए जो अकादमिक कार्य के लिए दिए गए अंक या ग्रेड की चिंता करता है। अक्सर व्यक्तिगत असाइनमेंट के लिए अंक सार निर्णय-आधारित क्रमिक माप में होते हैं, यहां तक ​​कि जब सम्मेलन का मामला होता है, तो उन्हें अधिकतम 5 (संभवतः दशमलव बिंदुओं के साथ) पैमाने पर प्रतिशत (या मान के रूप में) दिए जाते हैं। यही है, एक शिक्षक एक निबंध या शोध प्रबंध या थीसिस या पेपर के माध्यम से पढ़ सकता है और यह तय कर सकता है कि यह 42%, या 4, या जो भी योग्य है। यहां तक ​​कि जब निशान एक विस्तृत मूल्यांकन योजना पर आधारित होते हैं, तो पैमाने अंतराल या अनुपात माप पैमाने से कुछ दूरी पर होता है।

लेकिन फिर कई संस्थान यह विचार करते हैं कि यदि आपके पास इनमें से पर्याप्त अंक या ग्रेड हैं, तो उन्हें औसत (ग्रेड-पॉइंट औसत, आदि) और यहां तक ​​कि उन्हें और अधिक विस्तार से विश्लेषण करना भी पूरी तरह से उचित है। तो कुछ बिंदु पर एक माप पैमाने पर क्रमिक माप को आकार दिया जाता है, जैसे कि यह निरंतर था।

विडंबनाओं के जानकारों का ध्यान होगा कि कई विभागों या स्कूलों में सांख्यिकीय पाठ्यक्रम अक्सर सिखाते हैं कि यह सबसे अच्छा संदिग्ध है और सबसे गलत, जबकि यह एक विश्वविद्यालय-व्यापी प्रक्रिया के रूप में लागू किया गया है।


5

Pareto चार्ट और संबंधित मूल्यों के साथ आवृत्ति द्वारा रैंकिंग के विश्लेषण में, (उदाहरण के लिए, उत्पाद श्रेणियों के शीर्ष 80% में कितनी श्रेणियां हैं)


5
महत्वपूर्ण बिंदु, और इसे बढ़ाया जा सकता है: क्रमिक डेटा के लिए कई मॉडल इस विचार पर टिका है कि यह क्रमिक डेटा नहीं है, लेकिन उनकी संचयी संभावनाएं जो मॉडलिंग की जा सकती हैं।
निक कॉक्स

4

मैं यह तर्क देने जा रहा हूं कि निरंतर के रूप में एक स्पष्ट, गैर-क्रमिक चर का इलाज करना कभी-कभी समझ में आता है।

यदि आप बड़े डेटासेट के आधार पर निर्णय वृक्षों का निर्माण कर रहे हैं, तो श्रेणीबद्ध चर को डमी चर में परिवर्तित करने के लिए प्रसंस्करण शक्ति और मेमोरी के मामले में यह महंगा हो सकता है। इसके अलावा, कुछ मॉडल (जैसे randomForestR में) कई स्तरों के साथ श्रेणीबद्ध चर को संभाल नहीं सकते हैं।

इन मामलों में, एक ट्री-आधारित मॉडल को अत्यंत महत्वपूर्ण श्रेणियों की पहचान करने में सक्षम होना चाहिए, EVEN IF उन्हें एक सतत चर के रूप में कोडित किया गया है। एक आकस्मिक उदाहरण:

set.seed(42)
library(caret)
n <- 10000
a <- sample(1:100, n, replace=TRUE)
b <- sample(1:100, n, replace=TRUE)
e <- runif(n)
y <- 2*a + 1000*(b==7) + 500*(b==42) + 1000*e
dat1 <- data.frame(y, a, b)
dat2 <- data.frame(y, a, b=factor(b))

y एक सतत चर है, एक निरंतर चर है, और b एक श्रेणीगत चर है। हालांकि, dat1बी में निरंतर के रूप में माना जाता है।

इन 2 डेटासेट्स के लिए एक निर्णय ट्री फिटिंग, हम पाते हैं कि dat1इससे थोड़ा खराब है dat2:

model1 <- train(y~., dat1, method='rpart')
model2 <- train(y~., dat2, method='rpart')
> min(model1$results$RMSE)
[1] 302.0428
> min(model2$results$RMSE)
[1] 294.1411

यदि आप 2 मॉडल देखते हैं, तो आप पाएंगे कि वे बहुत समान हैं, लेकिन मॉडल 1 b == 42 के महत्व को याद करता है।

> model1$finalModel
n= 10000 

node), split, n, deviance, yval
      * denotes terminal node

 1) root 10000 988408000  614.0377  
   2) a< 42.5 4206 407731400  553.5374 *
   3) a>=42.5 5794 554105700  657.9563  
     6) b>=7.5 5376 468539000  649.2613 *
     7) b< 7.5 418  79932820  769.7852  
      14) b< 6.5 365  29980450  644.6897 *
      15) b>=6.5 53   4904253 1631.2920 *
> model2$finalModel
n= 10000 

node), split, n, deviance, yval
      * denotes terminal node

 1) root 10000 988408000  614.0377  
   2) b7< 0.5 9906 889387900  604.7904  
     4) a< 42.5 4165 364209500  543.8927 *
     5) a>=42.5 5741 498526600  648.9707  
      10) b42< 0.5 5679 478456300  643.7210 *
      11) b42>=0.5 62   5578230 1129.8230 *
   3) b7>=0.5 94   8903490 1588.5500 *

हालाँकि, model2 के समय के बारे में 1/10 में model1 चलता है:

> model1$times$everything
   user  system elapsed 
  4.881   0.169   5.058 
> model2$times$everything
   user  system elapsed 
 45.060   3.016  48.066 

आप निश्चित रूप से समस्या के मापदंडों को उन स्थितियों को खोजने के लिए जोड़ सकते हैं जिनमें dat2बहुत बेहतर प्रदर्शन dat1, या dat1थोड़ा बेहतर प्रदर्शन होता है dat2

मैं आमतौर पर श्रेणीबद्ध चर को निरंतर के रूप में मानने की वकालत नहीं कर रहा हूं, लेकिन मैंने ऐसी परिस्थितियां पाई हैं जहां ऐसा करने से मेरे मॉडल को फिट करने में लगने वाले समय में काफी कमी आई है, बिना उनकी भविष्यवाणी की सटीकता को कम किए।


3

इस विषय का एक बहुत अच्छा सारांश यहाँ पाया जा सकता है:

mijkerhemtulla.socsci.uva.nl पीडीएफ

"कब श्रेणीबद्ध चर को निरंतर माना जा सकता है? उप-इष्टतम परिस्थितियों में मजबूत सतत और श्रेणीबद्ध SEM आकलन विधियों की तुलना।"

मिजके रमतुल्ला, पेट्रीसिया t। ब्रूसो-लिआर्ड, और विक्टोरिया सावेली

वे ऐसा करने के लिए लगभग 60 पृष्ठों के तरीकों की जांच करते हैं और अंतर्दृष्टि प्रदान करते हैं कि यह कब करना उपयोगी है, कौन सा दृष्टिकोण लेना है, और आपकी विशिष्ट स्थिति को फिट करने के लिए प्रत्येक दृष्टिकोण के लिए क्या ताकत और कमजोरियां हैं। वे उन सभी को कवर नहीं करते हैं (जैसा कि मैं सीख रहा हूं कि यह एक असीम राशि है), लेकिन वे जो करते हैं वे अच्छी तरह से कवर करते हैं।


2

एक और मामला है जब यह समझ में आता है: जब डेटा को निरंतर डेटा से नमूना किया जाता है (उदाहरण के लिए एनालॉग-टू-डिजिटल कनवर्टर के माध्यम से)। पुराने साधनों के लिए ADCs अक्सर 10-बिट होता है, जो कि मुख्य रूप से 1024-श्रेणी के क्रमिक डेटा को देता है, लेकिन अधिकांश उद्देश्यों के लिए वास्तविक के रूप में माना जा सकता है (हालांकि पैमाने के निचले छोर के पास मूल्यों के लिए कुछ कलाकृतियां होंगी)। आज एडीसी 16 या 24-बिट से अधिक हैं। जब आप 65536 या 16777216 "श्रेणियों" पर बात कर रहे हैं, तब तक आपको वास्तव में डेटा को निरंतर मानने में कोई परेशानी नहीं होगी।


मैं आपकी निचली पंक्ति के साथ दृढ़ता से सहमत हूं, लेकिन यकीनन इस तरह के डेटा को शुरू करने के लिए कभी भी नियत नहीं किया गया था, बस विवेकपूर्ण। नाममात्र-ऑर्डिनल-अंतराल-अनुपात के घटिया उपचार यहां दोष देने के लिए होते हैं जो अक्सर इंगित नहीं करते हैं कि ऑर्डिनल असतत का अर्थ है, लेकिन इसके विपरीत नहीं। एक गणना क्रमबद्ध है, लेकिन यह अंतराल और अनुपात भी है।
निक कॉक्स

@ निक ऑर्डिनल का अर्थ है असतत? जरुरी नहीं। निरंतर उपाय क्रमिक हो सकते हैं। उदाहरण के लिए, जीएसपी या हृदय गति जैसे शारीरिक परिवर्तन निरंतर होते हैं, लेकिन चिंता या उत्तेजना जैसे मनोवैज्ञानिक चर के उपाय के रूप में वे केवल क्रमिक हैं। ऑर्डिनल बनाम अंतराल की धारणा वास्तव में उस फ़ंक्शन की रैखिकता को संदर्भित करती है जो माप से संबंधित है जो इसे मापने का इरादा है।
रे कोपमैन

यह एक दिलचस्प टिप्पणी है, लेकिन एक बार जब आप उस क्षेत्र में पहुंच जाते हैं तो मैं यह नहीं देखता कि आप वास्तव में चिंता के स्वतंत्र सबूत के बिना हृदय गति को कैसे वर्गीकृत कर सकते हैं और आखिरकार अधिकांश चर को इस प्रकार माना जाता है जो इस तरह से अप्राप्य हैं। क्या आप माप के पैमाने के संबंध में केवल ऑर्डिनल के लिए स्विच करते समय अंतराल या अनुपात डेटा के लिए तरीकों का उपयोग करने से इनकार करने के लिए इसे सभी तरह से लेंगे? मुझे नहीं लगता कि आप उनके साथ क्या करने का इरादा रखते हैं क्योंकि डेटा अलग तरह से व्यवहार करता है; मेरे लिए इस मुद्दे की बारी है।
निक कॉक्स

1
@ सवाल यह है कि क्या फ़ंक्शन जो मापा मूल्य को "सही" मान से संबंधित करता है, रैखिक के पास पर्याप्त रूप से है जो इसे इलाज करता है जैसे कि गलत ठोस निष्कर्ष नहीं होगा, या इसे केवल मोनोटोनिक के रूप में माना जाना चाहिए। निर्णय लेने के लिए आम तौर पर बहुत कम या कोई मुश्किल डेटा नहीं होता है; यह लगभग हमेशा एक निर्णय कॉल होगा, जिसके बारे में सूचित बुद्धिमान लोगों को असहमत होने के लिए सहमत होना पड़ सकता है।
रे कोपमैन

1
मुझे लगता है कि आंकड़ों में माप तराजू की चर्चाओं में सामान्य जोर चर के गणितीय गुणों पर है और प्रत्येक के लिए वैध गणितीय संचालन क्या हैं। यह विवादास्पद है। इस बारे में वैज्ञानिक चिंता कि क्या कुछ उपाय जो मुझे माना जाता है कि मैं सहज रूप से महत्वपूर्ण होने के लिए सहमत हूं, लेकिन मैं बहस के एक अलग क्षेत्र के रूप में देखता हूं।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.