दो रैपरों के बीच समझौते को मापने के लिए कोप्पा [1] द्वारा 1960 में कप्पा ( ) को पेश किया गया था। हालाँकि, इसका विचरण काफी समय से विरोधाभासों का स्रोत रहा था।
मेरा सवाल यह है कि बड़े नमूनों के साथ उपयोग किए जाने वाला सबसे अच्छा विचरण गणना कौन सा है। मुझे विश्वास है कि फ्लीस [2] द्वारा परीक्षण और सत्यापित किया गया एक सही विकल्प होगा, लेकिन यह केवल वही प्रकाशित नहीं लगता है जो सही प्रतीत होता है (और हाल ही के साहित्य में इसका उपयोग किया गया है)।
अभी मेरे पास इसके विषम बड़े नमूना विचरण की गणना करने के दो ठोस तरीके हैं:
- फ्लेश, कोहेन और एवरिट [2] द्वारा प्रकाशित सही विधि;
- डेल्टा विधि जो कि कॉलगैटन, 2009 [4] (पृष्ठ 106) द्वारा पुस्तक में पाई जा सकती है।
इस भ्रम की कुछ व्याख्या करने के लिए, यहाँ फ्लेश, कोहेन और एवरिट द्वारा उद्धरण [2], मेरा जोर दिया गया है:
अंतिम सफलता प्राप्त करने से पहले कई मानव प्रयासों को बार-बार विफलताओं के साथ शापित किया गया है। माउंट एवरेस्ट की स्केलिंग इसका एक उदाहरण है। नॉर्थवेस्ट पैसेज की खोज एक सेकंड है। कप्पा के लिए एक सही मानक त्रुटि की व्युत्पत्ति एक तिहाई है ।
तो, यहाँ क्या हुआ का एक छोटा सा सारांश है:
- 1960: कोहेन ने अपने पेपर "नाममात्र के तराजू के लिए समझौते का गुणांक" प्रकाशित किया [1] जिसमें दो रैपरों के बीच समझौते का मौका-सही उपाय पेश किया गया, जिसे कहा जाता है । हालाँकि, वह विचरण गणना के लिए गलत सूत्र प्रकाशित करता है।
- 1968: एवरिट ने उन्हें ठीक करने का प्रयास किया, लेकिन उनके सूत्र भी गलत थे।
- 1969: फ्लेस, कोहेन और एवरिट ने पेपर में बड़े फॉर्मूले "काप्पा और वेटेड कप्पा के बड़े सैंपल स्टैंडर्ड एरर्स" [2] में सही फॉर्मूले प्रकाशित किए।
- 1971: फ्लीस ने एक और नाम के तहत एक और आँकड़ा (लेकिन एक अलग) प्रकाशित किया , जिसमें चर के लिए गलत सूत्र हैं।
- 1979: फ्लीस नी और लैंडिस ने फ्लीस के के सही फॉर्मूले प्रकाशित किए ।
सबसे पहले, निम्नलिखित संकेतन पर विचार करें। यह अंकन का तात्पर्य है कि सारांश ऑपरेटर को उन सभी तत्वों पर लागू किया जाना चाहिए जिस पर डॉट रखा गया है:
अब, कप्पा की गणना कर सकते हैं:
जिसमें
मनाया गया प्रस्ताव है, और
मौका समझौता है।
अब तक, कोहेन के के लिए सही विचरण गणना निम्न द्वारा दी गई है:
और शून्य परिकल्पना के तहत यह इसके द्वारा दिया गया है:
वैरिएंट्स प्राप्त करने के लिए डेल्टा विधि के आधार पर कॉन्ग्ल्टन की विधि लगती है (एग्रेस्टी, 1990; एगेस्टी, 2002); हालाँकि, मुझे यकीन नहीं है कि डेल्टा विधि क्या है या इसका उपयोग क्यों किया जाना है। विचरण, इस पद्धति के अंतर्गत, द्वारा दिया जाता है:
जिसमें
(Congalton एक का उपयोग करता है की तुलना में एक नहीं बल्कि सबस्क्रिप्ट , लेकिन यह एक ही बात मतलब है लगता है। इसके अलावा, मुझे लगता है कि मान रहा हूँ एक गिनती मैट्रिक्स, होना चाहिए यानी नमूनों की संख्या के रूप में से विभाजित किए जाने से पहले भ्रम मैट्रिक्स सूत्र ) से संबंधित
एक और अजीब हिस्सा यह है कि कोलगटन की किताब कोहेन द्वारा मूल पेपर का उल्लेख करती है, लेकिन फ्लेस एट अल द्वारा प्रकाशित कप्पा संस्करण में सुधारों का हवाला नहीं देती है, जब तक कि वह भारित कप्पा पर चर्चा करने के लिए नहीं जाती। शायद उनका पहला प्रकाशन तब लिखा गया था जब कप्पा का असली फॉर्मूला अभी भी भ्रम में था?
क्या कोई यह समझाने में सक्षम है कि वे अंतर क्यों हैं? या कोई व्यक्ति फ्लेस द्वारा सही किए गए संस्करण के बजाय डेल्टा विधि के विचरण का उपयोग क्यों करेगा?
[१]: फ्लेस, जोसेफ एल।; कोहेन, जैकब; एवरिट, बीएस; कप्पा और भारित कप्पा की बड़ी नमूना मानक त्रुटियां। मनोवैज्ञानिक बुलेटिन, वॉल्यूम 72 (5), नवंबर 1969, 323-327। doi: 10.1037 / h0028106
[२]: कोहेन, जैकब (१ ९ ६०)। नाममात्र माप के लिए समझौते का एक गुणांक। शैक्षिक और मनोवैज्ञानिक मापन 20 (1): 37-46। DOI: 10.1177 / 001316446002000104।
[३]: एलन एगेस्टी, श्रेणीबद्ध डेटा विश्लेषण, दूसरा संस्करण। जॉन विली एंड संस, 2002।
[४]: रसेल जी। कांगाल्टन और ग्रीन, के .; सुदूर स्थित डेटा की सटीकता का आकलन: सिद्धांत और व्यवहार, दूसरा संस्करण। 2009।