@ सिल्वरफ़िश ने पोलैटअल्मर द्वारा जवाब का विस्तार करने के लिए कहा, जो नहीं दिया गया था, इसलिए मैं यहां पर इसका विस्तार करने की कोशिश करूंगा।
नाम चिसकुरे दूरी क्यों? आकस्मिक तालिकाओं के लिए चिस्क्वारे परीक्षण
इसलिए विचार इस फ़ॉर्म को रखने और इसे के रूप में उपयोग करने के लिए है दूरी माप। यह ओपी का तीसरा सूत्र देता है, जिसमें व्याख्या रूप में की जाती है और अपेक्षा के अनुसार होती है, जो कि पोलटअलेमर की टिप्पणी "इसे असतत संभावना वितरण में उपयोग किया जाता है", उदाहरण के लिए फिट परीक्षण की भलाई में। यह तीसरा रूप कोई दूरस्थ कार्य नहीं है, क्योंकि यह चर और में असममित है । हिस्टोग्राम तुलना के लिए, हम एक दूरी फ़ंक्शन चाहते हैं जो और में सममित है एक्समैंyमैंएक्सyएक्सy1
χ2=∑cells(Oi−Ei)2Ei
xiyixyxy, और दो पहले रूप यह देते हैं। उनके बीच का अंतर केवल एक स्थिर कारक , जो तब तक महत्वहीन है जब तक कि आप सिर्फ एक रूप को लगातार चुनते हैं (हालांकि अतिरिक्त फैक्टर वाला संस्करण बेहतर है यदि आप असममित रूप से तुलना करना चाहते हैं)। चुकता यूक्लिडियन दूरी के साथ इन योगों में समानता पर ध्यान दें, यह संयोग नहीं है, chisquare दूरी
भारित यूक्लिडियन दूरी का एक प्रकार है । इस कारण से, ओपी में सूत्र आमतौर पर
दूरी प्राप्त करने के लिए एक रूट साइन के तहत रखे जाते हैं । निम्नलिखित में हम इसका अनुसरण करते हैं।
१1212
Chisquare दूरी का उपयोग पत्राचार विश्लेषण में भी किया जाता है। वहां इस्तेमाल किए गए फॉर्म के संबंध को देखने के लिए, पंक्तियों और कॉलम के साथ एक आकस्मिक तालिका की कोशिकाएं । पंक्ति योग को और कॉलम योगों । पंक्तियों के बीच की chisquare दूरी को
केवल दो पंक्तियों (दो हिस्टोग्राम) के साथ मामले के लिए, यह ओपी के पहले सूत्र (मूल चिह्न को मापता है) को ठीक करता है। आर सी एक्स + j = Σ मैं एक्स मैं j एक्स मैं + = Σ जे एक्स मैं जे एल , कश्मीर χ 2 ( एल , कश्मीर ) = √xijRCx+j=∑ixijxi+=∑jxijl,k
χ2(l,k)=∑j1x+j(xljxl+−xkjxk+)2−−−−−−−−−−−−−−−−−−−⎷
EDIT
नीचे दी गई टिप्पणियों में सवाल का जवाब देना: चिस्करे की दूरी की लंबी चर्चा के साथ एक पुस्तक माइकल कॉनकेरे (चैपमैन एंड हॉल) द्वारा "कॉरस्पेन्डेंस एनालिसिस इन प्रैक्टिस (दूसरा संस्करण)" है। यह एक अच्छी तरह से स्थापित नाम है, जो आकस्मिक तालिकाओं के साथ प्रयोग करने के लिए इसकी समानता से लेकर चिसक्वेयर तक आता है। इसका क्या वितरण है? मैंने कभी भी इसका अध्ययन नहीं किया है, लेकिन शायद (कुछ शर्तों के तहत ...) इसमें कुछ चस्क्वार वितरण, लगभग होगा। सबूत जो आकस्मिक तालिकाओं के साथ किया जाता है के समान होना चाहिए, पत्राचार विश्लेषण के बारे में अधिकांश साहित्य वितरण सिद्धांत में नहीं जाता है। एक पेपर, जिसमें कुछ हो सकता है, शायद इस तरह का सिद्धांत प्रासंगिक है http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 । और देखेंइस साइट पर कुछ अन्य प्रासंगिक पोस्ट के लिए /stats//search?q=%22chisquare+distance%22 ।