3 नमूनों के साथ अनुपात की समानता के लिए परिकल्पना परीक्षण


9

मेरे पास सेल फोन ग्राहक सूचना डेटा का एक डेटा सेट है जिसमें ट्वोकॉल्युमोंस हैं। पहले कॉलम में वह निश्चित श्रेणी होती है, जिसमें एक खाता (या तो ए, बी या सी) में होता है और दूसरा कॉलम में बाइनरी वैल्यू होती है, चाहे वह खाता रद्द किया गया हो। जैसे

A | cancelled
C | active
B | active
A | cancelled

मैं यह करना चाहता हूं कि यह परीक्षण करने के लिए किसी प्रकार की परिकल्पना परीक्षण के साथ आया है कि क्या प्रकार ए, बी और सी के खातों का अनुपात सक्रिय खातों बनाम रद्द किए गए खातों के लिए अलग है - शून्य परिकल्पना यह है कि वे समान हैं। तो यह अनुपात के लिए एक परिकल्पना परीक्षण की तरह है सिवाय मुझे नहीं पता कि यह 3 मूल्यों के लिए कैसे करना है


6
आप तीन समूहों के बीच अनुपात की समानता के परीक्षण के लिए a परीक्षण का उपयोग कर सकते हैं । χ2

मैं यह भी सोच रहा हूं कि मैं तीन परिकल्पना परीक्षण ए बनाम बी, बी बनाम सी और ए बनाम सी कर सकता हूं, यह देखने के लिए कि क्या वे अलग हैं
user1893354

5
आप कर सकते हैं, लेकिन इस बात से अवगत रहें कि आपको कई तुलनाओं की समस्याओं के लिए सही होना होगा।

आपके उत्तर के लिए धन्यवाद। मैं बस उत्सुक हूँ कि आप कई तुलनाओं की समस्याओं से क्या मतलब है? या, अधिक विशेष रूप से, तीन परिकल्पना परीक्षण विधि क्यों हानिकारक है। धन्यवाद!
user1893354

3
वे तीन परिकल्पना परीक्षणों का उपयोग करने के साथ दो समस्याएं हैं। सबसे पहले, वे अन्योन्याश्रित हैं क्योंकि प्रत्येक जोड़ी कुछ डेटा का पुन: उपयोग करती है। दूसरा, अगर वे वास्तव में स्वतंत्र थे, तो मौका है कि उनमें से कम से कम एक महत्वपूर्ण होगा भले ही शून्य सही हो - यानी, एक झूठी सकारात्मक त्रुटि का मौका - वांछित झूठ की तुलना में लगभग तीन गुना अधिक होगा सकारात्मक दर। दूसरी समस्या यह इंगित करती है कि परीक्षण को समायोजित करने की आवश्यकता है, लेकिन पहले से पता चलता है कि उपयुक्त समायोजन खोजने से समस्या हो सकती है। दृष्टिकोण इन समस्याओं से बचा जाता है। χ2
whuber

जवाबों:


13

मैं अपना उत्तर सामान्य रूप से देने और टिप्पणियों को सम्मिलित करने जा रहा हूं कि आपकी समस्या परीक्षण ढांचे में कैसे फिट होती है। सामान्य तौर पर, हम एक परीक्षण का उपयोग कर अनुपात की समानता के लिए परीक्षण कर सकते हैं, जहां विशिष्ट शून्य परिकल्पना, , निम्नलिखित है:χ2एच0

एच0:पी1=पी2==पी

यानी, सभी अनुपात एक-दूसरे के बराबर हैं। अब आपके मामले में आप निम्न परिकल्पना को शून्य कर रहे हैं:

एच0:पी1=पी2=पी3
और वैकल्पिक परिकल्पना
एच: एक पर पीमैं के लिए अलग है मैं=1,2,3

अब परीक्षण करने के लिए हमें निम्नलिखित परीक्षण आँकड़ों की गणना करने की आवश्यकता है: परीक्षण-आँकड़ा का मानχ2

χ2=Σमैं=1n(हेमैं-मैं)2मैं

कहाँ पे

  • χ2 = पियर्सन की संचयी परीक्षा स्टेटिस्टिक, जो asymptotically a वितरण से संपर्क करती हैχ2
  • हेमैं = देखी गई आवृत्ति
  • मैं = एक अपेक्षित (सैद्धांतिक) आवृत्ति, शून्य परिकल्पना द्वारा
  • n = तालिका में कोशिकाओं की संख्या

आपके मामले में चूंकि हम निम्न तालिका के रूप में इस समस्या के बारे में सोच सकते हैं: n=6यहाँ छवि विवरण दर्ज करें

अब एक बार जब हमारे पास परीक्षण आँकड़ा होगा तो हमारे पास दो विकल्प होंगे कि हम अपनी परिकल्पना परीक्षण को कैसे पूरा करें।

विकल्प 1) हम अपने परीक्षण स्थैतिक को शून्य परिकल्पना के तहत उपयुक्त महत्वपूर्ण मान से तुलना कर सकते हैं । यह कहना है, यदि सत्य है, तो पंक्तियों और कॉलम वाली आकस्मिक तालिका से a आँकड़ा होना चाहिए साथ वितरण डिग्री स्वतंत्रता। हमारे महत्वपूर्ण मान गणना करने के बाद यदि हमारे पास वह तो हम अशक्त परिकल्पना को अस्वीकार कर देंगे। जाहिर है अगर तो हम अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं। χ2एच0χ2आरसीχ2(आर-1)×(सी-1)χ*χ2>χ*χ2χ*

रेखांकन (सभी संख्याएँ बनी हैं) यह निम्नलिखित है: यहाँ छवि विवरण दर्ज करें

ग्राफ से, यदि हमारी परीक्षा स्टेटिस्टिक ब्लू टेस्ट स्टेटिस्टिक से मेल खाती है, तो हम अशक्त परिकल्पना को अस्वीकार करने में असफल होंगे क्योंकि यह परीक्षण सांख्यिकीय महत्वपूर्ण क्षेत्र के अंदर नहीं आता है (यानी, )। वैकल्पिक रूप से, ग्रीन टेस्ट स्टेटिस्टिक महत्वपूर्ण क्षेत्र के अंदर आता है और इसलिए हम इस परिकल्पना को अस्वीकार कर देंगे कि हमने ग्रीन टेस्ट स्टेटिस्टिक की गणना की थी।χ2χ2<χ*

आपके उदाहरण में, आपकी स्वतंत्रता की डिग्री

=(आर-1)×(सी-1)=(2-1)×(3-1)=1×2=2

विकल्प 2) हम n-परिकल्पना के तहत परीक्षण आँकड़ा से जुड़े पी-मान की गणना कर सकते हैं और यदि यह पी-वैल्यू कुछ निर्दिष्ट लेवल से कम है तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं। यदि पी-मान स्तर से अधिक है तो हम अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं। ध्यान दें कि पी-मान यह संभावना है कि a वितरण परीक्षण आँकड़ा से अधिक है।ααχ(आर-1)×(सी-1)2

रेखांकन हमारे पास है यहाँ छवि विवरण दर्ज करें

जहां पी-मान की गणना उस क्षेत्र के रूप में की जाती है जो हमारे परीक्षण सांख्यिकीय (उदाहरण में नीला छायांकित क्षेत्र) से अधिक है।

इसलिए, अगर तो शून्य परिकल्पना को अस्वीकार करने में विफल रहता है , अन्यथाα>पी-मूल्यएच0

अगर शून्य परिकल्पना को अस्वीकार करते हैंαपी-मूल्यएच0

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.