ची-चुकता परीक्षण के लिए पी-मानों के मोंटे कार्लो सिमुलेशन को लागू करने के लिए नियम


9

मैं chisq.test()आर में फ़ंक्शन में मोंटे कार्लो सिमुलेशन के उपयोग को समझना चाहता हूं ।

मेरे पास एक गुणात्मक चर है जिसमें 128 स्तर / कक्षाएं हैं। मेरे नमूने का आकार 26 है (मैं अधिक "व्यक्तियों" का नमूना लेने में सक्षम नहीं था)। तो जाहिर है, मैं 0 "व्यक्तियों" के साथ कुछ स्तर होगा। लेकिन तथ्य यह है कि मेरे पास 127 में से केवल बहुत ही कम संख्या में कक्षाएँ हैं। जैसा कि मैंने सुना है कि ची-स्क्वेर्ड टेस्ट को लागू करने के लिए हमारे पास प्रत्येक स्तर में कम से कम 5 व्यक्ति होने चाहिए (मुझे पूरी तरह से इसका कारण समझ में नहीं आता है), मैंने सोचा कि मुझे simulate.p.valueवितरण का अनुमान लगाने के लिए मोंटे कार्लो सिमुलेशन का उपयोग करने के लिए विकल्प का उपयोग करना होगा और पी-मान की गणना करें। मोंटे कार्लो सिमुलेशन के बिना, आर मुझे एक पी-मूल्य देता है < 1e-16। मोंटे कार्लो सिमुलेशन के साथ, यह मुझे एक पी-मूल्य देता है 4e-5

मैंने 26 लोगों और 101 शून्य के वेक्टर के साथ पी-मान की गणना करने की कोशिश की, और मोंटे-कार्लो सिमुलेशन के साथ, मुझे 1 पर एक पी-मूल्य मिलता है।

क्या यह बताना ठीक है कि, भले ही मेरे नमूने का आकार संभावित वर्गों की संख्या की तुलना में छोटा है, लेकिन मनाया गया वितरण ऐसा है कि यह बहुत संभव नहीं है कि सभी संभावित कक्षाएं वास्तविक आबादी में समान संभावना (1/127) में मौजूद हों। ?


3
यदि आपका डेटा वास्तव में है कि आपने 26 अलग-अलग वर्गों को 26 के नमूने में से देखा है, तो आपके पास अनिवार्य रूप से परिकल्पना के खिलाफ कोई सबूत नहीं है कि सभी 127 वर्गों में समान संभावना है। यह एक बहुराष्ट्रीय वितरण गणना के साथ मूल्यांकन किया जा सकता है।
whuber

1
" जैसा कि मैंने सुना है कि ची-स्क्वेर्ड टेस्ट को लागू करने के लिए हमें प्रत्येक स्तर में कम से कम 5 व्यक्ति होने चाहिए (मैं उस कारण को पूरी तरह से समझ नहीं पाया हूं " ) - बिल्कुल नहीं। मूल सलाह यह थी कि अपेक्षित गणना, वास्तविक गिनती कम से कम 5. नहीं होनी चाहिए। उस (अब लंबे समय से पुराने) नियम का उद्देश्य यह सुनिश्चित करने का प्रयास करना था कि ची-स्क्वायर वितरण असतत वितरण के लिए एक उचित सन्निकटन है। परीक्षण के आंकड़े। पिछले 4 दशकों में कागजों के एक समूह में सलाह या 'ऐसा नियम कुछ हद तक सख्त है'।
Glen_b -Reinstate मोनिका

जवाबों:


6

खोज से, ऐसा लगता है कि मोंटे-कार्लो सिमुलेशन का बिंदु बेतरतीब ढंग से उत्पन्न नमूनों के आधार पर एक संदर्भ वितरण का उत्पादन करना है, जिसका परीक्षण किए गए नमूने के समान आकार होगा, ताकि परीक्षण की स्थिति संतुष्ट नहीं होने पर पी-मूल्यों की गणना की जा सके।

यह होप ए। जे। रॉयल स्टेट सोसायटी सीरीज़ बी (1968) में बताया गया है जो JSTOR पर पाया जा सकता है ।

यहाँ होप पेपर से एक प्रासंगिक उद्धरण है:

मोंटे-कार्लो महत्व परीक्षण प्रक्रियाओं की परिकल्पना के अनुसार उत्पन्न यादृच्छिक नमूनों के साथ देखे गए डेटा की तुलना से मिलकर बनता है। ... मोंटे-कार्लो परीक्षण प्रक्रिया के बजाय अच्छी दक्षता के एक ज्ञात परीक्षण का उपयोग करना बेहतर है, यह मानते हुए कि वैकल्पिक सांख्यिकीय परिकल्पना पूरी तरह से निर्दिष्ट की जा सकती है। हालांकि, इस तरह के परीक्षण का उपयोग करना हमेशा संभव नहीं होता है क्योंकि परीक्षण को लागू करने के लिए आवश्यक शर्तें संतुष्ट नहीं हो सकती हैं, या अंतर्निहित वितरण अज्ञात हो सकता है या उचित परीक्षण मानदंड पर निर्णय लेना मुश्किल हो सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.