मैं chisq.test()
आर में फ़ंक्शन में मोंटे कार्लो सिमुलेशन के उपयोग को समझना चाहता हूं ।
मेरे पास एक गुणात्मक चर है जिसमें 128 स्तर / कक्षाएं हैं। मेरे नमूने का आकार 26 है (मैं अधिक "व्यक्तियों" का नमूना लेने में सक्षम नहीं था)। तो जाहिर है, मैं 0 "व्यक्तियों" के साथ कुछ स्तर होगा। लेकिन तथ्य यह है कि मेरे पास 127 में से केवल बहुत ही कम संख्या में कक्षाएँ हैं। जैसा कि मैंने सुना है कि ची-स्क्वेर्ड टेस्ट को लागू करने के लिए हमारे पास प्रत्येक स्तर में कम से कम 5 व्यक्ति होने चाहिए (मुझे पूरी तरह से इसका कारण समझ में नहीं आता है), मैंने सोचा कि मुझे simulate.p.value
वितरण का अनुमान लगाने के लिए मोंटे कार्लो सिमुलेशन का उपयोग करने के लिए विकल्प का उपयोग करना होगा और पी-मान की गणना करें। मोंटे कार्लो सिमुलेशन के बिना, आर मुझे एक पी-मूल्य देता है < 1e-16
। मोंटे कार्लो सिमुलेशन के साथ, यह मुझे एक पी-मूल्य देता है 4e-5
।
मैंने 26 लोगों और 101 शून्य के वेक्टर के साथ पी-मान की गणना करने की कोशिश की, और मोंटे-कार्लो सिमुलेशन के साथ, मुझे 1 पर एक पी-मूल्य मिलता है।
क्या यह बताना ठीक है कि, भले ही मेरे नमूने का आकार संभावित वर्गों की संख्या की तुलना में छोटा है, लेकिन मनाया गया वितरण ऐसा है कि यह बहुत संभव नहीं है कि सभी संभावित कक्षाएं वास्तविक आबादी में समान संभावना (1/127) में मौजूद हों। ?