मेरे पास डेटा के तीन समूह हैं, प्रत्येक एक द्विपद वितरण (यानी प्रत्येक समूह में ऐसे तत्व हैं जो या तो सफलता या विफलता हैं)। मेरे पास सफलता की अनुमानित संभावना नहीं है, लेकिन इसके बजाय केवल प्रत्येक की सफलता दर पर भरोसा कर सकते हैं जो कि सही सफलता दर के लिए अनुमानित है। मुझे केवल यह सवाल मिला है , जो करीब है लेकिन इस परिदृश्य से बिल्कुल नहीं लगता है।
परीक्षण को सरल बनाने के लिए, आइए यह कहें कि मेरे पास 2 समूह हैं (3 को इस बेस केस से बढ़ाया जा सकता है)।
- समूह 1 परीक्षण: = 2455
- समूह 2 परीक्षण: = 2730
- समूह 1 सफलता: = 1556
- समूह 2 की सफलता: = 1671
मेरे पास अपेक्षित सफलता की संभावना नहीं है, केवल मैं नमूनों से जानता हूं। तो दो समूहों के लिए मेरी निहित सफलता दर है:
- समूह 1 की सफलता दर: = 1556/2455 = 63.4%
- समूह 2 की सफलता दर: = 1671/2730 = 61.2%
प्रत्येक नमूने की सफलता दर काफी करीब है। हालाँकि मेरे नमूने का आकार भी काफी बड़ा है। अगर मैं द्विपद वितरण के सीडीएफ की जांच करता हूं तो यह देखने के लिए कि यह पहले से कितना अलग है (जहां मैं पहली बार शून्य परीक्षण कर रहा हूं) मुझे बहुत कम संभावना है कि दूसरा हासिल किया जा सके।
एक्सेल में:
1-BINOM.DIST (1556,2455,61.2%, TRUE) = 0.012
हालांकि, यह पहले परिणाम के किसी भी रूपांतर को ध्यान में नहीं रखता है, यह सिर्फ यह मानता है कि पहला परिणाम परीक्षण की संभावना है।
क्या यह परीक्षण करने का एक बेहतर तरीका है कि क्या डेटा के ये दो नमूने वास्तव में एक दूसरे से सांख्यिकीय रूप से भिन्न हैं?
prop.test
: prop.test(c(1556, 1671), c(2455, 2730))
।