क्या गैर-यादृच्छिक नमूनों का मानक सांख्यिकीय परीक्षणों का उपयोग करके विश्लेषण किया जा सकता है?


24

कई नैदानिक ​​अध्ययन गैर-यादृच्छिक नमूनों पर आधारित हैं। हालांकि, अधिकांश मानक परीक्षण (जैसे टी-परीक्षण, एनोवा, रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन) इस धारणा पर आधारित हैं कि नमूनों में "यादृच्छिक संख्या" होती है। क्या परिणाम मान्य हैं यदि इन गैर-यादृच्छिक नमूनों का मानक परीक्षणों द्वारा विश्लेषण किया गया था? धन्यवाद।

जवाबों:


20

परीक्षण के लिए दो सामान्य मॉडल हैं। पहले वाले को आबादी से यादृच्छिक नमूना लेने की धारणा के आधार पर, आमतौर पर "जनसंख्या मॉडल" कहा जाता है।

उदाहरण के लिए, दो-स्वतंत्र नमूनों के टी-टेस्ट के लिए, हम मानते हैं कि हम जिन दो समूहों की तुलना करना चाहते हैं, वे संबंधित आबादी के यादृच्छिक नमूने हैं। यह मानते हुए कि दो समूहों के भीतर स्कोर के वितरण को आम तौर पर आबादी में वितरित किया जाता है, हम तब विश्लेषणात्मक रूप से परीक्षण सांख्यिकीय (यानी, टी-स्टेटिस्टिक के लिए) का नमूना वितरण प्राप्त कर सकते हैं। विचार यह है कि अगर हम इस प्रक्रिया को दोहराते हैं (संबंधित आबादी से यादृच्छिक रूप से दो नमूने खींचते हैं) तो अनंत बार (निश्चित रूप से, हम वास्तव में ऐसा नहीं करते हैं), हम परीक्षण सांख्यिकीय के लिए इस नमूना वितरण को प्राप्त करेंगे।

परीक्षण के लिए एक वैकल्पिक मॉडल "रैंडमाइजेशन मॉडल" है। यहां, हमें यादृच्छिक नमूने की अपील नहीं करनी है। इसके बजाय, हम अपने नमूनों के क्रमपरिवर्तन के माध्यम से एक यादृच्छिक वितरण प्राप्त करते हैं।

उदाहरण के लिए, टी-टेस्ट के लिए, आपके पास आपके दो नमूने हैं (जरूरी नहीं कि यादृच्छिक नमूने के माध्यम से प्राप्त किए जाएं)। अब अगर वास्तव में इन दो समूहों के बीच कोई अंतर नहीं है, तो क्या एक विशेष व्यक्ति वास्तव में समूह 1 या समूह 2 के लिए "संबंधित" है, मनमाना है। इसलिए, हम क्या कर सकते हैं समूह असाइनमेंट को बार-बार अनुमति देने के लिए, हर बार यह देखते हुए कि दो समूहों के साधन अलग-अलग हैं। इस तरह, हम अनुभवजन्य रूप से एक नमूना वितरण प्राप्त करते हैं। फिर हम तुलना कर सकते हैं कि मूल नमूनों में दो साधन कितने दूर हैं (इससे पहले कि हम समूह सदस्यता में फेरबदल करना शुरू कर दें) और अगर यह अंतर "चरम" है (यानी, अनुभवजन्य रूप से व्युत्पन्न नमूना वितरण की पूंछ में गिर जाता है), तो हम निष्कर्ष निकालते हैं वह समूह सदस्यता मनमानी नहीं है और वास्तव में दोनों समूहों के बीच अंतर है।

कई स्थितियों में, दोनों दृष्टिकोण वास्तव में एक ही निष्कर्ष पर पहुंचते हैं। एक तरह से जनसंख्या मॉडल पर आधारित दृष्टिकोण को रैंडमाइजेशन टेस्ट के एक अनुमान के रूप में देखा जा सकता है। दिलचस्प बात यह है कि फिशर वह था जिसने रैंडमाइजेशन मॉडल का प्रस्ताव रखा था और सुझाव दिया था कि यह हमारे इनफॉर्म्स का आधार होना चाहिए (क्योंकि ज्यादातर सैंपल रैंडम सैंपलिंग के जरिए नहीं मिलते हैं)।

दो दृष्टिकोणों के बीच अंतर बताने वाला एक अच्छा लेख है:

अर्न्स्ट, एमडी (2004)। क्रमपरिवर्तन विधि: सटीक अनुमान के लिए एक आधार। सांख्यिकीय विज्ञान, 19 (4), 676-685 (लिंक)

एक अन्य लेख जो एक अच्छा सारांश प्रदान करता है और सुझाव देता है कि रैंडमाइजेशन दृष्टिकोण हमारे इनफॉर्म्स का आधार होना चाहिए:

लुडब्रुक, जे।, और डडले, एच। (1998)। क्यों बायोमेडिकल रिसर्च में टी और एफ परीक्षणों से क्रमपरिवर्तन परीक्षण बेहतर हैं। अमेरिकी सांख्यिकीविद्, 52 (2), 127-132 (लिंक)

संपादित करें: मुझे यह भी जोड़ना चाहिए कि जनसंख्या मॉडल के तहत रैंडमाइजेशन दृष्टिकोण का उपयोग करते समय एक ही परीक्षण सांख्यिकीय की गणना करना आम है। इसलिए, उदाहरण के लिए, दो समूहों के बीच के साधनों में अंतर का परीक्षण करने के लिए, एक समूह की सदस्यता के सभी संभावित क्रमपरिवर्तन के लिए सामान्य टी-आँकड़ा की गणना करेगा (अशक्त परिकल्पना के तहत अनुभवजन्य व्युत्पन्न नमूना वितरण का उत्पादन) और फिर एक जाँच करेगा कि कैसे चरम मूल समूह सदस्यता के लिए t-आँकड़ा उस वितरण के अंतर्गत है।


8

आपका प्रश्न बहुत अच्छा है, लेकिन इसका सीधा जवाब नहीं है।

आपके द्वारा उल्लेख किए गए अधिकांश परीक्षण इस धारणा पर आधारित हैं कि एक नमूना एक यादृच्छिक नमूना है, क्योंकि एक यादृच्छिक नमूना नमूना आबादी का प्रतिनिधि होने की संभावना है। यदि धारणा अमान्य है, तो परिणामों की किसी भी व्याख्या को ध्यान में रखना होगा। जब नमूना आबादी का बहुत गैर-प्रतिनिधि है तो परिणाम भ्रामक होने की संभावना है। जब नमूना गैर-यादृच्छिक होने के बावजूद प्रतिनिधि है तो परिणाम पूरी तरह से ठीक होंगे।

सवाल का अगला स्तर यह पूछना है कि कोई यह कैसे तय कर सकता है कि गैर-यादृच्छिकता किसी विशेष मामले में मायने रखती है या नहीं। मैं जवाब नहीं दे सकता कि एक ;-)


5

आप बहुत सामान्य प्रश्न पूछते हैं, इसलिए उत्तर सभी मामलों के लिए उपयुक्त नहीं हो सकता है। हालाँकि, मैं स्पष्ट कर सकता हूँ। सांख्यिकीय परीक्षण आम तौर पर एक काल्पनिक वितरण (तथाकथित अशक्त वितरण या अशक्त परिकल्पना; या, कुछ मामलों में, एक वैकल्पिक वितरण) बनाम वितरण के साथ करना होता है। नमूने गैर-यादृच्छिक हो सकते हैं, लेकिन परीक्षण किया जा रहा है नमूनों से प्राप्त कुछ मूल्य पर लागू किया जाता है। यदि उस चर में कुछ स्टोकेस्टिक गुण हो सकते हैं, तो इसके वितरण की तुलना कुछ वैकल्पिक वितरण से की जाती है। तब क्या मायने रखता है कि क्या नमूने का परीक्षण आँकड़ा ब्याज की कुछ अन्य आबादी के लिए होगा या नहीं और वैकल्पिक या अशक्त वितरण के संबंध में धारणाएं ब्याज की अन्य आबादी के लिए प्रासंगिक हैं या नहीं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.