DoE के बारे में फिशर के उद्धरण का वास्तविक चित्रण करना


13

मेरी टीम और मैं प्रयोगों के डिजाइन की उपयोगिता के बारे में कंपनी के गैर-सांख्यिकीविदों को एक प्रस्तुति देना चाहते हैं। ये गैर-सांख्यिकीविद भी हमारे ग्राहक हैं और वे आमतौर पर अपना डेटा एकत्र करने से पहले हमसे सलाह नहीं लेते हैं। क्या आप कुछ वास्तविक उदाहरणों को जानते हैं जो फिशर के प्रसिद्ध उद्धरण को अच्छी तरह से चित्रित करेंगे "प्रयोग के बाद सांख्यिकीविद् को कॉल करने के लिए, पोस्टमार्टम परीक्षा करने के लिए उनसे पूछने के अलावा और कुछ नहीं हो सकता है: वह केवल यह कहने में सक्षम हो सकता है कि प्रयोग क्या मर गया का।" ? अधिमानतः हम एक औद्योगिक / दवा / जैविक संदर्भ में दृष्टांत की तलाश कर रहे हैं। हम एक अनिर्णायक सांख्यिकीय विश्लेषण के एक उदाहरण के बारे में सोचते हैं जो सफल हो सकता था अगर यह प्रारंभिक अच्छी तरह से डिजाइन किया गया होता, लेकिन शायद अन्य संभावित चित्र भी हैं।



धन्यवाद। मेरी टीम के पिछले बॉस के पास शायद यह किताब है।
स्टीफन लॉरेंट

@onestop मेरे हाथ में किताब है। जिस अध्याय की आप बात कर रहे हैं, वह क्या है? मेरे पास पुस्तक का दूसरा संस्करण है और पी 47 पर कुछ भी नहीं है।
स्टीफन लॉरेंट

हम्म, लगता है कि मैं ऊपर Google पुस्तकें लिंक पर 4 वें संस्करण को देख रहा था। अध्याय 3 में 'एक्सपेरिमेंटल डिज़ाइन', 'कलेक्टिंग डेटा' नामक एक सेक्शन है।
onstop

जवाबों:


12

मैंने उन डिज़ाइनों में भाग लिया है जहाँ प्रयोग करने वाला व्यक्ति विषय प्रभावों के बीच परीक्षण करना चाहता था लेकिन विषय प्रभावों के लिए डिज़ाइन अधिक उपयुक्त था।

उदाहरण के लिए, एक प्रयोग में 8 चूहों, आहार ए पर चार और आहार बी पर चार शामिल थे, और चूहे का वजन प्रत्येक दिन चार सप्ताह तक मापा गया था। यह ठीक था यदि वे प्रत्येक आहार के समय प्रभाव में रुचि रखते थे लेकिन लक्ष्य आहार में अंतर की जांच करना था।

उन्होंने प्रत्येक चूहे को मापने के लिए 28 बार सोचा था कि उनके पास बहुत सारे आंकड़े हैं, लेकिन आहार प्रभाव के लिए प्रायोगिक इकाई चूहा था, जिसके पास प्रत्येक उपचार के लिए केवल 4 थे। वे चूहों को दिन में 10 बार माप सकते थे लेकिन इससे कोई फर्क नहीं पड़ता था, अंत में उन्हें अधिक चूहों की आवश्यकता थी।


5
(+1) मुझे संदेह है कि अधिक चूहों की आवश्यकता और इच्छा के संबंध में चिकित्सा अनुसंधान मानव प्रयासों में लगभग अकेला है।
कार्डिनल

1
मैं लैंकेनौ में बहुत सारे प्रयोगशाला प्रयोगों में शामिल होता हूं और नमूना आकार हमेशा छोटे होते हैं और चूहों या चूहों को शामिल करते हैं।
माइकल आर। चेरनिक

प्रयोगशाला प्रयोगों को करते समय जानवरों की अक्सर बलि दी जाती है और मुझे लगता है कि एक कारण है कि वे जानवरों की संख्या को यथासंभव कम रखने की कोशिश करते हैं। लेकिन ऐसी परिस्थितियों में आप सार्थक निष्कर्ष निकालने के लिए पर्याप्त लेना चाहेंगे।
माइकल आर। चेरनिक

7

मैंने नेशनल फाउंडेशन फ़ॉर सेलियाक अवेयरनेस नामक एक संगठन के लिए कुछ काम किया। संगठन सीलिएक रोग के बारे में जनता की जागरूकता को बढ़ावा देता है और रोग के लक्षणों की एक चेकलिस्ट प्रदान करता है जिसमें लस युक्त खाद्य पदार्थों के लिए असहिष्णुता शामिल है। उन्होंने इंटरनेट पर एक सर्वेक्षण किया, जिसमें भाग लेना चाहते थे। वर्षों में उन्होंने जनता से हजारों प्रतिक्रियाएं एकत्र कीं। हालाँकि वे सर्वेक्षण परिणामों के आधार पर आम जनता के बारे में निष्कर्ष निकालने की उम्मीद कर रहे थे। मुझे उन्हें बताना था कि उत्तरदाताओं को यादृच्छिक के बजाय आत्मनिर्भर किया गया था और यह पूर्वाग्रह पैदा कर सकता है। चूंकि पूर्वाग्रह की डिग्री अज्ञात है, इसलिए हम बड़ी मात्रा में डेटा के संबंध में कोई अनुमान नहीं लगा सकते हैं।

अब उत्तरदाताओं को एक अजीबोगरीब समूह लग रहा था। कई बहुत गंभीर हैं और चिंता व्यक्त करने के लिए उत्तर दिया गया है कि उन्हें या किसी रिश्तेदार को बीमारी हो सकती है। लेकिन एक बुद्धिमान व्यक्ति के फैशन में जवाब देने वाले लोगों की एक विकृत संख्या भी थी। यह नकली नामों, अजीब ईमेल पते और डाक पते से स्पष्ट था जो उन्होंने अपने जवाबों के साथ प्रदान किए थे।

मैंने महसूस किया कि डेटा केवल एक खोजपूर्ण अर्थ में उपयोगी था और प्रतिक्रियाओं की आवृत्ति उन परिकल्पनाओं के लिए उपयोगी हो सकती है जिन्हें एक सुनियोजित भविष्य के सर्वेक्षण में परीक्षण किया जा सकता है। लेकिन इस प्रकार अब तक मेरी सलाह पर ध्यान नहीं दिया गया है और वे इंटरनेट पर स्वयं का चयन करने के लिए इनमें से एक आसान काम कर रहे हैं।


(+1) अच्छा उदाहरण। कभी-कभी ग्राहक बहुत विशिष्ट नमूने एकत्र करते हैं लेकिन वे पूरी आबादी के बारे में निष्कर्ष निकालना चाहते हैं।

इस दिलचस्प उदाहरण के लिए धन्यवाद (लेकिन यह मेरे गैर-सांख्यिकीविदों सहयोगियों के लिए उपयुक्त नहीं है)
स्टीफन लॉरेंट

@ StéphaneLaurent हाँ यह नहीं है? यह एक चिकित्सा अध्ययन के लिए खराब डिजाइन के साथ करना है।
माइकल आर। चेरिक

हाँ माइकल, लेकिन मेरे ग्राहक कभी सर्वेक्षण नहीं करते।
स्टीफन लॉरेंट

@ StéphaneLaurent यादृच्छिकता की कमी के कारण विचार पूर्वाग्रह का सिद्धांत है। यह बहुत हद तक उसी तरह प्रयोगों और सर्वेक्षणों पर लागू होता है।
माइकल आर। चेर्निक

6

कुछ समय पहले मुझे एक प्रयोग के परिणामों का विश्लेषण करने के लिए कहा गया था कि कैसे फोटोवोल्टिक सौर सरणी के रात के भंडारण की स्थिति उस दर को प्रभावित करती है जिस पर मिट्टी जमा होती है। (ये बड़े ध्यान केंद्रित करने वाले फोटोवोल्टिक सरणियां पूरे दिन सूरज को ट्रैक करती हैं, लेकिन रात में वे आम तौर पर सीधे ऊपर की ओर इशारा करते हुए संग्रहीत होते हैं, क्योंकि यह ट्रैकर के लिए न्यूनतम तनाव की स्थिति है।) सॉइलिंग एक बड़ा मुद्दा है, क्योंकि यह ऊर्जा उत्पादन, और सफाई को काफी कम करता है। सस्ता नहीं है। प्रयोग लगभग 120 ट्रैकर्स के क्षेत्र में चलाया गया था; पश्चिम आधा लंबवत और पूर्व आधा क्षैतिज रूप से स्टोव किया गया था (इसे ट्रैकर कनेक्शन के साथ दो इनवर्टरों में जोड़ा गया था, जो कि प्रयोग के दौरान ऊर्जा उत्पादन में एक फायदा पहुंचाएगा यदि कोई महत्वपूर्ण प्रभाव है और कोई विशेष पैटर्न नहीं है, अन्यथा, यह,

दुर्भाग्य से, दक्षिण-दक्षिण-पश्चिम से रेगिस्तान के पार एक मजबूत प्रचलित हवा का पैटर्न है, और मैदान के पश्चिमी भाग के दक्षिण में एक बड़ी इमारत है, "शेडिंग" (कुछ हद तक) विंडब्लॉउन पार्टिकुलेट से क्षेत्र के अधिकांश भाग । इसके अतिरिक्त, ट्रैकर्स हवा से कुछ हद तक एक-दूसरे को "छाया" करते हैं। नतीजतन, तंत्र जिसके द्वारा मिट्टी जमा होती है (जैसे, हवा-उड़ा या बसना) पूरे क्षेत्र में रिश्तेदार परिमाण में भिन्न होती है। यह बदले में तात्पर्य है कि सरणियाँ स्थान पर निर्भर विभिन्न दरों पर मिट्टी जमा करती हैं; यह कोई छोटा प्रभाव नहीं है।

विश्लेषण का अंतिम परिणाम, अनिवार्य रूप से, यह अनुमान लगाने योग्य नहीं था कि भंडारण की स्थिति में अंतर था, लेकिन हम किसी भी तरह से, संभावना को खारिज नहीं कर सकते थे कि प्रभाव तुच्छ था, और न ही किसी महान आत्मविश्वास के साथ निर्धारित (आधारित) डेटा पर) प्रभाव का संकेत। मैंने तब एक फॉलोअप प्रयोग तैयार किया, दोनों भंडारण पदों के लिए पूरे क्षेत्र में "प्रतिक्रिया सतह" का अनुमान लगाने में सक्षम होने के उद्देश्य से सरणी स्थान के आधार पर भंडारण की स्थिति को निर्धारित करते हुए, "बनाम" - हवा से उड़ने वाली "दरों" का निर्धारण करते हुए, और बेशक इन दोनों पर भंडारण कोण का प्रभाव है। यह प्रयोग काफी सफल रहा और हम कुछ महीनों के बाद ही ऊर्ध्वाधर स्टोव के लाभों की स्पष्ट तस्वीर प्राप्त कर पाए।


6

मुझे एक सहकर्मी द्वारा एक निश्चित प्रकार की मौसम की घटना के बीच सहसंबंध को देखते हुए एक अध्ययन में 'आँकड़े' करने के लिए कहा गया था और एक प्रकार के बुनियादी ढांचे में विफलताएं जो आमतौर पर सरल पहनने और आंसू के लिए जिम्मेदार हैं। सहकर्मी यह देखना चाहते थे कि क्या वास्तव में मौसम की घटनाओं की विफलता में योगदान था या नहीं। लोगों की एक टीम ने पहले से ही डेटा की एक बड़ी राशि एकत्र करने में बहुत समय और प्रयास खर्च किया था और शोध पत्र बहुत अधिक समाप्त हो गया था, उन्हें बस किसी को 'आंकड़े' करने और परिणाम अनुभाग के अंतिम बिट में भरने की आवश्यकता थी।

समस्या यह थी, उन्होंने श्रमसाध्य रूप से यह सुनिश्चित किया था कि डेटा सेट में केवल 'दिलचस्प' अवधियां थीं, जिसमें विचाराधीन मौसम की घटना हुई थी। इसका मतलब गैर-इवेंट समय के साथ घटनाओं के दौरान विफलता दर की तुलना करने का कोई तरीका नहीं था। मैंने समस्या को समझाने के लिए बार-बार कोशिश की, लेकिन वे वास्तव में कभी आश्वस्त नहीं थे, क्योंकि बस इतना डेटा था कि निश्चित रूप से मुझे इससे कुछ मिल सकता था।

सौभाग्य से वहाँ अभी भी मौसम की घटनाओं की गंभीरता की सीमा थी और गंभीरता और विफलता की दर के बीच एक कमजोर पत्राचार था, इसलिए हमने कम से कम इससे कुछ बचाया, लेकिन परिणाम इतना अधिक निश्चित हो सकता था कि उन्होंने कैसे सोचा था डेटा कलेक्शन एक्सरसाइज को शुरू करने से पहले 'डिटेल्स' करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.