महत्व आकार परीक्षण महत्व के लिए परिकल्पना के रूप में


37

आज, क्रॉस वेलिडेटेड जर्नल क्लब में (आप वहां क्यों नहीं थे?), @Mbq ने पूछा:

क्या आपको लगता है कि हम (आधुनिक डेटा वैज्ञानिक) जानते हैं कि महत्व क्या है? और यह हमारे परिणामों में हमारे विश्वास से कैसे संबंधित है?

@ मिचेल ने उत्तर दिया कि कुछ (मेरे सहित) आमतौर पर करते हैं:

मैं अपने कैरियर में जारी रखने के साथ महत्व की अवधारणा (पी-वैल्यू के आधार पर) कम और कम मददगार पा रहा हूं। उदाहरण के लिए, मैं बहुत बड़े डेटासेट का उपयोग कर सकता हूं ताकि सब कुछ सांख्यिकीय रूप से महत्वपूर्ण हो ( )p<.01

यह शायद एक बेवकूफी भरा सवाल है, लेकिन क्या इस समस्या की परिकल्पना नहीं है? यदि आप अशक्त परिकल्पना का परीक्षण करते हैं "ए, बी के बराबर है" तो आप जानते हैं कि इसका उत्तर "नहीं" है। बड़ा डेटा सेट केवल आपको इस अनिवार्य रूप से सही निष्कर्ष के करीब लाएगा। मेरा मानना ​​है कि यह डेमिंग था जिसने एक बार परिकल्पना के साथ एक उदाहरण दिया था "एक भेड़ के बच्चे के दाईं ओर बाल की संख्या उसके बाईं ओर के बाल की संख्या के बराबर है।" ठीक है, निश्चित रूप से यह नहीं है।

एक बेहतर परिकल्पना होगी "A, B से बहुत अधिक से भिन्न नहीं है।" या, मेमने के उदाहरण में, "भेड़ के बच्चे के बालों की संख्या X% से अधिक नहीं होती है"।

इसका कोई मतलब भी है क्या?


1) माध्य तुल्यता का परीक्षण (यह मानते हुए कि आप जो चाहते हैं) कुछ मामलों में उनके अंतर के महत्व के परीक्षण के लिए सरलीकृत किया जा सकता है। इस अंतर अनुमान के लिए एक मानक त्रुटि के साथ, आप "बी से अधिक से भिन्न नहीं ..." के सभी प्रकार के परीक्षण कर सकते हैं। 2) नमूना आकार के लिए - हाँ, बड़े एसएस के लिए महत्व का महत्व कम हो जाता है, लेकिन यह अभी भी छोटे नमूनों के लिए महत्वपूर्ण है, जहां आप केवल अतिरिक्त मान उत्पन्न नहीं कर सकते हैं।
ओन्ड्रेज

11
पुन: "बेशक यह नहीं है।" एक अनुमान के अनुसार, एक मेमने के प्रत्येक तरफ बाल होते हैं। अगर वहाँ इस तरह के बालों की भी संख्या में हैं और वे दोनों तरफ बराबर संभावना के साथ बेतरतीब ढंग से वितरित कर रहे हैं और पक्षों को स्पष्ट रूप से चित्रित कर रहे हैं, तो संभावना है कि दोनों नंबर दिए गए हैं बिल्कुल बराबर 0.178% है। कई सौ के एक बड़े झुंड में, आपको प्रत्येक दशक में कम से कम एक बार पैदा होने वाले इस तरह के पूरी तरह से संतुलित मेमने को देखने की उम्मीद करनी चाहिए (एक समान संख्या में बाल समय का लगभग 50% होता है)। या: बस के बारे में हर पुराने भेड़ किसान एक भेड़ का बच्चा है! 105
whuber

1
@whuber यह विश्लेषण के उद्देश्य से निर्धारित होता है। एक बेहतर सादृश्य यह होगा कि न्यूनतम प्रभाव आकार क्या है जो एक परीक्षण के बाद दवा में आगे निवेश को उचित ठहराएगा। बस एक सांख्यिकीय महत्वपूर्ण प्रभाव का अस्तित्व पर्याप्त नहीं है, क्योंकि एक दवा विकसित करना महंगा है और इसके साइड-इफेक्ट्स हो सकते हैं जिन पर विचार करने की आवश्यकता है। यह एक सांख्यिकीय सवाल नहीं है, लेकिन एक व्यावहारिक है।
डिक्रान मार्सुपियल

2
@ जब भी मुझे संदेह होता है कि अधिकांश अनुप्रयोगों में जहां ब्याज की न्यूनतम प्रभाव आकार तय करने के लिए कोई व्यावहारिक जानकारी नहीं है, तो मानक परिकल्पना परीक्षण ठीक है, उदाहरण के लिए सामान्यता के लिए परीक्षण। एक बायेसियन के रूप में मैं एक परिकल्पना परीक्षण समस्या के बजाय एक अनुकूलन समस्या के रूप में दृष्टिकोण से सहमत होगा। परिकल्पना परीक्षणों के साथ समस्या का एक हिस्सा आंकड़े कुकबुक दृष्टिकोण से निकलता है, जहां अभ्यास के उद्देश्य, या परिणाम के सही अर्थ पर विचार किए बिना परीक्षणों को एक परंपरा के रूप में किया जाता है (सभी IMHO)।
डिक्रान मार्सुपियल

1
@DikranMarsupial वहाँ कुंजी नहीं है कि छात्रों को रटे द्वारा परीक्षण पढ़ाया जा रहा है, जैसा कि अच्छे अध्ययन डिजाइन के महत्व के बजाय नीचे गंग द्वारा पहचाना गया है? क्या अध्ययन के डिजाइन पर अधिक जोर देने से कुछ समस्या हल हो जाएगी - जरूरी नहीं कि बड़े डेटा सेट के साथ?
मिशेल

जवाबों:


25

जहाँ तक महत्व परीक्षण (या कुछ और जो अनिवार्य रूप से महत्व परीक्षण के रूप में एक ही बात करता है) जाता है, मैंने लंबे समय से सोचा है कि ज्यादातर स्थितियों में सबसे अच्छा दृष्टिकोण एक मानकीकृत प्रभाव आकार का अनुमान लगाने की संभावना है, जिसके बारे में 95% विश्वास अंतराल है प्रभावी आकार। वहाँ वास्तव में कुछ भी नया नहीं है - गणितीय रूप से आप उनके बीच आगे और पीछे फेरबदल कर सकते हैं - यदि 'शून्य' नल के लिए पी-मान <.05 है, तो 0 एक 95% CI के बाहर झूठ होगा, और vise versa। इसका लाभ, मेरी राय में, मनोवैज्ञानिक है; वह है, यह उन सलामी सूचनाओं को बनाता है जो मौजूद हैं लेकिन वे लोग नहीं देख सकते हैं जब केवल पी-मूल्यों की सूचना दी जाती है। उदाहरण के लिए, यह देखना आसान है कि एक प्रभाव बेतहाशा 'महत्वपूर्ण' है, लेकिन हास्यास्पद रूप से छोटा है; या 'गैर-महत्वपूर्ण', लेकिन केवल इसलिए कि त्रुटि बार बहुत बड़ी हैं, जबकि अनुमानित प्रभाव कम या ज्यादा है जिसकी आपको उम्मीद थी। इन्हें कच्चे मूल्यों और उनके CI के साथ जोड़ा जा सकता है।

अब, कई क्षेत्रों में कच्चे मूल्य आंतरिक रूप से सार्थक हैं, और मुझे लगता है कि यह सवाल उठाता है कि क्या यह अभी भी प्रभाव के आकार के उपायों की गणना करने के लिए सार्थक है, यह देखते हुए कि हमारे पास पहले से ही साधन और ढलान जैसे मूल्य हैं। एक उदाहरण के लिए वृद्धि देखी जा सकती है; हम जानते हैं कि एक 20 वर्षीय, गोरे पुरुष का 6 +/- 2 इंच छोटा (यानी 15 +/- 5 सेमी) होने का क्या मतलब है, क्योंकि वे अन्यथा ऐसा करेंगे, इसलिए उल्लेख क्यों करें ? मुझे लगता है कि दोनों की रिपोर्टिंग में अभी भी मूल्य हो सकता है, और इनकी गणना करने के लिए फ़ंक्शन लिखे जा सकते हैं, ताकि यह बहुत कम अतिरिक्त काम हो, लेकिन मैं मानता हूं कि राय अलग-अलग होगी। किसी भी दर पर, मेरा तर्क है कि आत्मविश्वास अंतराल के साथ बिंदु अनुमान मेरी प्रतिक्रिया के पहले भाग के रूप में पी-मूल्यों को प्रतिस्थापित करते हैं। d=1.6±.5

दूसरी ओर, मुझे लगता है कि एक बड़ा सवाल यह है कि 'क्या वह चीज है जिसका महत्व परीक्षण वास्तव में हम चाहते हैं?' मुझे लगता है कि वास्तविक समस्या यह है कि अधिकांश लोग डेटा का विश्लेषण कर रहे हैं (अर्थात, चिकित्सक सांख्यिकीविद् नहीं हैं), महत्व परीक्षण डेटा विश्लेषण की संपूर्णता बन सकता है। यह मुझे लगता है कि सबसे महत्वपूर्ण बात यह है कि हमारे डेटा के साथ क्या चल रहा है, और अशक्त परिकल्पना महत्व परीक्षण के बारे में सोचने के लिए एक राजसी तरीका है, सबसे अच्छा, उस का एक बहुत छोटा हिस्सा है। मुझे एक काल्पनिक उदाहरण दें (मैं स्वीकार करता हूं कि यह एक कैरिकेचर है, लेकिन दुर्भाग्य से, मुझे डर है कि यह कुछ हद तक प्रशंसनीय है:

बॉब एक ​​अध्ययन आयोजित करता है, जो कुछ-या-अन्य पर डेटा एकत्र करता है। उन्हें उम्मीद है कि डेटा को सामान्य रूप से वितरित किया जाएगा, कुछ मूल्य के आसपास कसकर क्लस्टरिंग करेगा, और यह देखने के लिए एक नमूना-परीक्षण करने का इरादा रखता है कि क्या उसका डेटा कुछ पूर्व-निर्दिष्ट मूल्य से 'काफी अलग' है या नहीं। अपना नमूना एकत्र करने के बाद, वह यह देखने के लिए जांचता है कि क्या उसका डेटा सामान्य रूप से वितरित किया गया है, और पाता है कि वे नहीं हैं। इसके बजाय, उनके पास केंद्र में एक स्पष्ट गांठ नहीं है, लेकिन किसी दिए गए अंतराल पर अपेक्षाकृत अधिक है और फिर एक लंबी बाईं पूंछ के साथ निशान है। बॉब को इस बात की चिंता है कि उसे यह सुनिश्चित करने के लिए क्या करना चाहिए कि उसका परीक्षण वैध है। वह कुछ कर रहा है (जैसे, एक परिवर्तन, एक गैर पैरामीट्रिक परीक्षण, आदि), और फिर एक परीक्षण सांख्यिकीय और एक पी-मूल्य की रिपोर्ट करता है।

मुझे उम्मीद है कि यह बुरा नहीं होगा। मेरा मतलब किसी का मजाक उड़ाना नहीं है, लेकिन मुझे लगता है कि ऐसा कभी-कभार होता है। क्या यह परिदृश्य घटित होना चाहिए, हम सभी सहमत हो सकते हैं कि यह खराब डेटा विश्लेषण है। हालाँकि, समस्या यह नहीं है कि परीक्षण आँकड़ा या पी-मान गलत है; हम यह बता सकते हैं कि डेटा को उस संबंध में ठीक से संभाला गया था। मैं तर्क दूंगा कि समस्या बॉब की है जो क्लीवलैंड ने "रोटेट डेटा विश्लेषण" कहा है। वह मानता है कि एकमात्र बिंदु सही पी-मूल्य प्राप्त करना है, और उस लक्ष्य का पीछा करने के बाहर उसके डेटा के बारे में बहुत कम सोचता है। वह भी ऊपर मेरे सुझाव पर जा सकता है और 95% विश्वास अंतराल के साथ एक मानकीकृत प्रभाव आकार की सूचना दी है, और यह नहीं बदला है कि मैं बड़ी समस्या के रूप में क्या देखता हूं (यह वही है जो मैं "अनिवार्य रूप से एक ही बात कर रहा हूं" "एक अलग तरीके से)। इस विशिष्ट मामले में, तथ्य यह है कि डेटा जिस तरह से वह उम्मीद नहीं करता था (यानी, सामान्य नहीं थे) वास्तविक जानकारी है, यह दिलचस्प है, और संभवतः बहुत महत्वपूर्ण है, लेकिन यह जानकारी अनिवार्य रूप से सिर्फ दूर फेंक दी जाती है। महत्व परीक्षण पर ध्यान केंद्रित करने के कारण बॉब इसे मान्यता नहीं देता है। मेरे दिमाग में, यही असली समस्या है महत्व परीक्षण के साथ।

मुझे कुछ अन्य दृष्टिकोणों का उल्लेख करना चाहिए जिनका उल्लेख किया गया है, और मैं बहुत स्पष्ट होना चाहता हूं कि मैं किसी की आलोचना नहीं कर रहा हूं।

  1. यह अक्सर उल्लेख किया जाता है कि बहुत से लोग वास्तव में पी-मूल्यों को नहीं समझते हैं (उदाहरण के लिए, यह सोचते हुए कि वे संभावना शून्य हैं सच है), आदि। कभी-कभी यह तर्क दिया जाता है कि, यदि केवल लोग बायेसियन दृष्टिकोण का उपयोग करेंगे, तो ये समस्याएं होंगी। चले जाओ। मेरा मानना ​​है कि लोग बायेसियन डेटा विश्लेषण को इस तरीके से कर सकते हैं, जो कि असाध्य और यांत्रिक है। हालांकि, मुझे लगता है कि पी-वैल्यू के अर्थ को समझने में गलतफहमी कम हानिकारक होगी अगर किसी को नहीं लगता कि पी-वैल्यू प्राप्त करना लक्ष्य है।
  2. 'बड़ा डेटा' का अस्तित्व आम तौर पर इस मुद्दे से असंबंधित है। बड़ा डेटा केवल यह स्पष्ट करता है कि 'विश्लेषण' के आसपास डेटा विश्लेषण का आयोजन एक सहायक दृष्टिकोण नहीं है।
  3. मुझे विश्वास नहीं है कि समस्या की परिकल्पना परीक्षण के साथ है। यदि लोग केवल यह देखना चाहते थे कि अनुमानित मूल्य एक अंतराल के बाहर है, बजाय अगर यह एक बिंदु मान के बराबर है, तो कई समान मुद्दे उत्पन्न हो सकते हैं। (फिर से, मैं स्पष्ट होना चाहता हूं मुझे पता है कि आप 'बॉब' नहीं हैं ।)
  4. रिकॉर्ड के लिए, मैं यह उल्लेख करना चाहता हूं कि पहले पैराग्राफ से मेरा अपना सुझाव, मुद्दे को संबोधित नहीं करता है , जैसा कि मैंने इंगित करने की कोशिश की।

मेरे लिए, यह मुख्य मुद्दा है: जो हम वास्तव में चाहते हैं वह सोचने के लिए एक राजसी तरीका है । किसी भी स्थिति में इसका मतलब है कि कट और सूखा नहीं है। एक तरीके से छात्रों को यह बताने का तरीका कक्षा में न तो स्पष्ट है और न ही आसान है। महत्व परीक्षण के पीछे बहुत जड़ता और परंपरा है। एक आँकड़े वर्ग में, यह स्पष्ट है कि क्या सिखाया जाना चाहिए और कैसे। छात्रों और चिकित्सकों के लिए सामग्री को समझने के लिए एक वैचारिक स्कीमा विकसित करना संभव हो जाता है, और विश्लेषण करने के लिए एक चेकलिस्ट / फ़्लोचार्ट (मैंने कुछ देखा है!)। महत्त्वपूर्ण परीक्षण स्वाभाविक रूप से किसी भी गूंगा या आलसी या बुरा होने के बिना रॉट डेटा विश्लेषण में विकसित हो सकता है। यही समस्या है।


मुझे विश्वास अंतराल पसंद है :) एक सवाल: क्या आपका मतलब यह है कि प्रभाव के आकार की पोस्ट हॉक गणना ठीक है?
मिशेल

@ मिचेल, मुझे पूरी तरह से यकीन नहीं है कि "पोस्ट हॉक" से आपका क्या मतलब है, लेकिन शायद। उदाहरण के लिए, आप कुछ डेटा इकट्ठा करते हैं, , और , फिर गणना करें । अब, यह पक्षपाती है, और सबसे सरल स्थिति है, लेकिन आपको यह विचार मिलता है। ˉ एक्स 2=14एसडी=6=.67x¯1=10x¯2=14SD=6d=.67
गंग - मोनिका

हां मुझे लगता है कि हम यहां सहमत हैं।
मिशेल

+1। बॉब की कहानी इस बात की याद दिलाती है: pss.sagepub.com/content/early/2011/10/17/0956797611417632
कार्लोस एक्सीलॉय

+1 मैं स्वयं विश्वसनीय अंतराल पसंद करता हूं। बिंदु 1 के बारे में मैं तर्क दूंगा कि बायेसियन विकल्प के परिणामस्वरूप रॉट डेटा विश्लेषण की संभावना कम होती है, क्योंकि प्रायिकता की परिभाषा इतनी सहज नहीं है, जिससे उस प्रश्न को तैयार करना बहुत आसान हो जाता है जिसे आप वास्तव में सांख्यिकीय तरीके से पूछना चाहते हैं। । असली समस्या यह है कि परीक्षण करने में अंतरग्रहों की आवश्यकता होती है, जो कि व्यापक रूप से अपनाए जाने वाले ऐसे तरीकों के लिए बहुत कठिन हैं। उम्मीद है कि सॉफ्टवेयर उस बिंदु तक विकसित होगा जहां उपयोगकर्ता प्रश्न तैयार करने पर ध्यान केंद्रित कर सकता है और बाकी को कंप्यूटर पर छोड़ सकता है।
डिक्रान मार्सुपियल

18

हम आंकड़ों में परिकल्पना परीक्षण के किसी भी रूप पर जोर क्यों देते हैं ?

प्रिंसिपल आर्ग्यूमेंट रॉबर्ट एबेल्सन के रूप में अद्भुत पुस्तक सांख्यिकी में तर्क दिया गया है कि सांख्यिकीय विश्लेषण प्रश्न में विषय के बारे में एक राजसी तर्क का हिस्सा है। उनका कहना है कि, बल्कि उन अनुमानों के रूप में मूल्यांकन किया जाना चाहिए जिन्हें अस्वीकार किया जाना है या अस्वीकार नहीं किया गया है (या यहां तक ​​कि स्वीकार किया गया है!)!

परिमाण - कितना बड़ा है? अभिव्यक्ति - क्या यह अपवादों से भरा है? यह स्पष्ट है? सामान्यता - यह आमतौर पर कैसे लागू होता है? दिलचस्पता - क्या हम परिणाम की परवाह करते हैं? विश्वसनीयता - क्या हम इस पर विश्वास कर सकते हैं?

मेरे ब्लॉग पर पुस्तक की मेरी समीक्षा


4
कुछ प्राध्यापकों ने इस समस्या का समाधान किया है। मेरा पीएचडी साइकोमेट्रिक्स में है, जो मनोविज्ञान विभाग में है। मैंने सुना है कि विभाग के अन्य हिस्सों के प्रोफेसरों का कहना है कि "सिर्फ पी-मूल्य की रिपोर्ट करें, यही मायने रखता है"। मेरा काम परामर्श है, ज्यादातर स्नातक छात्रों और शोधकर्ताओं के साथ सामाजिक, व्यवहारिक, शैक्षिक और चिकित्सा क्षेत्रों में। डॉक्टरेट समितियों द्वारा दी गई गलत सूचना की मात्रा आश्चर्यजनक है।
पीटर Flom - को पुनः स्थापित मोनिका

1
+1 "व्हाई ..." के लिए, यह एक बड़ा हिस्सा है जिसे मैं अपने उत्तर में प्राप्त करने की कोशिश कर रहा था।
गूँग -

मेरे जवाब में मैं जो पाने की कोशिश कर रहा था, उसका एक और हिस्सा यह है कि मुझे लगता है कि यह स्वाभाविक रूप से होता है। Btw, कोई मेला दो upvotes ;-), आप इन गठबंधन कर सकते हैं।
गूँज - मोनिका

13

आपका अंतिम प्रश्न न केवल समझ में आता है: आजकल समझदार औद्योगिक सांख्यिकीविद महत्वपूर्ण अंतर के लिए परीक्षण नहीं करते हैं, लेकिन महत्वपूर्ण तुल्यता के लिए, अर्थात, के रूप की अशक्त परिकल्पना का परीक्षण करते हैं। जहां उपयोगकर्ता द्वारा निर्धारित किया गया है और वास्तव में "प्रभाव आकार" की धारणा से संबंधित है। सबसे आम तुल्यता परीक्षण तथाकथित TOST है । फिर भी TOST रणनीति यह साबित करने का लक्ष्य रखती है कि दो का अर्थ है और महत्वपूर्ण रूप से -close हैं, उदाहरण के लिए कुछ माप पद्धति और का औसत मूल्य हैH0:{|μ1μ2|>ϵ}ϵμ1μ2ϵμ1μ2एक और माप पद्धति के लिए, और कई स्थितियों में साधनों के बजाय टिप्पणियों के बीच समानता का आकलन करने के लिए यह अधिक समझदार है। ऐसा करने के लिए हम परिकल्पना परीक्षण कर सकते हैं जैसे कि , और ऐसी परिकल्पना परीक्षण सहिष्णुता के अंतराल से संबंधित है।Pr(|X1X2|>ϵ)


(+1) और, 1000 प्रतिष्ठा में आपका स्वागत है। चीयर्स।
कार्डिनल

6

पारंपरिक परिकल्पना परीक्षण आपको बताते हैं कि क्या किसी प्रभाव के अस्तित्व के लिए सांख्यिकीय रूप से महत्वपूर्ण सबूत हैं, जबकि हम अक्सर जो जानना चाहते हैं वह व्यावहारिक रूप से महत्वपूर्ण प्रभाव के साक्ष्य का अस्तित्व है।

बेइज़ियन "परिकल्पना परीक्षण" को न्यूनतम प्रभाव आकार (IIRC के साथ बनाना संभव है) डेविड मैकके की पुस्तक में "सूचना सिद्धांत, अंतर्ज्ञान और सीखने के एल्गोरिदम" पर इसका एक उदाहरण है, मैं इसे देखूंगा कि मेरे पास एक पल है। ।

सामान्यता परीक्षण एक और अच्छा उदाहरण है, हम आमतौर पर जानते हैं कि डेटा वास्तव में सामान्य रूप से वितरित नहीं होते हैं, हम सिर्फ यह देखने के लिए परीक्षण कर रहे हैं कि क्या सबूत है कि यह एक उचित अनुमान नहीं है। या एक सिक्के के पूर्वाग्रह के लिए परीक्षण, हम जानते हैं कि यह पूरी तरह से पक्षपाती होने की संभावना नहीं है क्योंकि यह असममित है।


6

इसमें से बहुत कुछ नीचे आता है कि आप वास्तव में किस प्रश्न को पूछ रहे हैं, आप अपने अध्ययन को कैसे डिजाइन करते हैं, और यहां तक ​​कि आपके लिए क्या मतलब है।

मैंने एक बार ब्रिटिश मेडिकल जर्नल में एक दिलचस्प छोटी प्रविष्टि डाली, जिसमें लोगों ने कुछ चरणों की व्याख्या करने के बारे में बात की थी। यह पता चला है कि "हमेशा" का मतलब यह हो सकता है कि 91% समय के रूप में कुछ कम होता है (बीएमजे वोल्यूम 333 26 अगस्त 2006 पृष्ठ 445)। तो शायद समान और समतुल्य (या X के कुछ मूल्य के लिए X% के भीतर) एक ही बात का मतलब सोचा जा सकता है। और आर का उपयोग करते हुए कंप्यूटर से एक सरल समानता पूछने की अनुमति देता है:

> (1e+5 + 1e-50) == (1e+5 - 1e-50)
[1] TRUE

अब अनंत परिशुद्धता का उपयोग करने वाला एक शुद्ध गणितज्ञ कह सकता है कि वे 2 मूल्य समान नहीं हैं, लेकिन आर कहते हैं कि वे हैं और अधिकांश व्यावहारिक मामलों के लिए वे होंगे (यदि आपने मुझे देने की पेशकश की (1e + 5 + 1e-50), लेकिन राशि समाप्त हो रही है (1e + 5 - 1e-50) मैं पैसे को मना नहीं करूंगा क्योंकि यह वादा किया गया था से अलग था)।$$

इसके अलावा अगर हमारी वैकल्पिक परिकल्पना तो हम अक्सर को भले ही तकनीकी रूप से असली अशक्त , लेकिन हम समानता के साथ काम करते हैं। चूँकि यदि हम यह दिखा सकते हैं कि से बड़ा है तो हम यह भी जानते हैं कि यह से कम सभी मूल्यों से बड़ा है । और क्या वास्तव में सिर्फ 2 एक-पूंछ वाले परीक्षणों में दो-पूंछ वाला परीक्षण नहीं है? आखिरकार, क्या आप वास्तव में उस को कहेंगे, लेकिन यह कहने से इंकार कर देंगे कि किस तरफ है? आंशिक रूप से यही कारण है कि यदि संभव हो तो पी-वैल्यू के स्थान पर आत्मविश्वास अंतराल का उपयोग करने की दिशा में एक प्रवृत्ति है, यदि मेरा आत्मविश्वास अंतराल हैHa:μ>μ0H0:μ=μ0H0:μμ0μμ0μ0μμ0μ0 μμ में शामिल है, जबकि मैं यह मानने के लिए तैयार नहीं हो सकता कि बिल्कुल बराबर है , मैं यह निश्चित रूप से नहीं कह सकता कि किस तरफ निहित है, जिसका अर्थ है कि वे व्यावहारिक उद्देश्यों के लिए समान हैं। ।μ0μμ0μ0 μ

इसका बहुत सा हिस्सा सही सवाल पूछने और उस प्रश्न के लिए सही अध्ययन को तैयार करने के लिए आता है। यदि आप यह दिखाने के लिए पर्याप्त डेटा के साथ समाप्त होते हैं कि व्यावहारिक रूप से निरर्थक अंतर सांख्यिकीय रूप से महत्वपूर्ण है, तो आपके पास बहुत अधिक डेटा प्राप्त करने वाले संसाधन बर्बाद हो गए हैं। यह तय करना बेहतर होगा कि एक सार्थक अंतर क्या होगा और उस अंतर का पता लगाने के लिए आपको पर्याप्त शक्ति देने के लिए अध्ययन को डिज़ाइन करना चाहिए लेकिन छोटा नहीं।

और अगर हम वास्तव में बालों को विभाजित करना चाहते हैं, तो हम कैसे परिभाषित करते हैं कि भेड़ के बच्चे के अंग दाहिनी ओर हैं और जो बाईं ओर हैं? यदि हम इसे एक पंक्ति द्वारा परिभाषित करते हैं कि परिभाषा के अनुसार प्रत्येक तरफ समान रूप से बाल हैं तो उपरोक्त प्रश्न का उत्तर "कोर्स ऑफ़ इट" है।


मुझे संदेह है कि आर से आपको मिलने वाला उत्तर केवल कुछ अस्थायी बिंदु अंकगणित समस्या का परिणाम है, अप्रासंगिक मतभेदों की उपेक्षा करने का एक सचेत निर्णय नहीं। क्लासिक उदाहरण पर विचार करें (.1 ​​+ .2) == .3 एक "शुद्ध गणितज्ञ" आपको बताएगा कि वे सटीक के किसी भी स्तर पर समान हैं, फिर भी आर रिटर्न FALSE है।
गला

@ गेल्लौरन्स, मेरा कहना यह है कि गोलाई के कारण (चाहे मानव द्वारा, या कंप्यूटर द्वारा) पर्याप्त बराबर एक्स के लिए एक्स% के भीतर और बराबर% की अवधारणाएं व्यावहारिक रूप से समान हैं।
ग्रेग स्नो

5

संगठनात्मक दृष्टिकोण से, यह नीतिगत विकल्पों के साथ सरकार हो या एक नई प्रक्रिया / उत्पाद को रोल करने वाली कंपनी हो, एक साधारण लागत-लाभ विश्लेषण का उपयोग भी मदद कर सकता है। मैंने अतीत में तर्क दिया है कि (राजनीतिक कारणों की अनदेखी) एक नई पहल की ज्ञात लागत को देखते हुए, उन लोगों की संख्या के लिए भी विराम क्या है जो उस पहल से सकारात्मक रूप से प्रभावित होना चाहिए? उदाहरण के लिए, यदि नई पहल से अधिक बेरोजगार लोगों को काम में लाना है, और पहल की लागत कम हो जाती है $100,000, तो क्या इससे कम से कम बेरोजगारी के हस्तांतरण में कमी आती है $100,000? यदि नहीं, तो पहल का प्रभाव व्यावहारिक रूप से महत्वपूर्ण नहीं है।

स्वास्थ्य परिणामों के लिए, सांख्यिकीय जीवन का मूल्य महत्व रखता है। ऐसा इसलिए है क्योंकि जीवन भर में स्वास्थ्य लाभ प्राप्त होते हैं (और इसलिए छूट दर के आधार पर मूल्य नीचे की ओर समायोजित किए जाते हैं )। तो फिर सांख्यिकीय महत्व के बजाय, किसी को सांख्यिकीय जीवन के मूल्य का अनुमान लगाने के बारे में तर्क मिलते हैं, और किस छूट की दर लागू होनी चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.