बड़े पर्याप्त नमूना आकार को देखते हुए, एक परीक्षण हमेशा महत्वपूर्ण परिणाम दिखाएगा जब तक कि सही प्रभाव आकार बिल्कुल शून्य न हो। क्यूं कर?


21

प्रभाव आकार पर विकिपीडिया के लेख में किए गए एक दावे को लेकर मैं उत्सुक हूं । विशेष रूप से:

[...] एक गैर-शून्य सांख्यिकीय तुलना हमेशा एक सांख्यिकीय महत्वपूर्ण परिणाम दिखाएगी जब तक कि जनसंख्या प्रभाव का आकार बिल्कुल शून्य न हो

मुझे यकीन नहीं है कि इसका क्या मतलब है / इसका मतलब है, अकेले इसे वापस करने के लिए एक तर्क दें। मुझे लगता है, सब के बाद, एक प्रभाव एक सांख्यिकीय है, अर्थात, एक नमूना से गणना की गई, अपने स्वयं के वितरण के साथ। क्या इसका मतलब यह है कि प्रभाव कभी भी केवल यादृच्छिक भिन्नता के कारण नहीं होते हैं (जो कि मैं समझता हूं कि इसका मतलब महत्वपूर्ण नहीं है)? क्या हम तब विचार करते हैं कि क्या प्रभाव काफी मजबूत है - उच्च निरपेक्ष मूल्य है?

मैं उस प्रभाव पर विचार कर रहा हूं जिससे मैं सबसे अधिक परिचित हूं: पियर्सन सहसंबंध गुणांक आर इसके विपरीत लगता है। कोई भी आर सांख्यिकीय रूप से महत्वपूर्ण क्यों होगा ? यदि आर छोटा है तो हमारी प्रतिगमन रेखा

y=एक्स+=आर(रोंyरोंएक्स)=εएक्स+

के लिए ε छोटे, 0 के करीब है, एक एफ परीक्षण की संभावना ढलान के लिए 0 से युक्त अंतराल एक विश्वास शामिल होंगे। क्या यह प्रतिपक्ष नहीं है?


10
संकेत: आपके द्वारा उद्धृत किए गए भाग से पहले खंड आवश्यक है। " पर्याप्त रूप से बड़े नमूने के आकार को देखते हुए , एक गैर-शून्य सांख्यिकीय तुलना हमेशा एक सांख्यिकीय महत्वपूर्ण परिणाम दिखाएगी जब तक कि जनसंख्या प्रभाव का आकार बिल्कुल शून्य न हो ..."
कोडियोलॉजिस्ट

@Kodiologist: लेकिन, मेरे उदाहरण को फिर से देखें, क्या इसका अर्थ यह होगा कि यदि नमूना का आकार बड़ा होता, तो r स्वयं भी बड़ा होता, या, यदि नमूना आकार बड़ा होता, तो कम से कम अभिव्यक्ति बड़ा होता? मैं इसे नहीं देखता। आर(रोंy/रोंएक्स)
गैरी

5
यदि यह सच नहीं था, तो यह सांख्यिकीय पद्धति का दोष होगा। यदि , निश्चित रूप से कुछ नमूना आकार अंतर का पता लगाने के लिए पर्याप्त बड़ा है। μ>μ0
जॉन कोलमैन

जवाबों:


26

एक सरल उदाहरण के रूप में, मान लीजिए कि मैं कुछ सांख्यिकीय मुंबो जंबो का उपयोग करके आपकी ऊंचाई का अनुमान लगा रहा हूं।

आपने हमेशा दूसरों से कहा है कि आप 177 सेमी (लगभग 5 फीट 10 इंच) हैं।

मैं इस परिकल्पना का परीक्षण करने के लिए (जो अपनी ऊंचाई 177 सेमी, के बराबर है तो ), और मैं अपने माप पर्याप्त में त्रुटि को कम कर सकता, तो मैं साबित हो सकता है कि आप कर रहे हैं नहीं तथ्य 177 सेमी में। आखिरकार, अगर मैं आपकी ऊंचाई को पर्याप्त दशमलव स्थानों के लिए अनुमानित करता हूं, तो आप लगभग निश्चित रूप से 177.00000000 सेमी की ऊंचाई से विचलन करेंगे। शायद आप 177.02 सेमी हैं; मुझे केवल अपनी त्रुटि को कम करके .02 से कम करना है ताकि यह पता लगाया जा सके कि आप 177 सेमी नहीं हैं।=177

मैं आंकड़ों में त्रुटि कैसे कम करूं? बड़ा नमूना लें। यदि आपको एक बड़ा पर्याप्त नमूना मिलता है, तो त्रुटि इतनी कम हो जाती है कि आप अशक्त परिकल्पना से सबसे कम विचलन का पता लगा सकते हैं।


2
यह बहुत स्पष्ट और संक्षिप्त विवरण है। शायद यह समझने के लिए अधिक उपयोगी है कि यह अधिक गणितीय उत्तरों की तुलना में क्यों होता है। बहुत बढ़िया।
कोई नहीं

1
अच्छी तरह से समझाया गया है, लेकिन मुझे लगता है कि यह विचार करना भी महत्वपूर्ण है कि ऐसे मामले हैं जिनमें वर्णित मूल्य वास्तव में सटीक है। उदाहरण के लिए, स्ट्रिंग थ्योरी आदि में होने वाली अजीब चीजों को अलग करना, हमारे ब्रह्मांड के स्थानिक आयामों की संख्या का माप (जो किया जा सकता है) 3 देने जा रहा है, और इससे कोई फर्क नहीं पड़ता कि आप उस माप को कितना सटीक बनाते हैं, आप कर सकते हैं यदि आप पर्याप्त रूप से परीक्षण करते रहते हैं तो निश्चित रूप से लगातार 3. महत्वपूर्ण विचलन नहीं पाते हैं। यदि आप केवल विचलन के कारण कुछ विचलन प्राप्त करेंगे, लेकिन यह एक अलग मुद्दा है।
डेविड जेड

शायद एक भोला सवाल है, लेकिन अगर मैं दावा करता हूं कि मैं 177 सेमी हूं, तो महत्वपूर्ण अंकों की अवधारणा का मतलब यह नहीं है कि मैं केवल यह कह रहा हूं कि मैं 176.5 और 177.5 के बीच हूं? उत्तर एक अच्छा सैद्धांतिक अवधारणा देता है, सच है, लेकिन क्या यह झूठे आधार पर आधारित नहीं है? मुझे किसकी याद आ रही है?
जिमलोह

इस मामले में 177 की घोषित ऊंचाई आंकड़ों में अशक्त परिकल्पना के अनुरूप है। समानता के लिए पारंपरिक परिकल्पना परीक्षण में, आप समानता का बयान करते हैं (उदाहरण )। मुद्दा यह है कि कोई भी बात नहीं है जो आप अपनी ऊंचाई बताते हैं, मैं इसे कम करके त्रुटि को दूर कर सकता हूं जब तक कि शून्य परिकल्पना बिल्कुल सही न हो। मैंने ऊँचाई को समझने के लिए एक आसान उदाहरण के रूप में इस्तेमाल किया, लेकिन यह अवधारणा अन्य क्षेत्रों में समान है (पदार्थ x कैंसर का कारण नहीं है, यह सिक्का उचित है, आदि)μ=177
अंडरमिनर

13

जैसा कि @Kodiologist बताते हैं, यह वास्तव में बड़े नमूना आकारों के लिए क्या होता है। छोटे नमूना आकारों के लिए कोई कारण नहीं है कि आपके पास गलत सकारात्मक या गलत नकारात्मक नहीं हो सकते।

मुझे लगता है कि -est सबसे विषम मामले को स्पष्ट करता है। मान लीजिए हमारे पास एक्स 1 , ... , एक्स एन आईआईडी ~ एन ( μ , 1 ) और हम परीक्षण करना चाहते हैं एच 0 : μ = 0 बनाम एच : μ 0 । हमारे परीक्षण आंकड़ा है जेड एन = ˉ एक्स एन - 0zएक्स1,...,एक्सn~आईआईडीएन(μ,1)एच0:μ=0एच:μ0

जेडn=एक्स¯n-01/n=nएक्स¯n

तोजेडएन=एक्स¯n~एन(μ,1n)। हम में रुचि रखने वाले कर रहे हैंपी(|जेडएन|अल्फा)पी(|जेडएन|अल्फा)=पी(जेडएन-अल्फा)+पी(जेडएनअल्फा)=1+Φ(-अल्फा-μजेडn=nएक्स¯n~एन(μn,1)पी(|जेडn|α)

पी(|जेडn|α)=पी(जेडn-α)+पी(जेडnα)
चलोY~एन(0,1)हमारे संदर्भ चर हो। के तहतएच0μ=0तो हम हैपी(|जेडएन|अल्फा)=1-पी(-अल्फावाईअल्फा)तो हम चुन सकते हैंअल्फाके रूप में वांछित हमारे प्रकार मैं त्रुटि दर को नियंत्रित करने के। लेकिनएचμ √ के तहत
=1+Φ(-α-μn)-Φ(α-μn)
Y~एन(0,1)एच0 μ=0पी(|जेडn|α)=1-पी(-αYα)αएच इतनी पी(|जेडएन|अल्फा)1+Φ(±)-Φ(±)=1 इसलिए संभावना 1 के साथ हम को अस्वीकार कर देंगेएच0यदिμ0(±के मामले में हैμ<0, लेकिन या तो जिस तरह से शिशुओं में एक ही संकेत है)।μn0
पी(|जेडn|α)1+Φ(±)-Φ(±)=1
एच0μ0±μ<0

μ 0μ01nएच1n

एच0:ρ=ρ0एच:ρρ01


1
μ<0जेडn-

1
μ=0एक्स¯पी0n

1
@DeltaIV, ठीक है, यदि अभिसरण दर अलग-अलग थी, तो किसी को एक नॉनगेंजेनेट नल वितरण प्राप्त करने के लिए अलग स्केलिंग की आवश्यकता होगी। लेकिन वर्तमान उदाहरण के लिए, रूट-एन सही दर है।
क्रिस्टोफ हनक

1
nएक्स¯0

7

तर्क है कि उन्होंने जो कहा वह गलत है, अगर " हमेशा ऐसा होता है" के उपयोग के अलावा कोई अन्य कारण नहीं है ।

मुझे नहीं पता कि यह भ्रम की स्थिति है जो आप कर रहे हैं, लेकिन मैं इसे पोस्ट करूंगा क्योंकि मुझे लगता है कि कई करते हैं और इससे भ्रमित हो जाएंगे:

एक्सnn>n0एक्स

लिमnपीआर(एक्स)=1

क्या वे सचमुच कह रहे हैं निम्नलिखित के लिए अनुवाद:

nn0

हालांकि वे जो कहना चाह रहे थे , वह निम्नलिखित है:

किसी भी महत्व के स्तर के लिए, जैसा कि नमूना आकार में वृद्धि हुई है, संभावना है कि एक गैर-शून्य परीक्षण एक महत्वपूर्ण परिणाम दृष्टिकोण 1 प्राप्त करता है यदि सही प्रभाव आकार बिल्कुल शून्य नहीं है।

यहाँ महत्वपूर्ण अंतर हैं:

  • कोई गारंटी नहीं है। आप केवल एक बड़े नमूने के साथ एक महत्वपूर्ण परिणाम प्राप्त करने की संभावना रखते हैं। अब, वे यहाँ दोष का हिस्सा चकमा दे सकते हैं, क्योंकि अभी तक यह केवल शब्दावली का मुद्दा है। एक संभाव्य संदर्भ में, यह है समझ गया कि बयान "यदि n बड़ा पर्याप्त तो एक्स है" कर सकते हैं भी मतलब करने के लिए व्याख्या की जा "एक्स अधिक से अधिक होने की संभावना के रूप में सच हो जाता है n बड़े बढ़ता है"
    हालाँकि, यह व्याख्या मेरी खिड़की से बाहर जाती है जैसे ही वे कहते हैं कि यह "हमेशा" होता है। यहाँ उचित शब्दावली यह कहना होगा कि " उच्च संभावना के साथ " 1 होता है


  • n>n0

लेकिन एक बार जब आप साहित्य को समझ जाते हैं, तो आपको वही मिलता है जो वे कहने की कोशिश कर रहे हैं।

(साइड नोट: संयोग से, यह वास्तव में निरंतर समस्याओं में से एक है, जो कई लोगों के पास विकिपीडिया के साथ है। अक्सर, यह केवल यह समझना संभव है कि वे क्या कह रहे हैं यदि आप पहले से ही सामग्री जानते हैं, तो यह केवल संदर्भ के लिए या अनुस्मारक के रूप में अच्छा है। , स्व-शिक्षण सामग्री के रूप में नहीं।)

1 साथी पेडेंट (हाय!) के लिए, हाँ, इस शब्द का मेरे द्वारा लिंक किए जाने से अधिक विशिष्ट अर्थ है। अब तक के सबसे कठिन तकनीकी शब्द को हम यहाँ "विषम रूप से लगभग निश्चित रूप से" चाहते हैंयहाँ देखें


αα

@ हेनरी: ओह शूट, आप सही कह रहे हैं! मैंने इसे इतनी तेजी से लिखा कि मैंने सोचना बंद नहीं किया। अनेक अनेक धन्यवाद! मैंने इसे ठीक कर लिया है। :)
मेहरदाद

3

मेरा पसंदीदा उदाहरण लिंग द्वारा उंगलियों की संख्या है। अधिकांश लोगों के पास 10 उंगलियां हैं। कुछ हादसों की वजह से उंगलियां गंवा चुके हैं। कुछ के पास अतिरिक्त उंगलियां हैं।

मुझे नहीं पता कि पुरुषों में महिलाओं की तुलना में अधिक उंगलियां हैं (औसतन)। सभी आसानी से उपलब्ध सबूत बताते हैं कि पुरुषों और महिलाओं दोनों की 10 उंगलियां हैं।

हालाँकि, मुझे पूरा विश्वास है कि अगर मैंने सभी पुरुषों और सभी महिलाओं की जनगणना की, तो मैं सीखूंगी कि एक लिंग में दूसरे की तुलना में अधिक उंगलियां (औसतन) होती हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.