सामान्यता की धारणा के लिए एफ-परीक्षण इतना संवेदनशील क्यों है?


16

सामान्य वितरण की धारणा के प्रति F -est सबसे भिन्न क्यों है , यहां तक ​​कि बड़े लिए भी संवेदनशील नहीं है ?N

मैंने वेब पर खोज करने का प्रयास किया और लाइब्रेरी का दौरा किया, लेकिन इसमें से किसी ने भी कोई अच्छा जवाब नहीं दिया। यह कहता है कि परीक्षण सामान्य वितरण के लिए धारणा के उल्लंघन के लिए बहुत संवेदनशील है, लेकिन मुझे समझ नहीं आता कि क्यों। क्या किसी के पास इसके लिए एक अच्छा जवाब है?


6
आप किस -estF में रुचि रखते हैं?
स्टेपहान कोलासे

विचरण में अंतर मापने के लिए एफ-परीक्षण।
मैग्नस

जवाबों:


35

मुझे लगता है कि आप समानता के लिए नमूना variances की एक जोड़ी का परीक्षण करते समय variances के अनुपात के लिए एफ-परीक्षण का मतलब है (क्योंकि यह सबसे सरल है जो सामान्यता के लिए काफी संवेदनशील है; ANOVA के लिए एफ-परीक्षण कम संवेदनशील है)

यदि आपके नमूने सामान्य वितरण से तैयार किए गए हैं, तो नमूना संस्करण में एक छोटा ची वर्ग वितरण है

कल्पना करें कि सामान्य वितरण से प्राप्त आंकड़ों के बजाय, आपके पास वितरण था जो सामान्य से अधिक भारी था। फिर आपको उस स्केल किए गए ची-वर्ग वितरण के सापेक्ष बहुत सारे बड़े संस्करण मिलेंगे, और नमूना दाईं ओर दूर दाएं पूंछ में होने की संभावना उस वितरण की पूंछ के लिए बहुत ही उत्तरदायी है, जहां से डेटा खींचा गया था =। (इसमें कई छोटे संस्करण भी होंगे, लेकिन प्रभाव थोड़ा कम स्पष्ट है)

अब यदि दोनों नमूनों को उस भारी पूंछ वाले वितरण से खींचा जाता है, तो अंश पर बड़ी पूंछ बड़े F मानों की अधिकता उत्पन्न करेगी और हर पर बड़ी पूंछ छोटे F मानों की अधिकता उत्पन्न करेगी (और बाईं पूंछ के लिए इसके विपरीत )

इन दोनों प्रभावों से दो-पूंछ वाले परीक्षण में अस्वीकृति पैदा होगी, भले ही दोनों नमूनों में एक ही रूप हो । इसका मतलब यह है कि जब वास्तविक वितरण सामान्य से अधिक होता है, तो वास्तविक महत्व का स्तर हम जितना चाहते हैं उससे अधिक होता है।

इसके विपरीत, हल्के पूंछ वाले वितरण से एक नमूना खींचना नमूना भिन्नताओं के एक वितरण का उत्पादन करता है जो बहुत कम पूंछ है - सामान्य वितरण के डेटा के साथ-साथ आपके द्वारा प्राप्त किए जाने की तुलना में भिन्नता मूल्य अधिक "नकल" होते हैं। फिर, निचली पूंछ की तुलना में सुदूर ऊपरी पूंछ में प्रभाव अधिक मजबूत होता है।

अब यदि दोनों नमूने उस लाइटर-टेल्ड डिस्ट्रीब्यूशन से तैयार किए गए हैं, तो इसका परिणाम मंझला के पास F मानों की अधिकता और पूंछ में बहुत कम है (वास्तविक महत्व स्तर वांछित से कम होगा)।

जरूरी नहीं कि ये प्रभाव बड़े नमूने के आकार के साथ बहुत कम हों; कुछ मामलों में यह खराब होने लगता है।

n=10t5χ92

यहाँ छवि विवरण दर्ज करें

t5

यहाँ छवि विवरण दर्ज करें

जो सामान्य मामले में समान दिखता है (जैसा कि उसे होना चाहिए), टी-केस में ऊपरी पूंछ में एक बड़ी चोटी (और निचली पूंछ में एक छोटी चोटी) है और वर्दी मामले में अधिक पहाड़ी की तरह है, लेकिन एक व्यापक के साथ अगर हम सामान्य वितरण से नमूना ले रहे थे, तो पीक के चारों ओर 0.6 से 0.8 और चरम सीमा की संभावना बहुत कम होती है।

F9,9

यहाँ छवि विवरण दर्ज करें

t5

एक पूर्ण अध्ययन के लिए जांच करने के लिए कई अन्य मामले होंगे, लेकिन यह कम से कम प्रभाव की तरह और दिशा की भावना देता है, साथ ही साथ यह कैसे उत्पन्न होता है।


1
वास्तव में अच्छा डेमो
छायाकार

3

जैसा कि ग्लेन_ बी ने अपने सिमुलेशन में शानदार ढंग से चित्रित किया है, भिन्नताओं के अनुपात के लिए एफ-परीक्षण वितरण की पूंछ के प्रति संवेदनशील है। इसका कारण यह है कि एक नमूना विचरण का विचलन कुर्तोसिस पैरामीटर पर निर्भर करता है, और इसलिए अंतर्निहित वितरण के कुर्तोसिस का नमूना प्रसरण के अनुपात के वितरण पर एक मजबूत प्रभाव पड़ता है।

SN2Sn2n<N

एसएन2एसn2~लगभगn-1एन-1+एन-nएन-1एफ(डीएफसी,डीएफn),

κ

डीएफn=2nκ-(n-3)/(n-1)डीएफसी=2(एन-n)2+(κ-3)(1-2/एन+1/एनn)

κ=3DFn=n1DFC=Nn

κ^


N1N


+1 यह एक बहुत ही रोचक पोस्ट है। निश्चित रूप से mesokurtic वितरण के साथ, यह विचरण-अनुपात वितरण को F से जितना दूर हो सके, वितरण की पसंद की पूरी श्रृंखला के साथ संभव है, लेकिन मामलों की पहचान करना इतना कठिन नहीं है (मेरे उत्तर में नमूना आकार में, 10) और 10) जहां वास्तविक प्रकार I त्रुटि दर मामूली 0.05 दर से थोड़ी अधिक है। पहले 3 मामले जो मैंने आज़माए (जनसंख्या कर्टोसिस = 3 - उन सभी के साथ सममित रूप से) में टाइप I अस्वीकृति दर 0.0379, 0.0745 और 0.0785 थी। ... ctd
Glen_b -Reinstate मोनिका

ctd ... मुझे थोड़ा संदेह है कि अधिक चरम मामलों की पहचान थोड़ी सोच के साथ की जा सकती है कि सन्निकटन को कैसे खराब किया जाए। मुझे लगता है कि यह (कि महत्व स्तर ज्यादा प्रभावित नहीं होगा) बड़े नमूनों में बेहतर पकड़ सकता है, हालांकि।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.