ANOVA के


13

इंट्रो: आज इस प्रश्न पर ध्यान दिए जाने के बाद, " क्या एनोवा महत्वपूर्ण हो सकती है जब कोई भी जोड़ीदार टी-टेस्ट नहीं है? ", मैंने सोचा कि मैं इसे एक दिलचस्प तरीके से फिर से नामांकित करने में सक्षम हो सकता हूं, जो उत्तर के अपने सेट के लायक होगा। ।

विभिन्न प्रकार के असंगत परिणाम (चेहरे के मूल्य पर) हो सकते हैं जब सांख्यिकीय महत्व को एक साधारण द्विभाजन के रूप में समझा जाता है और इसके मात्र आधार पर न्याय किया जाता है, जो कि उच्चतर, या । @ Glen_b का उपरोक्त प्रश्न का उत्तर एक ऐसे मामले का एक उपयोगी उदाहरण प्रस्तुत करता है:pα

  • एक एनोवा चार स्तरों के साथ एक स्वतंत्र चर (IV) के लिए एक पैदा करता है , लेकिनFpF<.05
  • टीpt>.08 सभी दो-नमूना -ests के लिए जो IV के चार स्तरों के प्रत्येक जोड़े के अनुरूप टिप्पणियों के बीच एक ही निर्भर चर (DV) में अंतर की तुलना करते हैं।t

इस प्रश्न के माध्यम से पश्च-युग्म जोड़ीदार तुलनाओं के लिए बोनफेरोनी सुधार के बावजूद एक समान मामला उत्पन्न हुआ: एनोवा दोहराया उपायों महत्वपूर्ण है, लेकिन बोनफेरोनी सुधार के साथ सभी कई तुलनाएं नहीं हैं? पहले कई उल्लेखों में थोड़ा अलग परीक्षण के साथ उल्लेखित मामले भी मौजूद हैं:

मैं शर्त लगाता हूं कि इन जैसे मामलों में, कुछ (लेकिन सभी नहीं) जोड़ीदार तुलना '(या प्रतिगमन गुणांक' महत्व परीक्षण ') मान काफी हद तक करीब होना चाहिए अगर एक संबंधित सर्वग्राही परीक्षण एक प्राप्त कर सकता है । मैं देख रहा हूं कि यह @ ग्लेन_ब का पहला उदाहरण है, जहां , , और सबसे बड़ा जोड़ीदार अंतर सबसे छोटा । क्या यह सामान्य रूप से होना चाहिए? अधिक विशेष रूप से :α p < α pαp<αp F = .046 p t = .054F(3,20)=3.19pF=.046pt=.054


प्रश्न: यदि एक एनोवा एक निरंतर पर IV के एक बहुपद IV के प्रभाव के लिए पैदा करता है , तो IV के स्तरों के प्रत्येक युग्म की तुलना करने वाले सभी दो-नमूना -ests में न्यूनतम मान कितना उच्च हो सकता है? क्या न्यूनतम जोड़ी का महत्व जितना हो सकता है ?पी एफ = .05 पी टी पी टी = .50FpF=.05ptpt=.50


मैं उन उत्तरों का स्वागत करता हूं जो केवल इस विशिष्ट प्रश्न को संबोधित करते हैं । हालाँकि, इस प्रश्न को और प्रेरित करने के लिए, मैं कुछ संभावित बयानबाजी के सवालों को विस्तार से बताऊँगा। इन चिंताओं को भी संबोधित करने के लिए आपका स्वागत है, और यहां तक ​​कि यदि आप चाहें तो विशेष प्रश्न को अनदेखा करें, खासकर यदि विशिष्ट प्रश्न का निश्चित उत्तर मिलता है।

महत्व: गौर कीजिए कि और बीच का अंतर कितना कम महत्वपूर्ण है, यदि सांख्यिकीय महत्व को निरर्थक परिकल्पना (रॉन फिशर के दृष्टिकोण, मुझे लगता है?) के खिलाफ सबूत की ताकत के निरंतर संदर्भ में आंका जाता है? बल्कि ऊपर या नीचे एक के रूप में दिचोतोमोउस मामले में की तुलना में अशक्त थोक अस्वीकार करने के लिए कि क्या चुनने में त्रुटि के स्वीकार्य संभावना के लिए सीमा। " फॉकिंग " एक ज्ञात समस्या है जो आंशिक रूप से व्याख्या द्वारा शुरू की गई एक अनावश्यक भेद्यता के लिए अपनी कुख्याति का कारण हैपी टी = .06 α = .05 पी पी पी पी .10 पी αpF=.04pt=.06α=.05pp"अच्छा पर्याप्त" और "पर्याप्त रूप से अच्छा नहीं" के समकक्षों में महत्व के सामान्य अभ्यास के अनुसार मूल्य। यदि कोई इस अभ्यास को समाप्त करने और मूल्यों की व्याख्या करने के बजाय एक निरंतर अंतराल पर अशक्त होने के सबूत की ताकत पर ध्यान केंद्रित करता है, तो क्या सर्वव्यापी परीक्षण कुछ कम महत्वपूर्ण हो सकता है जब कोई वास्तव में कई जोड़ीदार तुलनाओं की परवाह करता है? जरूरी नहीं कि बेकार हो, क्योंकि सांख्यिकीय सटीकता में किसी भी तरह का कुशल सुधार निश्चित रूप से वांछनीय है, लेकिन ... अगर, उदाहरण के लिए, सबसे कम जोड़ीदार तुलना का मान आवश्यक है। एनोवा (या अन्य सर्वग्राही परीक्षण) के भीतर।pp.10pमूल्य, क्या यह सर्वग्राही परीक्षण को कुछ अधिक तुच्छ, कम अनिवार्य, और इससे भी अधिक भ्रामक (preexisting गलतफहमी के साथ संयोजन में) नहीं बनाता है, खासकर यदि कोई विशेष रूप से कई परीक्षणों में को नियंत्रित नहीं करना चाहता है ?α

इसके विपरीत, यदि डेटा ऐसा हो सकता है जो एक omnibus , लेकिन सभी युग्मक , तो क्या इससे सर्वव्यापी और विपरीत परीक्षण पूरे अभ्यास और शिक्षण के लिए प्रेरित नहीं होना चाहिए ? मुझे ऐसा लगता है कि इस मुद्दे को भी एक द्वंद्ववाद बनाम एक निरंतरता के अनुसार सांख्यिकीय महत्व को पहचानने के सापेक्ष गुणों की जानकारी देनी चाहिए, जिसमें द्वंद्वात्मक व्याख्यात्मक प्रणाली छोटे समायोजन के लिए अधिक संवेदनशील होनी चाहिए जब अंतर मामूली रूप से महत्वपूर्ण हो ", जबकि न तो प्रणाली अगर यह अंतर / समायोजन सिद्धांत में बहुत बड़ा (जैसे, हो सकता है, तो एक ऑम्निबस टेस्ट करने या कई तुलनाओं के लिए समायोजित करने में विफलता से सुरक्षित है ।p > .50 p t - p F > .40 )p=.05p>.50ptpF>.40)

अन्य वैकल्पिक जटिलताओं पर विचार करना या अनदेखा करना - जो भी उत्तर को आसान और अधिक सार्थक बनाता है :

  • s के लिए कितना उच्च हो सकता है यदि, , बजाय (जैसे, )।t F p < .05 p = .01 , .001 , ptFp<.05p=.01,.001,
  • एक पॉलीटॉमस IV में स्तरों की संख्या के प्रति संवेदनशीलता
  • जोड़ीदार अंतर के महत्व में असमानता के प्रति संवेदनशीलता (जबकि सभी )pt>pF
    • व्हीबर का उत्तर इंगित करता है कि छोटे अंतर सहित बड़े अंतर को मुखौटा कर सकते हैं।
  • कई तुलनाओं के लिए विभिन्न सर्वग्राही परीक्षणों के सुधारों के बीच अंतर
  • प्रतिबंधित मामले जहां डेटा क्लासिक पैरामीट्रिक परीक्षणों की सभी मान्यताओं को पूरा करता है
    • इस प्रतिबंध को कुछ हद तक ख़राब होने से रोकने के लिए यह प्रतिबंध महत्वपूर्ण हो सकता है।

1
आप स्पष्ट करना चाह सकते हैं कि क्या युग्मक टी-परीक्षणों में ऑम्निबस एफ-परीक्षण (ग्लेन के उदाहरण में वे नहीं हैं) के समान त्रुटि विचरण अनुमान का उपयोग करना चाहिए।
Scortchi - को पुनः स्थापित मोनिका

1
t=(y¯1y¯2)/(σ^1n1+1n2)σ^

1
MSE

1
pt>.05pF<0.002

1
मैंने कुछ मिनट पहले इस प्रश्न के पहले भाग का एक उत्तर दिया, जो आँकड़े.स्टैकएक्सचेंज . com / questions / 83030/… पर एक टिप्पणी में दिया गया था
whuber

जवाबों:


8

ntpt2Φ(2).1573ΦN(0,1)pt0.5.1573pF=.05F

एफ i वाई आई एफ 2 maxi,j|y¯iy¯j|=2aFy¯iF2a

तो, व्यापकता की हानि के बिना, मान लीजिए कि ताकि इस सीमा के मामले में। और फिर, सामान्यता के नुकसान के बिना, मान लें कि , क्योंकि हम हमेशा डेटा को इस मान पर कर सकते हैं। अब पर विचार का अर्थ है (जहां भी सादगी के लिए है [लेकिन नीचे टिप्पणी 1 देखें]), हमारे पास । सेट करना ताकि , हम। सब जब हैं (और अभी भी , प्रत्येक अशून्य) ˉ y मैं=±एकएमएस=1कश्मीरकश्मीरएफ=Σn ˉ y 2/(कश्मीर-1)y¯.=0y¯i=±aMSE=1kkF=ny¯2/(k1)MSE=kna2k1pF=αF=Fα=Fα,k1,k(n1)a=(k1)Fαkny¯i±aMSE=1t आँकड़ा इस प्रकार है । संभव यह सबसे छोटा अधिकतम मान है ।t=2a12/n=2(k1)FαktF=Fα

तो आप बस और अलग-अलग मामलों की कोशिश कर सकते हैं , , और इसके संबंधित गणना कर सकते हैं । लेकिन ध्यान दें कि दिए गए , में घट रहा है [लेकिन नीचे 3 नोट देखें]; इसके अलावा, , ; so । ध्यान दें कि का अर्थ है और SD । तो , की परवाह किए बिनाkntptkFαnn(k1)Fα,k1,k(n1)χα,k12ttmin=2χα,k12/kχ2/k=k1kχ2/(k1)k1kk1k2k1limktmin=2α , और परिणाम जो मैंने ऊपर पहले पैराग्राफ में कहा था वह एसिम्प्टोटिक सामान्यता से प्राप्त होता है।

हालांकि उस सीमा तक पहुंचने में लंबा समय लगता है, हालांकि। यहाँR विभिन्न मूल्यों के लिए परिणाम (गणना का उपयोग ) , का उपयोग कर रहे हैं :kα=.05

k       t_min    max p_t   [ Really I mean min(max|t|) and max(min p_t)) ]
2       1.960     .0500
4       1.977     .0481   <--  note < .05 !
10      1.840     .0658
100     1.570     .1164
1000    1.465     .1428
10000   1.431     .1526

कुछ ढीले समाप्त होते हैं ...

  1. जब k विषम है: अधिकतम आँकड़ा तब भी होता है जब सभी ; हालाँकि, हमारे पास रेंज के एक छोर पर दूसरे की तुलना में अधिक होगा, जिससे , और आप दिखा सकते हैं कि स्टेटिस्टिक में फैक्टर को से बदल दिया गया है । यह के हर को बदल देता है , जिससे यह थोड़ा बड़ा हो जाता है और इसलिए कम हो ।Fy¯i±a±a/kkFk1ktpt
  2. असमान s:n अधिकतम को अभी भी साथ प्राप्त किया गया , जिसमें संकेतों के साथ नमूना आकारों को यथासंभव समान रूप से संतुलित करने की व्यवस्था की गई है। फिर समान डेटा आकार लिए आँकड़ा संतुलित डेटा के लिए समान या छोटा होगा। इसके अलावा, अधिकतम आँकड़ा बड़ा होगा क्योंकि यह सबसे बड़ा । इसलिए हम असंतुलित मामलों को बड़ा मान प्राप्त नहीं कर सकते हैं ।Fy¯i=±aFN=nitnipt
  3. एक मामूली सुधार: मैं न्यूनतम को खोजने की कोशिश में इतना केंद्रित था कि मैंने इस तथ्य की अनदेखी की कि हम को अधिकतम करने की कोशिश कर रहे हैं , और यह कम स्पष्ट है कि कम df के साथ एक बड़ा एक छोटे से कम महत्वपूर्ण नहीं होगा अधिक df के साथ। हालाँकि, मैंने सत्यापित किया कि यह के मानों की गणना करके मामला है जब तक कि df को थोड़ा अंतर करने के लिए पर्याप्त उच्च नहीं है। केस मैंने कोई भी केस नहीं देखा जहां मान साथ नहीं बढ़ा । ध्यान दें कि इसलिए संभव df जोपी टी टी एन = 2 , 3 , 4 , ... α = .05 , कश्मीर 3 पी टी एन डी एफ = कश्मीर ( n - 1 ) कश्मीर , 2 कश्मीर , 3 कश्मीर , ... कश्मीर α = .25 .1573 कश्मीर = 3 , एन = 2tpttn=2,3,4,α=.05,k3ptndf=k(n1)k,2k,3k,kबड़ा है। इसलिए मैं अभी भी ऊपर के दावे के साथ सुरक्षित जमीन पर हूं। मैंने भी परीक्षण किया , और मैंने केवल वही मामला देखा जहाँ सीमा को पार किया गया था ।α=.25.1573k=3,n=2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.