परिवार में यह सब है; लेकिन क्या हम ससुराल भी शामिल हैं?


9

मान लीजिए कि मेरे पास दो या अधिक कारकों के साथ एक प्रयोग है। एक समग्र एनोवा का निर्माण किया जाता है, और फिर हम पोस्ट हॉक परीक्षणों के दो या अधिक सेटों के साथ अनुवर्ती करते हैं , एकाधिक तुलना कहते हैं। मेरा प्रश्न यह है कि इन पोस्ट हॉक परीक्षणों की बहुलता समायोजन के आधार के रूप में --- और कितने --- --- परिवारों का उपयोग किया जाना चाहिए ।

एक उदाहरण EDA पर टुकी की पुस्तक से ताना-तोड़ता हुआ डेटासेट है। दो कारक हैं: wool(दो स्तरों पर) और tension(तीन स्तरों पर)। एनोवा तालिका है:

Source       Df Sum Sq Mean Sq F value    Pr(>F)    
wool          1  450.7  450.67  3.7653 0.0582130
tension       2 2034.3 1017.13  8.4980 0.0006926
wool:tension  2 1002.8  501.39  4.1891 0.0210442
Residuals    48 5745.1  119.69  

स्पष्ट रूप से, मॉडल में सहभागिता की आवश्यकता है। इसलिए हम तय किए गए दूसरे कारक को पकड़ते हुए, प्रत्येक कारक के स्तरों की तुलना करने का निर्णय लेते हैं। परिणाम नीचे हैं, कुछ एनोटेशन के साथ जिन्हें बाद में संदर्भित किया जाना है:

*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***

wool = A:   *** Family T|A ***
 contrast   estimate       SE df t.ratio
 L - M    20.5555556 5.157299 48   3.986
 L - H    20.0000000 5.157299 48   3.878
 M - H    -0.5555556 5.157299 48  -0.108

wool = B:   *** Family T|B ***
 contrast   estimate       SE df t.ratio
 L - M    -0.5555556 5.157299 48  -0.108
 L - H     9.4444444 5.157299 48   1.831
 M - H    10.0000000 5.157299 48   1.939


*** Comparison of wool for each tension ***
*** All combined: Family W ***

tension = L:   *** Family W|L ***
 contrast  estimate       SE df t.ratio
 A - B    16.333333 5.157299 48   3.167

tension = M:   *** Family W|M ***
 contrast  estimate       SE df t.ratio
 A - B    -4.777778 5.157299 48  -0.926

tension = H:   *** Family W|H ***
 contrast  estimate       SE df t.ratio
 A - B     5.777778 5.157299 48   1.120

मुझे लगता है कि वहां अलग-अलग प्रथाएं हैं, और मुझे आश्चर्य है कि जो सबसे आम हैं, और प्रत्येक दृष्टिकोण के लिए लोग क्या तर्क देंगे या करेंगे। समायोजित मानों की गणना करने के लिए , क्या हमें कई गुणा समायोजन करना चाहिए ...पी

  1. पांच सबसे छोटे परिवारों में से प्रत्येक (टी | ए, टी | बी, ..., डब्ल्यू | एच) अलग से? (नोट - अंतिम 3 परिवारों का केवल एक ही परीक्षण है, ताकि उन लोगों के लिए कोई गुणन समायोजन न हो)
  2. बड़े परिवारों में से प्रत्येक (टी, 6 परीक्षणों और डब्ल्यू, 3 परीक्षणों के साथ) अलग से?
  3. सभी परीक्षणों को एक बड़ा परिवार माना जाता है?6+3=9

मैं दोनों में दिलचस्पी रखता हूं कि लोग आमतौर पर क्या करते हैं (भले ही उन्होंने इसके बारे में ज्यादा नहीं सोचा हो) और क्यों (यदि उनके पास है)। कुछ चीजें जो मैं उल्लेख कर सकता हूं:

  • एनोवा तालिका में 3 परीक्षण हैं। मुझे याद नहीं है कि किसी को भी ANOVA परीक्षणों पर एक बहुलता समायोजन पर विचार करना चाहिए। यदि ऐसा है, और आप विकल्प (3) की सलाह देते हैं, तो क्या आप असंगत हैं?एफ
  • अगर हम कुछ हद तक एक छोटे प्रयोग है जहां सभी परीक्षणों कम शक्तिशाली हैं किया था, यह संभव है बातचीत नहीं होता महत्वपूर्ण किया गया है, का एक बहुत छोटी संख्या के लिए अग्रणी पद हॉक केवल सीमांत साधनों की तुलना। इसके अलावा, सीमांत साधनों का बड़े सेलेबस में सेल के साधनों की तुलना में अच्छा एसई हो सकता है। अगर, इसके अलावा, गुणन समायोजन कम रूढ़िवादी है, तो हम कम डेटा के साथ अधिक "महत्वपूर्ण" परिणाम प्राप्त कर सकते हैं, जबकि हमारे पास अधिक डेटा होगा।

देखने के इच्छुक लोगों को क्या कहना है ...

जवाबों:


2

किसी ने अभी तक उत्तर नहीं दिया है, इसलिए मैं इस पर दरार डालूंगा।

यह मेरी राय है (और मैं दूसरे के विचारों को सुनना पसंद करूंगा) कि आपको इस मामले में पूरे 9 परीक्षणों के लिए समायोजित किया जाना चाहिए। यह मानते हुए कि हम परिवार-वार त्रुटि दर सुधार का उपयोग कर रहे हैं,

  • हम एक साथ सभी 9 परीक्षणों से निष्कर्ष निकाल रहे हैं। यानी सूची को स्कैन करना और कुछ भी महत्वपूर्ण खोजने के लिए देखना।

  • ऐसा करने में सक्षम होने के लिए, हम 5% की कुल परिवार-वार त्रुटि दर पर विचार कर रहे हैं । वैकल्पिक रूप से समूहों को 5% एफडब्ल्यूईआर को व्यक्तिगत रूप से ठीक करना होगा। इसका मतलब यह होगा कि जब हम व्याख्या करते हैं, तो हम एक साथ परीक्षणों की व्याख्या नहीं कर सकते हैं, और पहले 6 परीक्षणों को देखना होगा और यह सोचना होगा कि एक झूठे सकारात्मक का 5% मौका है, फिर बाद में आगे के प्रत्येक परीक्षण की बारीकियों को जानना होगा। कि प्रत्येक समूह के लिए झूठे सकारात्मक का 5% मौका है । IMO कई परीक्षण सुधार की उपयोगिता यह है कि हम एक साथ कई परीक्षणों से एक साथ निष्कर्ष निकालने में सक्षम हैं। यह अधिक तर्कसंगत लगता है कि हमें सभी 9 परीक्षणों को देखना चाहिए और पता होना चाहिए कि उन्हें सकारात्मक रूप से जांचने के बजाय झूठे सकारात्मक का 5% मौका है, बिल्कुल भी सही नहीं करने के लिए।

  • एनोवा में तीन वन के लिए समायोजन का मुद्दा दिलचस्प है, लेकिन मेरी राय में केवल तभी प्रासंगिक है जब आप कुछ मॉडल चयन करने की योजना बनाते हैं जिसमें आप केवल महत्वपूर्ण भविष्यवाणियों को स्वीकार करते हैं। यह एक अच्छा पढ़ा जा सकता है, विशेष रूप से निष्कर्ष एक बहुत ही रसीला और उत्कृष्ट पढ़ा है। मैंने इस सवाल से उस कड़ी को चुरा लिया ।एफ

  • बातचीत के प्रभावों को शामिल करने के बारे में आपकी बात दिलचस्प है, और मुझे लगता है कि आप इसे मॉडल चयन के रूप में परिभाषित कर सकते हैं। यदि आप महत्वपूर्ण थे, तो क्या आपने इंटरैक्शन प्रभाव को शामिल किया है? इस मामले में शायद मूल एनोवा में आँकड़े महत्वपूर्ण भविष्यवक्ताओं के चयन की सुविधा के लिए समायोजित किए जाने चाहिए। एफ

कुल मिलाकर मुझे लगता है कि यदि आप एक समूह से एक साथ निष्कर्ष निकाल रहे हैं, तो आपको सुधार के लिए उस समूह के प्रत्येक परीक्षण पर विचार करना चाहिए। अन्यथा नियंत्रित समूह त्रुटि दर की मानक समझ नहीं होती है, और जो समायोजित किया गया है और जो नहीं किया गया है, उसे वैचारिक रूप से बनाए रखना काफी मुश्किल है। बहुत बेहतर, मेरी राय में, सभी परीक्षणों को जवाबदेह ठहराने और किसी दिए गए सीमा पर परिवार-वार त्रुटि दर को पकड़ने के लिए।

यदि आपके पास कोई खंडन है, तो मैं उन्हें सुनना पसंद करूंगा, और मुझे यकीन है कि कुछ लोग यहां कुछ चीजों से असहमत होंगे। दूसरे के विचारों को सुनने के लिए बहुत दिलचस्पी है।


धन्यवाद। सुविचारित। साइड सवाल: क्या ऐसा करने के लिए एसएएस प्राप्त करना संभव है? मुझे ऐसा नहीं लगता है लेकिन बहुत कुछ है जो मुझे एसएएस के बारे में नहीं पता है। यह प्रासंगिक है क्योंकि मुझे लगता है कि इस प्रकार का समायोजन शायद ही कभी अभ्यास में उपयोग किया जाता है।
रस्स लेन्थ

दुर्भाग्य से मैं एसएएस के बारे में इतना कुछ नहीं जानता, क्षमा करें @rvl। शायद कोई और इसे देखेगा और मदद करेगा। मुझे उम्मीद है कि आपको इस मुद्दे के लिए कुछ और लोग मिलेंगे, यह एक बहुत अच्छा सवाल है कि लोग वास्तव में उस बारे में कभी नहीं सोचते हैं।
क्रिस सी

यह ठीक है - मैं सिर्फ इस बारे में सोच रहा था कि वास्तव में मौजूदा सॉफ्टवेयर के साथ आसानी से क्या संभव है। यदि सर्वसम्मति विकल्प 3 पर आ जाती है, तो हमें इसके लिए सॉफ़्टवेयर समर्थन की आवश्यकता है!
रोस लेन्थ

... लेकिन अब इसे R में देखा जा सकता है। संबंधित प्रश्न, आँकड़े .stackexchange.com/ questions/ 165125 / में मैंने जो नया उत्तर पोस्ट किया है । यही सवाल है जो मुझे इस बारे में सोच रहा है।
रस लेथ अगेन 15'15

बहुत ही शांत! क्या आप इसके अनुरक्षक हैं lsmeans? उस सवाल के लिए यह बहुत काम था!
क्रिस सी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.