एनोवा में चर का क्रम मायने रखता है, है ना?


20

क्या मैं यह समझने के लिए सही हूं कि एक बहुक्रियाशील ANOVA में चर को जिस क्रम में निर्दिष्ट किया गया है, उससे कुछ फर्क पड़ता है लेकिन यह कि कई रेखीय प्रतिगमन करते समय यह क्रम मायने नहीं रखता है?

तो एक परिणाम मानकर जैसे कि रक्त की हानि y और दो श्रेणीबद्ध चर

  1. ग्रंथिपेश्यर्बुद विधि a ,
  2. तोंसिल्लेक्टोमी विधि b

मॉडल मॉडल के y~a+bलिए अलग है y~b+a(या इसलिए आर में मेरा कार्यान्वयन इंगित करता है)।

क्या मैं यह समझने के लिए सही हूँ कि यहाँ शब्द यह है कि एनोवा एक पदानुक्रमित मॉडल है क्योंकि यह पहले कारक के रूप में उतना ही भिन्नता रखता है जितना कि दूसरे कारक को अवशिष्ट विचरण करने का प्रयास करने से पहले पहला कारक हो सकता है?

ऊपर दिए गए उदाहरण में पदानुक्रम समझ में आता है क्योंकि मैं हमेशा टॉन्सिल्लेक्टोमी करने से पहले एडीनोएक्टॉमी करवाता हूं, लेकिन क्या होगा अगर किसी के पास कोई अंतर्निहित आदेश के साथ दो चर हों?


12
असंतुलित डिजाइनों के साथ ANOVAs में ऑर्डर के मामले, जब असमान सेल आकार होते हैं। इस विषय को अक्सर "वर्गों के प्रकार" के शीर्षक के तहत माना जाता है। देखें epm.sagepub.com/content/38/3/621.full.pdf+html करने और CHL के जवाब stats.stackexchange.com/questions/11209/...
स्याहगोश


मैंने सिर्फ एक बड़ी चर्चा की है कि मेरी उम्मीद है कि यह इस मामले पर एक और प्रकाश डालेगा। यह निश्चित रूप से अभी भी काम करने की आवश्यकता है, और संभवतः किसी के पास इसे संपादित करने में मदद करने के लिए तंत्रिकाएं हैं। यहाँ मेरे पास अभी तक क्या है: go.helms-net.de/stat/div/%28SSE%29%20ANovaRegression_SPSS_R.htm संभवतः उस प्रश्न के कुछ खोजपूर्ण उत्तर के लिए निकाले जाने की क्षमता के साथ कुछ दिलचस्प है।
गॉटफ्रीड हेल्स

जवाबों:


17

यह सवाल स्पष्ट रूप से एक असंतुलित दो-तरफा डिजाइन के साथ एक अध्ययन से आया, आर के साथ aov()फ़ंक्शन में विश्लेषण किया गया ; यह पृष्ठ इस मुद्दे का अधिक हालिया और विस्तृत उदाहरण प्रदान करता है।

इस सवाल का सामान्य जवाब, इतने सारे के रूप में है: "यह निर्भर करता है।" यहां यह इस बात पर निर्भर करता है कि डिज़ाइन संतुलित है या नहीं, यदि नहीं, तो एनोवा के किस स्वाद को चुना जाता है।

सबसे पहले, यह निर्भर करता है कि डिजाइन संतुलित है या नहीं। सभी संभावित दुनिया के सर्वश्रेष्ठ में, एक फैक्टरियल डिज़ाइन के सभी कक्षों में समान संख्या में मामलों के साथ, मॉडल में कारकों को दर्ज करने के आदेश के कारण कोई अंतर नहीं होगा, भले ही एनोवा को कैसे किया जाए। * हाथ में मामले। , स्पष्ट रूप से पूर्वव्यापी नैदानिक ​​कोहर्ट से, एक वास्तविक दुनिया से प्रतीत होता है, जहां ऐसा संतुलन नहीं पाया गया था। इसलिए आदेश मायने रख सकता है।

दूसरा, यह इस बात पर निर्भर करता है कि एनोवा कैसे किया जाता है, जो कुछ हद तक विवादास्पद मुद्दा है। असंतुलित डिजाइन के लिए एनोवा के प्रकार मुख्य प्रभाव और बातचीत के मूल्यांकन के क्रम में भिन्न होते हैं। बातचीत का मूल्यांकन दो-तरफ़ा और उच्च-क्रम एनोवा के लिए मौलिक है, इसलिए आगे बढ़ने के सर्वोत्तम तरीके पर विवाद हैं। एक विवरण और चर्चा के लिए यह क्रॉस मान्य पृष्ठ देखें । एक अलग दृश्य के लिए पैकेज के लिए मैनुअल में विवरण और चेतावनी Anova()(एक राजधानी "ए" के साथ) के लिए देखें।car

आर में डिफ़ॉल्ट के तहत असंतुलित डिजाइनों में कारकों का क्रम मायने रखता है aov(), जो टाइप-आई परीक्षणों को कहते हैं। ये मॉडल में प्रवेश के क्रम में कारकों के क्रमिक विचलन हैं, वर्तमान प्रश्न के रूप में। आदेश नहीं है प्रकार द्वितीय या टाइप-III द्वारा प्रदान की परीक्षण के साथ बात Anova()में समारोह carआर में पैकेज ये विकल्प हैं, हालांकि, अपने स्वयं के संभावित नुकसान ऊपर दिए गए लिंक में बताया गया है।

अंत में, lm()आर के साथ कई रैखिक प्रतिगमन के संबंध पर विचार करें , जो अनिवार्य रूप से एक ही प्रकार का मॉडल है यदि आप इंटरैक्शन शब्द शामिल करते हैं। रिपोर्ट किए गए lm()प्रतिगमन गुणांक और पी- अंतराल के संदर्भ में चर के प्रवेश का क्रम मायने नहीं रखता है summary(lm()), जिसमें के-स्तरीय श्रेणीगत कारक को (k-1) बाइनरी डमी चर के रूप में कोडित किया गया है और प्रत्येक डमी के लिए प्रतिगमन गुणांक की सूचना दी गई है ।

हालाँकि, यह संभव है कि lm()आउटपुट anova()(आर- statsपैकेज से "कम-केस", "आर पैकेज से" Anova()लिपटे या इसके सभी स्तरों पर प्रत्येक कारक के प्रभाव को संक्षेप में प्रस्तुत कर सके, क्योंकि शास्त्रीय एनोवा में एक की उम्मीद है। तब कारकों के क्रम के साथ के anova()रूप में के लिए मायने रखता है aov(), और के साथ कोई फर्क नहीं पड़ेगा Anova()। इसी तरह, जिस प्रकार के एनोवा का उपयोग करने के लिए विवाद वापस आएंगे। इसलिए lm()मॉडल के सभी डाउनस्ट्रीम उपयोगों के साथ कारक प्रविष्टि के आदेश-स्वतंत्रता को मान लेना सुरक्षित नहीं है ।


* सभी कोशिकाओं में समान संख्या में अवलोकनों का होना पर्याप्त है, लेकिन जैसा कि मैं इसे समझता हूं, अप्रासंगिक होने के लिए कारकों के क्रम के लिए आवश्यक नहीं है। आदेश-स्वतंत्रता के लिए शेष मांग के कम प्रकार की अनुमति हो सकती है।


वास्तव में, यह अवलोकन डेटा असंतुलित था, बहुत असंतुलित था।
फरल

उम्मीद है कि इस टिप्पणी का अभी भी यहाँ जवाब मिलता है: आप कहते हैं कि, एक संतुलित अध्ययन डिजाइन के तहत, एसएस अनुमान कभी भी आश्रित परीक्षण के प्रकार (भले ही, II, III) के आधार पर आदेश पर निर्भर नहीं होगा। अगर मुझे यह समझ में नहीं आता है, तो मुझे यकीन नहीं है R में 'aova' फंक्शन का उपयोग करना (जो टाइप I टेस्ट का उपयोग करता है) डेटा पर आधारित एक रेखीय मॉडल पर जो संतुलित है, निश्चित रूप से फीचर ऑर्डर मायने रखता है, नहीं?
PejoPhylo

1
@PejoPhylo जब डेटा संतुलित होता है तो आपके पास एक ऑर्थोगोनल डिज़ाइन कहा जाता है। एक ऑर्थोगोनल डिजाइन के साथ उपचार और उनकी बातचीत के बीच वर्गों के विभाजन को विभाजित करने का एक अनूठा तरीका है, इसलिए उपचार के प्रवेश का क्रम प्रभाव और उनके पी-मूल्यों के अनुमान के संबंध में कोई फर्क नहीं पड़ेगा। यह पृष्ठ गणितीय व्याख्या प्रदान करता है। यह तुरंत स्पष्ट नहीं है; प्रश्न जो मैंने अभी जोड़ा है, इस साइट के एक सदस्य द्वारा सबसे अधिक प्रतिष्ठा के साथ पूछा गया था। असंतुलित डेटा ऑर्थोगोनलिटी को नष्ट कर सकता है।
एड्म

आपके उत्तर के लिए बहुत बहुत धन्यवाद @EdM
PejoPhylo

0

शब्द पदानुक्रमित मॉडल कारकों के बीच संरचना को संदर्भित करता है। उदाहरण के लिए, एक बहु-केंद्र अध्ययन पदानुक्रमित है: आपके पास अस्पतालों में इलाज करने वाले मरीजों के साथ नेस्टेड हैं। प्रत्येक अस्पताल प्लेसबो और वर्म के साथ रोगियों का इलाज करता है, लेकिन उनमें से प्रत्येक को अस्पताल ए या बी में भर्ती करना उनके सभी रोगियों पर अस्पताल के कुछ सामान्य प्रभाव के कारण थोड़ा अलग है (प्रयोगात्मक एजेंट के साथ बातचीत का प्रभाव भी हो सकता है)। तो इसे पदानुक्रमित प्रभाव कहा जाता है।

अब आपके एक्टोमी के तरीके पदानुक्रमिक हो सकते हैं: क्या यह प्रशंसनीय है कि एक निश्चित टॉन्सिलोटॉमी पद्धति थोड़ी अलग है (अपने आप में, अभी तक प्रभाव में नहीं है, क्योंकि वही है जो एडेनोइडेक्टेक्ट विधि के आधार पर पहले इस्तेमाल की गई विधि के आधार पर) मरीज़? यदि हाँ, तो आपको इसे अपने मॉडल में निर्दिष्ट करना चाहिए।

आपका अवलोकन कि y ~ a + b, y ~ b + से भिन्न हो सकता है, यह दर्शाता है कि कुछ गड़बड़ है। एडिटिव इफेक्ट्स कम्यूट करते हैं, इसलिए अंतर नहीं होना चाहिए (छोटे संख्यात्मक अंतर के अलावा)। यह न तो प्रशंसनीय है और न ही वांछित है कि सर्जरी के तरीकों का प्रभाव उस क्रम पर निर्भर हो सकता है जिसमें सांख्यिकीविद् बाद में प्रभावों को निर्दिष्ट करता है। इसलिए आपने शायद Rडेटा के साथ फीड करने के लिए गलत तरीका चुना है ।


1
मुझे यकीन नहीं है कि मैं अंतिम पैराग्राफ का पालन करता हूं। असंतुलित तथ्यात्मक एनोवा में टाइप I (अनुक्रमिक) वर्गों के माध्यम से गणना किए गए प्रत्येक कारक के लिए पी-मान निश्चित रूप से कारकों के क्रम पर निर्भर करेगा। मेरा मानना ​​है कि यह सवाल का पूरा बिंदु है।
अमीबा का कहना है कि

मुझे यकीन नहीं हो रहा है अगर @Farrel को I I टाइप मिला। मुझे याद है कि मैंने एक बार एसएएस को डेटा सेट और मॉडल स्टेटमेंट में कुछ असमान छँटाई के कारण विभिन्न प्रकार III एसएस के उत्पादन के लिए देखा था। शायद यह आर के साथ भी हो सकता है?
होर्स्ट ग्रुनबसच

2
मैं एक तथ्य के लिए नहीं जान सकता हूं और वह खुद को याद नहीं कर सकता है कि क्यू को पांच साल पहले पूछा गया था। लेकिन मुझे लगता है कि यह उनके शब्दों की अब तक की सबसे मार्मिक व्याख्या है "मॉडल y ~ a + b मॉडल y के लिए अलग है ~ b + a (या इसलिए आर में मेरा कार्यान्वयन इंगित करता है)", विशेष रूप से तथ्य को देखते हुए aovR में वह कमांड डिफ़ॉल्ट रूप से टाइप I SS का उपयोग करता है। जब मैंने इनाम की पेशकश की, तो मुझे असंतुलित एनोवा डिजाइन के पीछे के मुद्दों के बारे में बताते हुए एक उत्तर मिलने की उम्मीद थी, टाइप I / II / III एसएस के बीच अंतर, और कुछ टिप्पणी कि क्या रैखिक प्रतिगमन करता है या समान मुद्दे नहीं हैं।
अमीबा का कहना है कि मोनिका

1
नहीं, भले ही एसएस I / II / III के बीच कोई अंतर नहीं है, भले ही डिजाइन मैट्रिक्स एनोवा में एकवचन है। SS I / II / III केवल असंतुलित मामले में अलग हैं क्योंकि कारक गैर-ऑर्थोगोनल (संतुलित संतुलन के विपरीत) हो जाते हैं। मेरी समझ में, यह सहसंबद्ध भविष्यवक्ताओं के साथ एक रेखीय प्रतिगमन से मेल खाता है, जो एक बहुत ही सामान्य स्थिति है। मेरा जवाब है कि एक ही मुद्दा प्रतिगमन में भी होता है, यह सिर्फ इतना है कि अन्य सभी भविष्यवक्ताओं के प्रभावों के लिए लेखांकन के बाद एक भविष्यवक्ता के पी-मूल्य की गणना करना मानक है; यह एनोवा में टाइप III एसएस से मेल खाती है।
अमीबा का कहना है कि मोनिका

1
एनोवा में चर आदेश के बारे में इस तरह के सवालों की तरह, में आते हैं यह एक कल स्टैक ओवरफ़्लो से चले गए। मुझे लगता है कि यह है कि इस 5 वर्षीय प्रश्न इसी तरह के आधार पर किया गया था ग्रहण करने के लिए सुरक्षित है aovके बजाय lm, और यह प्रकार के इस सवाल का कि @amoeba 12 मई, 14:31 से टिप्पणी में संकेत करने के लिए एक जवाब के लिए मददगार होगा ।
ईडीएम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.