प्रतिगमन विश्लेषण और विचरण के विश्लेषण के बीच अंतर?


21

मैं अभी प्रतिगमन विश्लेषण और विचरण के विश्लेषण के बारे में सीख रहा हूं।

प्रतिगमन विश्लेषण में आपके पास एक चर निर्धारित होता है और आप जानना चाहते हैं कि चर दूसरे चर के साथ कैसे जाता है।

विचरण के विश्लेषण में आप उदाहरण के लिए जानना चाहते हैं: यदि यह विशिष्ट पशु भोजन जानवरों के वजन को प्रभावित करता है ... तो एक निश्चित संस्करण और अन्य पर प्रभाव ...

क्या यह सही है या गलत, pls मेरी मदद करें ...

जवाबों:


25

मान लीजिए कि आपके डेटा सेट एक सेट होता है के लिए मैं = 1 , ... , n और आप की निर्भरता को देखने के लिए चाहते हैं y पर एक्स(xi,yi)i=1,,nyx

आप मूल्यों को खोजने के मान लीजिए α और β की α और β कि वर्गों का अवशिष्ट राशि को कम से कम n Σ मैं = 1 ( y मैं - ( α + β एक्स मैं ) ) 2 तो फिर तुम ले y = α + β एक्सα^β^αβ

i=1n(yi(α+βxi))2.
y^=α^+β^x भविष्यवाणी की जा करने के लिए किसी के लिए -value (जरूरी पहले से ही नहीं देखा) एक्स -value। यह रैखिक प्रतिगमन है।yx

अब वर्गों के कुल योग को घटाकर विचार करें के साथn-1स्वतंत्रता की डिग्री, "समझाया" और "अस्पष्टीकृत" भागों में: n Σ मैं = 1 ( ( α + β एक्स मैं ) - ˉ y ) 2 समझाया+ n Σ मैं = 1 ( y मैं - ( α + β एक्स मैं ) ) 2

i=1n(yiy¯)2where y¯=y1++ynn
n11 के साथ
i=1n((α^+β^xi)y¯)2explained + i=1n(yi(α^+β^xi))2unexplained.
1और 2 / 1n2स्वतंत्रता की डिग्री, क्रमशः। यही कारण है कि भिन्नता के विश्लेषण है, और एक तो एफ आंकड़े तरह बातें मानता है
F=i=1n((α^+β^xi)y¯)2/1i=1n(yi(α^+β^xi))2/(n2).
यह एफ आंकड़ा शून्य परिकल्पना का परीक्षण करती है β=0

y=α+βi
ikk1nk

अतिरिक्त बिंदुओं की एक जोड़ी:

  • कुछ गणितज्ञों के लिए, ऊपर दिए गए खाते से यह प्रतीत हो सकता है कि पूरा क्षेत्र केवल वही है जो ऊपर देखा गया है, इसलिए यह रहस्यमय लग सकता है कि विचलन के प्रतिगमन और विश्लेषण दोनों सक्रिय अनुसंधान क्षेत्र हैं। यहाँ पोस्ट करने के लिए उपयुक्त उत्तर में फिट होने के लिए बहुत कुछ नहीं है।
  • y=α+βx

5
@MichaelHardy जबकि प्रतिगमन में घटकों में विचरण के विघटन को अक्सर विचरण तालिका के विश्लेषण के रूप में संदर्भित किया जाता है। यह वैसा नहीं है जैसा आमतौर पर एनोवा द्वारा सांख्यिकीविदों का मतलब है। विधियों 1) रैखिक प्रतिगमन, 2) विचरण का विश्लेषण और 3) सहसंयोजक का विश्लेषण सामान्य रेखीय मॉडल के सामान्य शीर्षक के तहत श्रेणियां हैं, रैखिक प्रतिगमन में निरंतर कोवरिएट्स शामिल होते हैं, एनोवा में केवल असतत समूह शामिल होते हैं और ANCOVA निरंतर कोवरिएट्स का एक संयोजन है और असतत समूह।
माइकल आर। चेरिक

1
अनौपचारिक रूप से कभी-कभी कोई इस तरह से बोलता है, और मेरे जवाब में यह नहीं कहा गया है, लेकिन किसी को पता होना चाहिए कि (1) गुणांक का कम से कम अनुमान दो समस्याओं (निरंतर या श्रेणीबद्ध भविष्यवक्ताओं) या योग के अपघटन में से किसी एक में किया जाता है। स्वतंत्रता की अपनी इसी डिग्री के साथ वर्गों की --- एक एनोवा तालिका --- भी दो समस्याओं में से एक में किया जाता है।
माइकल हार्डी

5
उस रियायत के साथ फिर आपको यह स्वीकार करना होगा कि मेरे उत्तर में कुछ भी गलत नहीं है। इसके अलावा ANOVA, ANCOVA और प्रतिगमन शब्द अनौपचारिक शब्द नहीं हैं। वे बहुत स्पष्ट रूप से औपचारिक हैं और ओपी को यह बताना गलत है कि एनोवा, प्रतिगमन में विचरण का अपघटन है। तथ्य यह है कि एक सांख्यिकीय प्रक्रिया जिसे कोई भी एनोवा नाम दे सकता है वह किसी भी रैखिक मॉडल को साबित नहीं कर सकती। एसएएस की खरीद में reg Regment के साथ ही डील करता है, aova में केवल विचरण के विश्लेषण के साथ सौदा होता है क्योंकि मैंने इसे परिभाषित किया था और glm वह है जो दोनों करता है।
माइकल आर। चेर्निक

1
.... और आर में, "एलएम (....)" दोनों स्थितियों में प्रतिगमन गुणांक देता है, और "एनोवा (एलएम (....))" वर्ग के योग का अपघटन और स्वतंत्रता की डिग्री देता है, में दोनों स्थितियों। जहाँ तक "स्वीकार करना" है, मैंने आपके उत्तर के नीचे कुछ और टिप्पणियाँ रखी हैं। निश्चित रूप से यदि आप लॉजिस्टिक रिग्रेशन का उल्लेख करने जा रहे हैं, तो यह स्पष्ट हो जाएगा यदि आपने कहा कि जैसे ही आप रैखिक रिग्रेशन के बारे में बात नहीं कर रहे हैं, शब्द "रिग्रेशन" एक बहुत व्यापक शब्द है जिसमें कई चीजें शामिल हो सकती हैं।
माइकल हार्डी

@MichaelHardy मेरे सवाल पर टिप्पणी करने के लिए स्वतंत्र महसूस करें। मुझे लगता है कि इस सवाल पर आपका जवाब और मेरा जवाब दोनों एक तरह से सही हैं। मैं निश्चित रूप से मेरे उत्तर को अस्वीकार किए जाने पर आपत्ति करता हूं। मैं इस बारे में सांख्यिकी समुदाय के अन्य लोगों की राय लेना चाहता था।
माइकल आर। चेर्निक

5

मुख्य अंतर प्रतिक्रिया चर है। जबकि लॉजिस्टिक रिग्रेशन रैखिक प्रतिगमन विश्लेषण में एक द्विआधारी प्रतिक्रिया से संबंधित होता है और साथ ही प्रतिक्रिया चर निरंतर नहीं है। आपके पास एक चर (s) (उर्फ कोवरिएट (s)) है जो निरंतर प्रतिक्रिया चर के लिए एक कार्यात्मक संबंध रखता है। विचरण के विश्लेषण में प्रतिक्रिया निरंतर है लेकिन कुछ अलग श्रेणियों (जैसे उपचार समूह और नियंत्रण समूह) से संबंधित है। विचरण के विश्लेषण में आप समूहों के बीच माध्य प्रतिक्रिया में अंतर खोजते हैं। रैखिक प्रतिगमन में आप देखते हैं कि कैसे प्रतिक्रिया बदलती है जैसे ही कोवरिएट्स बदलते हैं। अंतर को देखने का एक और तरीका यह है कि प्रतिगमन में सहसंयोजक निरंतर होते हैं जबकि विचरण के विश्लेषण में वे समूहों का असतत समूह होते हैं।


6
मैं रैखिक विखंडन और विचरण के विश्लेषण के बीच अंतर का मतलब करने के लिए सवाल उठाया है ; लॉजिस्टिक रिग्रेशन में लाने से विषय से दूर होने लगता है। हालाँकि, आपका अंतिम वाक्य गलत है। विचरण का विश्लेषण इस बात की परवाह किए बिना किया जा सकता है कि भविष्यवक्ता असतत हैं या निरंतर।
माइकल हार्डी

1
विचरण के विश्लेषण में वास्तव में भविष्यवक्ता हैं। आपके उदाहरण में, भविष्यवक्ता स्पष्ट है, लेकिन ऐसा होने की आवश्यकता नहीं है। विचरण का विश्लेषण केवल "असतत समूहों" से जुड़ी समस्याओं पर विचार नहीं करता है ।
माइकल हार्डी

3
@ मिचेलहार्डी मैं एक कदम वापस ले रहा हूं क्योंकि जब मैं अपने सांख्यिकीय विश्वकोशों की जांच करता हूं तो मुझे सामान्य रैखिक मॉडल में विचरण के विघटन के संदर्भ में विचरण के विश्लेषण का संदर्भ मिलता है। लेकिन इस शब्द के दो अर्थ हैं और काफी बार एनोवा को एएनसीओएवीए और मेरे द्वारा बताए गए तरीके से प्रतिगमन से अलग किया जाता है। तो ओपी को दोनों शर्तों के बारे में पता होना चाहिए जो सामान्य रैखिक मॉडल में विचरण घटकों के बारे में हीनता को संदर्भित करता है और वह जो रैखिक मॉडल के उपवर्ग को संदर्भित करता है जिसमें केवल असतत समूह शामिल होते हैं।
माइकल आर। चेर्निक

2
मुझे लगता है कि आप अनौपचारिक के रूप में उपयोग कर रहे हैं। लॉजिस्टिक रिग्रेशन का उल्लेख करते हुए यह कहना अजीब लगता है कि यह "रिग्रेसन" की एक किस्म के रूप में है, जब उस शब्द का उपयोग किसी दिए गए एक चर के औसत या अनुमानित मूल्य का अनुमान लगाने के व्यापक अर्थ में किया जाता है, और फिर इसे विचरण के विश्लेषण से अलग किया जाता है । । लेकिन रैखिक प्रतिगमन मॉडल और विचरण के विश्लेषण के बीच अंतर का सवाल एक अधिक समझदार प्रश्न जैसा लगता है। लेकिन अक्सर मूल पोस्टर के इरादे के बारे में अनिश्चितताएं होती हैं।
माइकल हार्डी

7
आपके इरादे जो भी रहे हों, मुझे लगता है कि " मेरे पास आँकड़ों में पीएचडी है, ... " टिप्पणी अनुचित होने के लिए। सबसे पहले, यह मुद्दे को हल करने के लिए कुछ भी नहीं करता है। अधिकार प्राप्त करने के लिए अपील करना एक अयोग्य उपयोग है, लेकिन चीजों को साबित करने के लिए बहुत ही गुमराह करने वाला दृष्टिकोण। अपने अधिकार के लिए अपील करना और भी अधिक समस्याग्रस्त है। इसे दिखाते हुए (अनजाने में या अन्यथा) @MichaelHardy (जिस व्यक्तिगत को आप संबोधित कर रहे हैं) के लिए सम्मान की कमी के रूप में व्याख्या की जा सकती है, जो एक बहुत ही प्रतिष्ठित कार्यक्रम से आंकड़ों में पीएचडी होना भी होता है।
कार्डिनल

2

विचरण का विश्लेषण (एनोवा) संरचना का माना गया अवलोकनों के विश्लेषण का सांख्यिकीय तरीका है

yi=β1xi1+β2xi2++βpxip+ei, i=1(1)npβ1,β2,,βpe1,e2,,enxijei0σ2 (अज्ञात)।

E(yn×1)=Xβ,D(y)=σ2In डी फैलाव मैट्रिक्स या विचरण-सहप्रसरण मैट्रिक्स है।

xijβjxijβj01

xijtTt2,eT

मुख्य रूप से, ये दोनों दो प्रकार के विश्लेषण हैं।


मैं=1(1)n

1
मैं=1(1)nमैं=1,2,...,n

-1

प्रतिगमन विश्लेषण में आपके पास एक चर निर्धारित होता है और आप जानना चाहते हैं कि चर दूसरे चर के साथ कैसे जाता है।

विचरण के विश्लेषण में आप उदाहरण के लिए जानना चाहते हैं: यदि यह विशिष्ट पशु भोजन जानवरों के वजन को प्रभावित करता है ... तो एक निश्चित संस्करण और अन्य पर प्रभाव।


1
नमस्ते आइज़ा, एसई में आपका स्वागत है। आपको अधिक संदर्भ देने के लिए इसे संपादित करने की आवश्यकता है और यह स्पष्ट करना है कि वास्तव में प्रश्न क्या है।
क्लोजिंग क्वेश्चन फास्ट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.