यादृच्छिक और निश्चित-प्रभावों के बीच गणितीय अंतर क्या है?


26

मैंने इंटरनेट पर यादृच्छिक-और निश्चित-प्रभावों की व्याख्या के बारे में बहुत कुछ पाया है। हालाँकि मुझे निम्न स्रोत का स्रोत नहीं मिला:

यादृच्छिक और निश्चित-प्रभावों के बीच गणितीय अंतर क्या है?

उसके द्वारा मेरा मतलब है कि मॉडल का गणितीय सूत्रीकरण और जिस तरह से पैरामीटर का अनुमान लगाया गया है।


1
खैर, निश्चित प्रभाव एक संयुक्त वितरण के माध्यम को प्रभावित करते हैं और यादृच्छिक प्रभाव विचरण और संघ संरचना को प्रभावित करते हैं। "गणितीय अंतर" से आपका वास्तव में क्या तात्पर्य है? क्या आप पूछ रहे हैं कि संभावना कैसे बदलती है? क्या आप अधिक विशिष्ट हो सकते हैं?
मैक्रों



1
यह प्रश्न उस पृष्ठभूमि को भेद नहीं करता है जिससे इसे खींचा जा रहा है। पैनल डेटा इकोनॉमिक्स में यह शब्दावली मल्टीलेवल मॉडल का उपयोग करने वाले अन्य सामाजिक विज्ञानों में से एक से अलग है। प्रश्न में और स्पष्टीकरण की आवश्यकता है। एल्स, यह उन लोगों के लिए भ्रामक है जो या तो पृष्ठभूमि से यहां नहीं आ रहे हैं, यह नहीं जानते कि संबंधित क्षेत्र में एक वैकल्पिक परिभाषा है।
ल्यूकोनाचो

जवाबों:


21

यादृच्छिक प्रभाव के साथ सरल मॉडल यादृच्छिक प्रभाव के साथ एक तरह से एनोवा मॉडल, टिप्पणियों द्वारा दिए गए है वितरणात्मक मान्यताओं के साथ: ( y मैं j | μ मैं ) ~ आईआईडी एन ( μ मैं , σ 2 डब्ल्यू ) ,yij

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.

यहाँ यादृच्छिक प्रभाव μमैं । वे यादृच्छिक चर हैं, जबकि वे निश्चित प्रभाव वाले एनोवा मॉडल में निश्चित संख्याएं हैं।

उदाहरण के लिए तीन तकनीशियनों के प्रत्येक मैं=1,2,3 एक प्रयोगशाला में माप की एक श्रृंखला रिकॉर्ड करता है, और yमैंj है j तकनीशियन के मई के माप मैं । कॉल μमैं तकनीशियन द्वारा उत्पन्न श्रृंखला के "सच औसत मान" मैं ; यह थोड़ा कृत्रिम पैरामीटर है, आप देख सकते हैंμमैं को मीन मान के रूप में कि तकनीशियन प्राप्त होगा यदि उसने माप की एक बड़ी श्रृंखला दर्ज की थी।मैं

यदि आप , , ( ऑपरेटरों के बीच पूर्वाग्रह का आकलन करने के लिए उदाहरण के लिए ) का मूल्यांकन करने में रुचि रखते हैं , तो आपको निश्चित प्रभावों के साथ एनोवा मॉडल का उपयोग करना होगा।μ 2 μ 3μ1μ2μ3

जब आप variances और मॉडल को परिभाषित करने में रुचि रखते हैं , और कुल विचरण (नीचे देखें) में रुचि रखते हैं, तो आपको यादृच्छिक प्रभावों के साथ ANOVA मॉडल का उपयोग करना होगा । विचरण एक तकनीशियन द्वारा उत्पन्न रिकॉर्डिंग का प्रसरण है (इसे सभी तकनीशियनों के लिए समान माना जाता है), और के बीच की-तकनीशियन विचरण कहा जाता है। शायद आदर्श रूप से, तकनीशियनों को यादृच्छिक पर चुना जाना चाहिए। σ 2 σ 2 + σ 2 डब्ल्यू σ 2 डब्ल्यू σ 2 σw2σ2 σ2+σw2σw2σ2

यह मॉडल डेटा नमूने के लिए विचरण सूत्र के अपघटन को दर्शाता है: यहाँ छवि विवरण दर्ज करें

कुल विचरण = साधन का अंतर विचरण का साधन+

जो यादृच्छिक प्रभावों के साथ एनोवा मॉडल द्वारा परिलक्षित होता है: यहाँ छवि विवरण दर्ज करें

वास्तव में, का वितरण इसके सशर्त वितरण दिए गए और के वितरण द्वारा । यदि कोई के "बिना शर्त" वितरण की गणना करता है, तो हम । ( y मैं j ) μ मैं μ मैं y मैं जे वाई मैं j ~ एन ( μ , σ 2 + σ 2 डब्ल्यू )yमैंj(yij)μiμमैंyमैंjyमैंj~एन(μ,σ2+σw2)

बेहतर तस्वीरों के लिए यहां स्लाइड 24 और स्लाइड 25 देखें (आपको ओवरले की सराहना करने के लिए पीडीएफ फाइल को सहेजना होगा, ऑनलाइन संस्करण न देखें)।


1
(+1) बहुत अच्छे आंकड़े!
अमीबा का कहना है कि मोनिका

1
धन्यवाद @amoeba, जड़ता के क्षणों के लिए मेरा कोड मेरे ब्लॉग पर उपलब्ध है: stla.github.io/stlapblog/posts/Variance_inertia.html
स्टीफन लॉरेंट

मुझे नहीं मिला। अगर मेरे पास कई तकनीशियनों द्वारा किए गए मापों की संख्या है, तो मुझे एनोवा की आवश्यकता क्यों है? क्या मैं प्रत्येक तकनीशियन के परिणामों के लिए एक गाऊसी फिट नहीं कर सकता, और उनमें से प्रत्येक के लिए एक और प्राप्त कर सकता हूं? इसे हल करने का आपका तरीका मुझे क्या करने की अनुमति देता है, जो मेरा तरीका नहीं है? σμσ
TheChymera

@Chymera एनोवा एक आम की धारणा है । इस धारणा के साथ आपको आत्मविश्वास कम होता है। लेकिन आपकी टिप्पणी विभिन्न संस्करणों के साथ आम विचरण बनाम एक एनोवा के साथ एनोवा का उपयोग करने के कारणों के बारे में है, यह वास्तव में यहां विषय नहीं है। σ
स्टीफन लॉरेंट

@ StéphaneLaurent कौन सा ANOVA एक आम की धारणा है ? - यह भी, क्या बातें यह है के लिए आम? आपने कहा "यदि आप μ1, μ2, μ3 का मूल्यांकन करने में रुचि रखते हैं (उदाहरण के लिए ऑपरेटरों के बीच पूर्वाग्रह का आकलन करने के लिए), तो आपको निश्चित प्रभावों के साथ एनोवा मॉडल का उपयोग करना होगा।" निश्चित प्रभावों के साथ एनोवा विधि का सूत्र क्या है, और यह आपको पर सूचित किए बिना आपको पर कैसे सूचित करता है ? इसके अलावा, यह आपको की गणना के लिए सभी आवश्यक जानकारी प्रदान किए बिना का अनुमान कैसे दे सकता है ? (और बेतरतीब प्रभाव मॉडल के लिए इसके विपरीत)σσμमैंσ2μमैंσw2
दिचमेर

16

मूल रूप से, जो मुझे लगता है कि सबसे अलग अंतर है यदि आप एक कारक को यादृच्छिक के रूप में मॉडल करते हैं, तो यह है कि प्रभाव एक सामान्य सामान्य वितरण से तैयार किए गए हैं।

उदाहरण के लिए, यदि आपके पास ग्रेड के संबंध में किसी प्रकार का मॉडल है और आप विभिन्न स्कूलों से आने वाले अपने छात्र डेटा का हिसाब चाहते हैं और आप स्कूल को एक यादृच्छिक कारक के रूप में मॉडल करते हैं तो इसका मतलब है कि आप यह मानते हैं कि स्कूल का औसत सामान्य रूप से वितरित किया जाता है। इसका मतलब है कि भिन्नता के दो स्रोत मॉडलिंग कर रहे हैं: छात्र ग्रेड की इन-स्कूल परिवर्तनशीलता और स्कूल परिवर्तनशीलता के बीच।

इसके परिणामस्वरूप आंशिक पूलिंग नामक कुछ होता है । दो चरम सीमाओं पर विचार करें:

  1. स्कूल पर कोई प्रभाव नहीं पड़ता (स्कूल की परिवर्तनशीलता के बीच शून्य है)। इस मामले में एक रैखिक मॉडल जो स्कूल के लिए खाता नहीं है वह इष्टतम होगा।
  2. स्कूल परिवर्तनशीलता छात्र परिवर्तनशीलता से बड़ी है। फिर आपको मूल रूप से छात्रों के स्तर (कम # नमूने) के बजाय स्कूल स्तर पर काम करने की आवश्यकता है। यह मूल रूप से मॉडल है जहां आप निश्चित प्रभावों का उपयोग करके स्कूल के लिए खाते हैं। यह समस्याग्रस्त हो सकता है यदि आपके पास प्रति विद्यालय कुछ नमूने हों।

दोनों स्तरों पर परिवर्तनशीलता का आकलन करके मिश्रित मॉडल इन दोनों दृष्टिकोणों के बीच एक स्मार्ट समझौता करता है। विशेष रूप से यदि आपके पास प्रति विद्यालय इतने बड़े #students नहीं हैं तो इसका मतलब है कि आपको मॉडल 1 के समग्र माध्य की ओर मॉडल 2 के अनुसार व्यक्तिगत स्कूलों के लिए प्रभावों का संकोचन होगा।

ऐसा इसलिए है क्योंकि मॉडल कहते हैं कि यदि आपके पास दो छात्रों के साथ एक स्कूल है, जो कि स्कूलों की आबादी के लिए "सामान्य" से बेहतर है, तो यह संभावना है कि इस आशय का एक हिस्सा स्कूल द्वारा समझाया गया है जो चुनाव में भाग्यशाली रहा है दो छात्रों को देखा। यह आँख बंद करके नहीं करता है, यह स्कूल की परिवर्तनशीलता के भीतर के अनुमान के आधार पर ऐसा करता है। इसका यह भी अर्थ है कि कम नमूनों वाले प्रभाव स्तर बड़े स्कूलों की तुलना में समग्र रूप से अधिक मजबूती से खींचे जाते हैं।

महत्वपूर्ण बात यह है कि आपको यादृच्छिक कारक के स्तरों पर विनिमेयता की आवश्यकता होती है। इस मामले में इसका मतलब है कि स्कूल आपके ज्ञान से (विनिर्मित) हैं और आप कुछ भी नहीं जानते हैं जो उन्हें अलग बनाता है (कुछ प्रकार की आईडी के अलावा)। यदि आपके पास अतिरिक्त जानकारी है तो आप इसे एक अतिरिक्त कारक के रूप में शामिल कर सकते हैं, यह पर्याप्त है कि स्कूलों को अन्य सूचनाओं के लिए विनिमेय सशर्त दिया जाए।

उदाहरण के लिए, यह मान लेना कि न्यूयॉर्क में रहने वाले 30 वर्षीय वयस्क लिंग पर विनिमेय सशर्त हैं। यदि आपके पास अधिक जानकारी (आयु, जातीयता, शिक्षा) है तो यह उस जानकारी को भी शामिल करने के लिए समझ में आता है।

OTH यदि आपने एक नियंत्रण समूह और तीन बेतहाशा अलग-अलग रोग समूहों के साथ अध्ययन किया है, तो यह मॉडल समूह के लिए कोई मतलब नहीं है क्योंकि विशिष्ट बीमारी विनिमेय नहीं है। हालांकि, बहुत से लोग सिकुड़न प्रभाव को इतनी अच्छी तरह से पसंद करते हैं कि वे अभी भी एक यादृच्छिक प्रभाव मॉडल के लिए बहस करेंगे लेकिन यह एक और कहानी है।

मुझे लगता है कि मैं गणित में बहुत अधिक नहीं मिला था, लेकिन मूल रूप से अंतर यह है कि यादृच्छिक प्रभाव मॉडल ने स्कूलों के स्तर पर और छात्रों के स्तर पर सामान्य रूप से वितरित त्रुटि का अनुमान लगाया, जबकि निश्चित प्रभाव मॉडल में त्रुटि है छात्रों का स्तर। विशेष रूप से इसका मतलब है कि प्रत्येक स्कूल का अपना स्तर है जो एक समान वितरण द्वारा अन्य स्तरों से जुड़ा नहीं है। इसका अर्थ यह भी है कि निर्धारित मॉडल स्कूल के छात्र को मूल डेटा में शामिल नहीं करने पर एक्सट्रपलेशन करने की अनुमति नहीं देता है जबकि यादृच्छिक प्रभाव मॉडल ऐसा करता है, एक परिवर्तनशीलता के साथ जो छात्र स्तर और स्कूल स्तर की परिवर्तनशीलता का योग है। यदि आप विशेष रूप से इस संभावना में रुचि रखते हैं कि हम इसमें काम कर सकते हैं।


1
(+1) एक शानदार उत्तर, जो आश्चर्यजनक रूप से कम मतदान वाला है। मैंने एक भ्रमित टाइपो पर ध्यान दिया: "शामिल" को "शामिल" पढ़ना चाहिए। इसके अलावा: यादृच्छिक बनाम निश्चित प्रभाव के रूप में स्कूल के उपचार के बीच एक अपेक्षित व्यावहारिक अंतर क्या होगा ? मैं समझता हूं कि तय किए गए व्यवहार से एक नए स्कूल के छात्र के प्रदर्शन की भविष्यवाणी करने की अनुमति नहीं होगी, लेकिन उपलब्ध आंकड़ों के अंतर के बारे में क्या? मान लें कि अन्य निश्चित प्रभाव छात्रों के लिंग, जाति और वजन (जो भी हो) हैं। क्या स्कूल को यादृच्छिक / निश्चित मानने से मुख्य प्रभाव या ब्याज की बातचीत की शक्ति प्रभावित होती है? कोई अन्य मतभेद?
अमीबा का कहना है कि मोनिका

3
@amoeba एक तरफ स्थिरता छोड़ते हुए, एक छात्र स्तर के गुणांक पर MSE एक यादृच्छिक बनाम निश्चित प्रभाव मॉडल में कम या ज्यादा कुशल हो सकता है, अन्य बातों के अलावा, छात्र X और यादृच्छिक प्रभाव, क्लस्टर संख्याओं के बीच सहसंबंध का स्तर आदि। । क्लार्क और लाइनर 2012 के सिमुलेशन परिणाम हैं।
conjugateprior

1
@conjugateprior वाह, इस टिप्पणी के लिए बहुत बहुत धन्यवाद! मैं लिंक किए गए पेपर को पढ़ता हूं और यह उस मुद्दे का सबसे स्पष्ट स्पष्टीकरण है जो मैंने देखा है। मैंने निश्चित / यादृच्छिक प्रभावों के बारे में सीवी पर विभिन्न थ्रेड्स पढ़ने में कुछ समय बिताया है, लेकिन यह पता नहीं लगा सका कि कब एक और दूसरे का उपयोग क्यों करना चाहिए। C & L को पढ़ने से मुझे बहुत कुछ स्पष्ट हो गया। क्या आप शायद इस और / या संबंधित कागजात का सारांश प्रस्तुत करते हुए सीवी पर कहीं उत्तर लिखना चाहते हैं? मैं सबसे अधिक वोट किए गए [मिश्रित-मॉडल] धागे पर एक इनाम चला रहा हूं और आपको वहां एक और पुरस्कार देने में खुशी होगी।
अमीबा का कहना है कि मोनिका

@ एरिक, मैंने "आंशिक स्कूली शिक्षा" को "आंशिक पूलिंग" को सही करने के लिए संपादित किया। मुझे लगता है कि यह एक टाइपो था लेकिन माफी अगर यह एक इच्छित सजा थी!
अमीबा का कहना है कि मोनिका

2

ईकॉन भूमि में, ऐसे प्रभाव व्यक्तिगत-विशिष्ट इंटरसेप्ट्स (या स्थिरांक) होते हैं, जो अप्रमाणित होते हैं, लेकिन पैनल डेटा का उपयोग करके अनुमान लगाया जा सकता है (समय के साथ समान इकाइयों पर अवलोकन)। निश्चित प्रभाव अनुमान विधि इकाई-विशिष्ट अंतर और स्वतंत्र व्याख्यात्मक चर के बीच सहसंबंध के लिए अनुमति देती है। यादृच्छिक प्रभाव नहीं करता है। अधिक लचीले निश्चित प्रभावों का उपयोग करने की लागत यह है कि आप उन चर पर गुणांक का अनुमान नहीं लगा सकते हैं जो समय-अपरिवर्तनीय हैं (जैसे लिंग, धर्म या नस्ल)।

एनबी अन्य क्षेत्रों की अपनी शब्दावली है, जो भ्रामक हो सकती है।


(-1) यह कहता है कि निश्चित और यादृच्छिक प्रभावों के बीच गणितीय अंतर के बारे में कुछ भी नहीं है
मैक्रो

1
@ मकारो सहमत। इससे पहले कि यह पता चले, यह जानना उपयोगी होगा कि क्या एकॉन शब्दावली में ओपी की तलाश है। मुझे उस पर स्पष्ट होना चाहिए था।
दिमित्री वी। मास्टरोव

ठीक है। उस स्थिति में यह एक टिप्पणी के रूप में अधिक उपयुक्त हो सकता है, क्या आप नहीं कहेंगे?
मैक्रों

बयान "अधिक लचीले निश्चित प्रभावों का उपयोग करने की लागत है, आप समय-अपरिवर्तनीय चर पर गुणांक का अनुमान नहीं लगा सकते हैं" बस सच नहीं है। मैंने सिर्फ एक सिमुलेशन किया है जहां आपने व्यक्तियों और एकल बाइनरी भविष्यवक्ता पर माप दोहराया है जो समय अलग नहीं है। यदि आप बाइनरी भविष्यवक्ता के लिए आईडी और एक के लिए एक निश्चित प्रभाव शामिल करते हैं, तो आप सबसे निश्चित रूप से बाइनरी भविष्यवक्ता पर गुणांक का अनुमान लगा सकते हैं (हालांकि, मैं स्वीकार करूंगा, यदि आपके पास बार-बार माप नहीं है, तो अनुमान एक है बड़ी मानक त्रुटि)।
मैक्रों

3
एंड्रयू गेलमैन (जो अर्थशास्त्री नहीं हैं), अपने एनोवा पेपर में 5 अलग-अलग परिभाषाओं को सूचीबद्ध करते हैं: स्टेट.कोम्बिया.आडू /~GLman/research/published/banova7.pdf
दिमित्री वी। मास्टरोव

2

एक मानक सॉफ्टवेयर पैकेज (उदाहरण के लिए आर lmer) में, मूल अंतर है:

  • निर्धारित प्रभाव अधिकतम संभावना (एक रैखिक मॉडल के लिए कम से कम वर्ग) द्वारा अनुमानित हैं
  • यादृच्छिक बेअर्स द्वारा यादृच्छिक प्रभावों का अनुमान लगाया जाता है (एक रैखिक मॉडल के लिए कुछ संकोचन के साथ कम से कम वर्ग, जहां संकोचन पैरामीटर अधिकतम संभावना द्वारा चुना जाता है)

यदि आप बायेसियन (जैसे विनब्यूज) हो रहे हैं, तो कोई वास्तविक अंतर नहीं है।


3
मुझे कोई फर्क नहीं होने के बारे में बहुत असहमत हूं। आप उन सभी गुणांकों के साथ एक बायेसियन फिक्स्ड इफ़ेक्ट मॉडल फिट कर सकते हैं जिनमें अलग-अलग पुजारी या बायेसियन मिश्रित मॉडल होते हैं जहाँ हाइपरपैरमीटर होते हैं।
एरिक

यदि आप बायेसियन हो रहे हैं तो अंतर इस तरह दिखता है ।
conjugateprior

@ साइमन यह एक सटीक और कुरकुरा जवाब है। मुझे इसका उल्लेख बहुत पहले करना चाहिए था।
सुभाष सी। डावर

-3

@ जोक एक निश्चित-प्रभाव मॉडल का अर्थ है कि एक अध्ययन (या प्रयोग) द्वारा उत्पन्न प्रभाव-आकार तय किया गया है अर्थात एक हस्तक्षेप के लिए दोहराए गए माप समान प्रभाव-आकार को बदलते हैं। संभवतः, प्रयोग के लिए बाहरी और आंतरिक स्थितियां नहीं बदलती हैं। यदि आपके पास विभिन्न परीक्षणों के तहत कई परीक्षण और या अध्ययन हैं, तो आपके पास अलग-अलग प्रभाव-आकार होंगे। प्रभाव-आकारों के एक समूह के लिए माध्य और विचरण के अनुमानों को अनुमान लगाया जा सकता है कि ये निश्चित-प्रभाव हैं या ये यादृच्छिक-प्रभाव (सुपर-जनसंख्या से प्राप्त) हैं। मुझे लगता है कि यह ऐसा मामला है जिसे गणितीय आँकड़ों की मदद से हल किया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.