जब एक मॉडल में एक यादृच्छिक प्रभाव शामिल करने के लिए


9

मैं मिश्रित मॉडलिंग के लिए नया हूं और मैं उलझन में हूं कि क्या मैं एक विश्लेषण में यादृच्छिक प्रभाव का उपयोग करने के लिए उपयुक्त हूं। किसी भी सलाह की सराहना की जाएगी।

मेरा अध्ययन यह परीक्षण कर रहा है कि स्तनपायी बहुतायत का एक नया विकसित सूचकांक कितनी अच्छी तरह से स्थापित लेकिन अधिक श्रम गहन सूचकांक के मूल्य की भविष्यवाणी कर सकता है। मैं कई वन पैच में इन सूचकांकों को माप रहा हूं, प्रत्येक वन पैच में कई भूखंडों के साथ।

क्योंकि मैं वन पैच के प्रभाव में सीधे दिलचस्पी नहीं रखता हूं, और क्योंकि मेरे नमूना भूखंडों को वन पैच के भीतर घोंसला दिया जाता है, इसलिए वन पैच को यादृच्छिक प्रभाव के रूप में उपयोग किया जाता है। हालाँकि, मुझे इसके बारे में कुछ सवाल मिले हैं:

सबसे पहले, मुझे पता है कि यादृच्छिक प्रभाव आपको अपने परिणामों को यादृच्छिक कारक के सभी संभावित स्तरों पर सामान्यीकृत करने की अनुमति देते हैं, न कि केवल उन लोगों को जो आपने नमूना किया था। लेकिन यह मुझे लगता है कि इस तरह के अनुमान बनाने के लिए आपके स्तरों को बेतरतीब ढंग से नमूना करना होगा? मेरे वन पैच बेतरतीब ढंग से नमूने नहीं थे, तो क्या मैं अभी भी उन्हें यादृच्छिक प्रभाव के रूप में उपयोग कर सकता हूं?

दूसरा, Ive पढ़ा है कि आप यह परीक्षण कर सकते हैं कि क्या प्रभाव के साथ और बिना मॉडल की तुलना करने के लिए एक संभावना अनुपात परीक्षण जैसे कि यादृच्छिक प्रभाव करना आवश्यक है। मैंने ऐसा किया है, और यह सुझाव देता है कि यादृच्छिक प्रभाव मॉडल डेटा की व्याख्या नहीं करता है और साथ ही एक निश्चित प्रभाव केवल मॉडल है। इसके साथ मेरा मुद्दा यह है कि मेरे भूखंड अभी भी वन पैच के भीतर हैं, और इसलिए शायद स्वतंत्र नहीं हैं। इसलिए, क्या मैं इस LRT दृष्टिकोण का उपयोग यादृच्छिक प्रभाव को छोड़कर सही कर सकता हूं, या क्या मुझे अभी भी इसे नेस्टेडनेस के लिए खाते में शामिल करने की आवश्यकता है? और अगर मैं रैंडम प्रभाव को हटाता हूं, तो क्या यह सत्यापित करने का कोई तरीका है कि वन पैच के भीतर भूखंडों को स्वतंत्र माना जा सकता है?

आपकी सहायताके लिए धन्यवाद!

नीलकंठ


मुझे लगता है कि यादृच्छिक प्रभावों के साथ मुख्य वैचारिक बात यह है कि वे सभी एक ही परिमाण के बारे में होना चाहिए और विनिमेय होना चाहिए - यह वही है जो गैर-नमूना यादृच्छिक प्रभावों के बारे में अनुमान लगाता है। इसके अलावा, आपको यादृच्छिक प्रभावों के लिए LR परीक्षणों का उपयोग करने में सावधानी बरतनी चाहिए क्योंकि विचरण घटक के बारे में काफी अनिश्चितता हो सकती है, भले ही एमएल / REML का अनुमान शून्य या शून्य के करीब हो।
probabilityislogic

उस के लिए बहुत धन्यवाद। अगर वहाँ यादृच्छिक प्रभाव रखने के लिए आवश्यक है तो वहाँ काम करने के लिए कोई रास्ता होगा?
जय

जो मैं समझता हूं, वह REML द्वारा फिट किए गए मॉडल के साथ LR तुलना नहीं करना सबसे अच्छा है। उदाहरण के लिए R के lmer में, आपको LRT करते समय REML = FALSE सेट करना चाहिए। (यह TRUE में चूक करता है, जो अन्यथा बेहतर है।)
वेन

जवाबों:


6

जैसा कि मैं समझता हूं, आपके पास एक सरल नेस्टेड अवलोकन डिजाइन (पैच के भीतर भूखंड) हैं और आपकी रुचि दो निरंतर चर (दो सूचकांकों) के बीच एक सहसंबंध / प्रतिगमन में है। आपका नमूना आकार एम पैचेज़ xn प्लॉट्स = एन जोड़े के अवलोकन (या असंतुलित होने पर उपयुक्त सारांश) है। कोई उचित रैंडमाइजेशन शामिल नहीं था, लेकिन शायद आप इस पर विचार कर सकते हैं / करना चाहते हैं कि (1) पैच "बेतरतीब ढंग से" इस तरह के या सभी क्षेत्र के सभी पैच से चुने गए थे, और फिर (2) प्लॉट "बेतरतीब ढंग से" थे प्रत्येक पैच के भीतर चयनित।

यदि आप यादृच्छिक कारक पैच को अनदेखा करते हैं, तो आप यह सोचकर छद्म विक्षेपण कर सकते हैं कि आपने बेतरतीब ढंग से एन प्लॉट्स को "स्वतंत्र रूप से" चुना है, उन (पहले) चयनित पैच में होने के लिए उन्हें (संख्या या प्रकार में) बाध्य किए बिना।

तो, आपका पहला सवाल: हाँ, यह वही है जो एक यादृच्छिक कारक की अनुमति देता है। इस तरह के अनुमान की वैधता इस धारणा की वैधता पर निर्भर करती है कि हाँफज़ार्ड चयन पैच के यादृच्छिक चयन के बराबर है (उदाहरण के लिए, यदि आपके परिणाम वन पैच का एक अलग सेट चुना गया था) अलग नहीं होंगे। यह आपके अनुमान के स्थान पर भी एक सीमा रखता है: जिस प्रकार का वन या भौगोलिक क्षेत्र जिस पर आपके परिणामों का विस्तार होता है, पैच की अधिकतम (काल्पनिक) जनसंख्या पर निर्भर करता है जहां से आपका नमूना एक विश्वसनीय "यादृच्छिक" नमूना है। हो सकता है कि आपके अवलोकन आपके क्षेत्र में वन पैच के स्तनधारियों का एक "उचित यादृच्छिक" नमूना हों, लेकिन पूरे महाद्वीप के स्तनधारियों का एक संदिग्ध रूप से एकत्र नमूना होगा।

दूसरा एक: परीक्षण "छद्मस्थलीकरण की डिग्री" पर निर्भर करेगा, या आपके नमूने में सबूत जो पैच से "संबंधित" हैं। यह है, पैच के बीच और प्लॉट के बीच कितना अंतर है (इंट्राक्लास सहसंबंध के लिए खोज)। एक चरम में, केवल पैच के बीच भिन्नता मौजूद है (एक पैच के भीतर प्लॉट सभी समान हैं) और आपके पास "शुद्ध स्यूडोरेप्लिकेशन" है: आपका एन पैच की संख्या होना चाहिए, और उनमें से प्रत्येक से एक या कई प्लॉट का नमूना प्रदान नहीं करता है। नई जानकारी। दूसरे चरम पर, सभी भिन्नता भूखंडों के बीच होती है, और यह बताते हुए कोई अतिरिक्त भिन्नता नहीं है कि कौन सा वन पैच प्रत्येक भूखंड का है (और फिर यादृच्छिक कारक के बिना मॉडल अधिक पार्सिमेंट दिखाई देगा); आपके पास "स्वतंत्र" भूखंड हैं। चरम सीमाओं के किसी भी होने की संभावना नहीं है ... विशेष रूप से जमीन पर मनाए जाने वाले जैविक चर के लिए, यदि केवल स्तनधारियों के स्थानिक निरंकुशता और भौगोलिक वितरण के कारण। मैं व्यक्तिगत रूप से वैसे भी डिजाइन द्वारा कारकों को रखना पसंद करता हूं (उदाहरण के लिए, जब पैच ऊपर दिए गए समसामयिकी में भिन्नता का एक प्रासंगिक स्रोत नहीं है) "प्रयोगात्मक-अवलोकन" अनुरूप को ऊपर बनाए रखने के लिए; याद रखें: अशक्त हिपोथिसिस को अस्वीकार करने के लिए आपके नमूने में सबूत नहीं होना कि पैच के बीच भिन्नता शून्य है इसका मतलब यह नहीं है कि जनसंख्या में भिन्नता शून्य है। जब पैच "SAMPLE में भिन्नता का एक प्रासंगिक स्रोत नहीं है" तब भी ऊपर वर्णित "प्रयोगात्मक-अवलोकन" सादृश्य को बनाए रखने के लिए; याद रखें: अशक्त हिपोथसिस को अस्वीकार करने के लिए आपके नमूने में सबूत नहीं होना कि पैच के बीच भिन्नता शून्य है इसका मतलब यह नहीं है कि जनसंख्या में भिन्नता शून्य है। जब पैच "SAMPLE में भिन्नता का एक प्रासंगिक स्रोत नहीं है" तब भी ऊपर वर्णित "प्रयोगात्मक-अवलोकन" सादृश्य को बनाए रखने के लिए; याद रखें: अशक्त हिपोथसिस को अस्वीकार करने के लिए आपके नमूने में सबूत नहीं होना कि पैच के बीच भिन्नता शून्य है इसका मतलब यह नहीं है कि जनसंख्या में भिन्नता शून्य है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.