मैं यादृच्छिक प्रभाव (या दोहराया उपायों) को यादृच्छिक रूप से कैसे शामिल कर सकता हूं


22

मुझे यह भी यकीन नहीं है कि यह सवाल बहुत मायने रखता है, लेकिन मुझे लगता है कि मैंने कागजात के कुछ जोड़े देखे, जहां उन्होंने यादृच्छिक प्रभावों के साथ यादृच्छिक वन का प्रस्ताव रखा था। क्या यह R में संभव है?


1
हाँ, यह बहुत मतलब नहीं है। यादृच्छिक प्रभावों से आपका क्या तात्पर्य है?
सिमोन

मैं कुछ ऐसा ही सोच रहा हूं जो आप lmer फ़ंक्शन के साथ कर सकते हैं जहां आप एक यादृच्छिक प्रभाव को शामिल कर सकते हैं (1: प्रभाव)।
mguzmann

तो यह एक यादृच्छिक जंगल पर annealing है? econpapers.repec.org/article/bpjjqsprt/… researchgate.net/publication/…
EngrStudent - Monica

2
मुझे इस बात पर बिल्कुल यकीन नहीं है कि आप किस तरह की यादृच्छिकता के बारे में पता कर रहे हैं। बेतरतीब जंगलों में पेड़ को सजाकर बैगिंग पर एक सरल सुधार है। इसे 'यादृच्छिक' कहा जाता है, इसका कारण यह है कि किसी भी उदाहरण में, जब एक पेड़ में एक विभाजन पर विचार किया जाता है, तो विभाजित उम्मीदवार को एक यादृच्छिक सबसेट मी से कहा जाता है जिसे पी भविष्यवक्ता कहा जाता है। आमतौर पर, m ~ sqrt (p)। और हर बार एक विभाजन होने पर, भविष्यवाणियों का एक यादृच्छिक सबसेट चुना जाता है, इसलिए यादृच्छिक वन।
psteelk

जवाबों:


13

वे आमतौर पर एक साथ उपयोग नहीं किए जाते हैं, और उन्हें संयोजित करने से पहले देखभाल की जानी चाहिए।

बेतरतीब जंगलों को आमतौर पर क्लासिफायर के रूप में उपयोग किया जाता है। इसका कारण यह है कि आप किसी अन्य विधि (जैसे K- साधन क्लस्टरिंग) के बजाय एक यादृच्छिक वन का उपयोग करेंगे, यह है कि आपके पास बड़ी संख्या में आयाम हो सकते हैं जिन्हें आप वर्गीकृत करना चाहते हैं। बड़ी संख्या में आयामों के साथ समस्या यह है कि यदि आप आयाम आदेशों के सभी संयोजनों का परीक्षण करना चाहते हैं, तो आपके पास बड़ी संख्या में विकल्प होंगे (यह आयामों की संख्या की तुलना में तेजी से बढ़ता है)।

रैंडम प्रभाव आमतौर पर एक ही चीज़ के दोहराया उपायों के साथ प्रतिगमन में उपयोग किया जाता है। वे आमतौर पर मिश्रित प्रभाव वाले मॉडल में उपयोग किए जाते हैं जहां मिश्रित शब्द निश्चित और यादृच्छिक दोनों प्रभावों को संदर्भित करता है। तय किए गए प्रभावों को उन मापदंडों का प्रतिनिधित्व करने के लिए माना जाता है जिन्हें आप फिर से देखेंगे (जैसे एक दवा या किसी व्यक्ति की उम्र)। यादृच्छिक प्रभावों को एक पैरामीटर के चारों ओर परिवर्तनशीलता की एक आवृत्ति का प्रतिनिधित्व करने के लिए माना जाता है जिसे आप फिर से नहीं देखेंगे (उदाहरण के लिए एक विशिष्ट व्यक्ति)।

वहाँ उन्हें एक साथ जब वहाँ क्लस्टर है डेटा का उपयोग कर उदाहरण हैं http://dx.doi.org/10.1080/00949655.2012.741599 और http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf

मैं किसी भी आर संकुल से अनजान हूँ जो यह विश्लेषण कर सकता है।


2
इसके अलावा, इस काम के लेखक अपने कार्यान्वयन के आर कोड को आपके साथ साझा करने में प्रसन्न हैं। बस उन्हें ईमेल करें। यह मैंने किया है।
ब्राश इक्विलिब्रियम

मैंने लाजोक से संपर्क किया, जिसने हज्जाम से संपर्क किया, जिसने मुझे कुछ दिनों के भीतर ईमेल किया।
ब्राश इक्विलिब्रियम

2
उचित चेतावनी, हालांकि, आर कोड उपलब्ध निरंतर डेटा के लिए यादृच्छिक वन लागू करता है। आपको श्रेणीबद्ध डेटा से निपटने के लिए इसे विस्तारित करने की आवश्यकता होगी।
ब्राश इक्विलिब्रियम

10

हाँ यह संभव है। आपको " आरई-ईएम ट्री: एक डेटा माइनिंग एप्रोच फॉर लॉन्गिट्यूडिनल एंड क्लस्टर्ड डेटा " और संबंधित आर पैकेज आरईएमट्री की जांच करनी चाहिए

जब मैंने पेपर देखा, तब से कुछ समय हो गया है। मुझे याद है कि लेखकों ने अभी तक इन पेड़ों के टुकड़ें बनाने की कोशिश नहीं की थी, लेकिन यह सुझाव दिया कि यह काम नहीं करेगा।


1
REEMtree यादृच्छिक जंगलों पर लागू यादृच्छिक प्रभाव नहीं है। इसे पुनरावर्ती विभाजन पर लागू किया जाता है, जो कि एक यादृच्छिक वन मॉडल में जाता है। इसलिए मुझे नहीं लगता कि यह उत्तर बिल डेनी की तुलना में एक उच्च स्कोर के योग्य है। दुर्भाग्य से, इस पर मेरा उत्थान बंद है।
ब्राश इक्विलिब्रियम

1
चलो, एक बार जब आप पेड़ प्राप्त कर लेते हैं, तो जंगल का निर्माण करना कितना कठिन है? और आपका स्वागत है।
बेन ओगोरक

1
खैर, यह देखते हुए कि बूटस्ट्रैप नमूने पर यादृच्छिक वन कैसे कहते हैं, कोशिश करने के लिए यादृच्छिक रूप से चुनी गई सुविधाओं की संख्या को ट्यून करना, पेड़ के परिणामों का एकत्रीकरण, आदि, और हमें यादृच्छिक वन भविष्यवाणियों पर यादृच्छिक प्रभाव की आवश्यकता है, न कि व्यक्तिगत पेड़ों की भविष्यवाणियों में। वन, आरईएमट्री को बढ़ाना उतना अच्छा उपाय नहीं है जितना कि लेख बिल को उद्धृत किया गया है और इसके लेखकों से आर कोड का अनुरोध किया गया है।
ब्राश इक्विलिब्रियम

8

मिश्रित प्रभाव रैंडम फ़ॉरेस्ट (MERF) एक चीज़ है। जैसा कि उत्तर में कहा गया है, एचईसी मॉन्ट्रियल में डॉ। लारोक के समूह द्वारा उनके बारे में कुछ महान शोध हैं। पेपर यहां है: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599

अनिवार्य रूप से यह एक यादृच्छिक रूप से यादृच्छिक जंगलों के साथ यादृच्छिक जंगलों के गैर-रेखीय मॉडलिंग को संयोजित करने का एक सैद्धांतिक तरीका है।

हमने अभी कागज में उपरोक्त एल्गोरिथ्म का उपयोग करके MERF को लागू करने वाले पायथन में एक ओपन सोर्स पैकेज जारी किया ।

हमने पैकेज के बारे में और संकुल डेटा सेट के लिए इसका उपयोग करने के बारे में एक विस्तृत ब्लॉग पोस्ट लिखा है ।


1
आर में इसे लागू करने या आंशिक निर्भरता भूखंड की कार्यक्षमता को जोड़ने के लिए कोई विचार
ओलिवरफिशकोड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.