नमस्कार मुझे दो समस्याएं हैं जो बहुस्तरीय / मिश्रित मॉडल के लिए प्राकृतिक उम्मीदवारों की तरह लगती हैं, जिनका मैंने कभी उपयोग नहीं किया है। सरल, और एक है कि मैं एक परिचय के रूप में प्रयास करने की उम्मीद है, इस प्रकार है: डेटा प्रपत्र की कई पंक्तियों की तरह दिखता है
x y innergroup outergroup
जहाँ x एक संख्यात्मक सहसंयोजक है, जिस पर मैं y (एक और संख्यात्मक चर) प्राप्त करना चाहता हूं, प्रत्येक y एक इनरग्रुप से संबंधित है, और प्रत्येक इनग्रुप एक नेगग्रुप (यानी, एक निश्चित इनरग्रुप में सभी y एक ही ऑर्गग्रुप से संबंधित है) । दुर्भाग्य से, इनरग्रुप में कई स्तर (कई हजारों) होते हैं, और प्रत्येक स्तर में अपेक्षाकृत कम अवलोकन होते हैं, इसलिए मुझे लगा कि इस तरह का मॉडल उपयुक्त हो सकता है। मेरे सवाल हैं
मैं इस प्रकार का बहुस्तरीय सूत्र कैसे लिखूं?
एक बार जब लमेर मॉडल फिट हो जाता है, तो कोई इससे कैसे भविष्यवाणी करता है? मैंने कुछ सरल खिलौना उदाहरण फिट किए हैं, लेकिन एक पूर्वानुमान () फ़ंक्शन नहीं मिला है। अधिकांश लोग इस तरह की तकनीक के साथ भविष्यवाणी की तुलना में अधिक रुचि रखते हैं। मेरे पास कई मिलियन पंक्तियाँ हैं, इसलिए गणना एक मुद्दा हो सकती है, लेकिन मैं हमेशा इसे उपयुक्त रूप से काट सकता हूं।
मुझे कुछ समय के लिए दूसरा करने की आवश्यकता नहीं होगी, लेकिन मैं इसके बारे में सोचना और इसके साथ खेलना शुरू कर सकता हूं। मेरे पास पहले जैसा ही डेटा है, लेकिन बिना x, और y अब फॉर्म एक द्विपदीय चर है । वाई इनग्रुप्स के भीतर भी बहुत से अतिप्रदर्शन को प्रदर्शित करता है। अधिकांश n 2 या 3 (या उससे कम) से अधिक नहीं हैं, इसलिए प्रत्येक y की सफलता दर का अनुमान लगाने के लिए मैं बीटा-द्विपद संकोचन अनुमानक ( α + k i ) / ( α + β + ) का उपयोग कर रहा हूं । n मैं ) है, जहां और g का अनुमान MLE द्वारा प्रत्येक इनरग्रुप के लिए अलग-अलग किया जाता है। यह कुछ हद तक पर्याप्त है, लेकिन डेटा स्पार्सिटी अभी भी मुझे परेशान करती है, इसलिए मैं उपलब्ध सभी डेटा का उपयोग करना चाहूंगा। एक दृष्टिकोण से, यह समस्या आसान है क्योंकि कोई कोवरिएट नहीं है, लेकिन दूसरे से द्विपद प्रकृति इसे और अधिक कठिन बनाती है। क्या किसी के पास कोई उच्च (या निम्न) स्तर का मार्गदर्शन है?