मैं वर्तमान में "I Just Ran Two Million Regressions" नामक एक लोकप्रिय पेपर में प्रयुक्त विधि को लागू करने की कोशिश कर रहा हूं। इसके पीछे मूल विचार यह है कि ऐसे कुछ मामले हैं जहां यह स्पष्ट नहीं है कि मॉडल में कौन से नियंत्रण शामिल किए जाने चाहिए। इस तरह के मामले में एक चीज जो आप कर सकते हैं, वह है बेतरतीब ढंग से नियंत्रण आकर्षित करना, लाखों अलग-अलग रिग्रेशन चलाना और फिर देखें कि आपकी रुचि के चर ने कैसे प्रतिक्रिया दी। यदि आम तौर पर सभी विशिष्टताओं में इसका चिन्ह समान है तो हम इसे एक चर से अधिक मजबूत मान सकते हैं जिसका चिन्ह हमेशा बदलता रहता है।
अधिकांश कागज बहुत स्पष्ट हैं। हालांकि, पेपर निम्नलिखित तरीकों से उन सभी अलग-अलग रजिस्टरों को तौलता है: दिए गए विनिर्देश की एकीकृत संभावना सभी विनिर्देशों के लिए सभी एकीकृत संभावना के योग से विभाजित है।
मुझे जो परेशानी हो रही है, वह यह है कि मुझे यकीन नहीं है कि कैसे एकीकृत संभावना ओएलएस प्रतिगमन से संबंधित है जिसे मैं (स्टाटा में) चलाना चाहूंगा। "स्टैटा इंटीग्रेटेड लाइबिलिटी" जैसे गूग्लिंग विषय एक मरा हुआ अंत है क्योंकि मैं मिश्रित प्रभाव लॉजिस्टिक्स रिग्रेशन जैसी चीजों में भागता रहता हूं। मैं स्वीकार करता हूं कि ये मॉडल मेरे लिए बहुत जटिल हैं।
मेरे आस-पास का वर्तमान कार्य यह है कि साहित्य में उपयोग की जाने वाली अलग-अलग वज़निंग योजनाएं हैं जो मैं (तरह-तरह) समझता हूं। उदाहरण के लिए, संभावना अनुपात सूचकांक के आधार पर प्रत्येक प्रतिगमन को भारित करना संभव है। यहां तक कि एक आर पैकेज भी है जो वज़न के रूप में लारी का उपयोग करता है। स्वाभाविक रूप से, मैं मूल को भी लागू करना चाहूंगा।
कोई सलाह?
पेपर लिंक: http://down.cenet.org.cn/upfile/34/200911214131515178.pdf