श्रेणीबद्ध डेटा के लिए दंडित तरीके: एक कारक में स्तरों का संयोजन


10

दंडित मॉडल का उपयोग उन मॉडलों का अनुमान लगाने के लिए किया जा सकता है जहां मापदंडों की संख्या नमूना आकार के बराबर या उससे अधिक है। यह स्थिति श्रेणीबद्ध या गणना डेटा के बड़े विरल तालिकाओं के लॉग-रैखिक मॉडल में उत्पन्न हो सकती है। इन सेटिंग्स में, अक्सर यह भी वांछनीय या सहायक होता है कि किसी कारक के स्तरों को जोड़कर तालिकाओं को ध्वस्त किया जाए जहां वे स्तर अन्य कारकों के साथ बातचीत करने के मामले में अलग-अलग नहीं हैं। दो सवाल:

  1. क्या प्रत्येक कारक के भीतर स्तरों की संक्षिप्तता के लिए परीक्षण करने के लिए LASSO या लोचदार जाल जैसे दंडित मॉडल का उपयोग करने का एक तरीका है?
  2. यदि पहले प्रश्न का उत्तर हां, है, और चाहिए, तो इसे इस तरह से सेट किया जाना चाहिए कि स्तरों का पतन और मॉडल गुणांक का अनुमान एक ही चरण में होता है?

1
यह पेपर, doi.org/10.1177/1471082X16642560 , पिछले एक दशक में इस क्षेत्र में जो कुछ किया गया है , उसका एक अच्छा अवलोकन देता है।
जोर्ने बाइसेलर

1
नोट: मेरे द्वारा चर्चा की गई दंड @JorneBiccler लिंक में 3.4 समीकरण है। (यह देखना दिलचस्प है कि इस सवाल पर पहले विचार किया गया है!)
user795305


हम इसे एक प्रश्न से दोहरा कैसे कह सकते हैं जो इससे पहले था?
माइकल आर। चेरिक

जवाबों:


4

हो सकता है। हम इसे पूरा करने के लिए फ़्यूज़्ड लासो के एक संस्करण का उपयोग कर सकते हैं ।

हम अनुमानक का उपयोग कर सकते हैं

β^=argminβ1ni=1n(yiβTxieβTxi)+factors gλg(jg|βj|+12j,kg|βjβk|).

ध्यान दें कि लॉग-लीनियर के लिए नुकसान फ़ंक्शन है मॉडल।1ni=1n(yiβTxieβTxi)

यह एक समूह के भीतर गुणांक को समान होने के लिए प्रोत्साहित करता है। गुणांक की यह समानता कारक के और स्तरों को समेटने के बराबर है । जब , यह संदर्भ स्तर के साथ स्तर को ढहने के बराबर है। ट्यूनिंग पैरामीटर को स्थिर माना जा सकता है, लेकिन अगर यह केवल कुछ कारक हैं, तो उन्हें अलग-अलग मानने के लिए बेहतर हो सकता है।jthkthβ^j=0jthλg

अनुमानक एक उत्तल फ़ंक्शन का एक न्यूनतम है, इसलिए इसे मनमाने ढंग से सॉल्वर के माध्यम से कुशलता से गणना की जा सकती है। यह संभव है कि यदि किसी कारक में कई, कई स्तर हैं, तो ये युग्मक अंतर हाथों से निकल जाएंगे --- इस मामले में, पतन के संभावित पैटर्न के बारे में अधिक संरचना जानना आवश्यक होगा।

ध्यान दें कि यह सब एक चरण में पूरा होता है! यह किस प्रकार के लसो-प्रकार के अनुमानकों को इतना अच्छा बनाता है!


एक और दिलचस्प दृष्टिकोण OSCAR आकलनकर्ता का उपयोग करना है, जो कि दंड के अलावा ऊपर जैसा है को प्रतिस्थापित करके ।[11][βiβj]1[βiβj]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.