कुछ दिन पहले भी इसी तरह का प्रश्न था, जिसका प्रासंगिक संदर्भ था:
- बेलोनी, ए।, चेर्नोज़ोउकोव, वी।, और हैनसेन, सी। (2014) "उच्च-आयामी नियंत्रणों के बीच चयन के बाद उपचार के प्रभाव पर इंजेक्शन", आर्थिक अध्ययन की समीक्षा, 81 (2), पीपी 608-50 ( लिंक )
कम से कम मेरे लिए पेपर काफी कठिन पढ़ा गया है क्योंकि इस अपेक्षाकृत सरल के पीछे के प्रमाण काफी विस्तृत हैं। जब आप की तरह एक मॉडल का आकलन कर रहे हैं में रुचि रखने वाले
yमैं= α टीमैं+ X'मैंβ+ ϵमैं
जहां आपका परिणाम है, ब्याज के कुछ उपचार प्रभाव है, और संभावित नियंत्रणों का एक वेक्टर है। लक्ष्य पैरामीटर । यह मानते हुए कि आपके परिणाम में अधिकांश भिन्नता उपचार और नियंत्रण के विरल सेट, बेलोनी एट अल द्वारा बताई गई है। (2014) एक डबल-सलेक्ट सलेक्शन मेथड विकसित करता है जो सही पॉइंट एस्टीमेट और वैलिड कॉन्फिडेंस इंटरवल प्रदान करता है। यह विरलता हालांकि महत्वपूर्ण है।T i X X i αyमैंटीमैंएक्समैंα
यदि के कुछ महत्वपूर्ण predictors शामिल लेकिन आप नहीं जानते कि जो वे (एकल चर, उनके उच्च आदेश बहुआयामी पद, या अन्य चर के साथ बातचीत या तो) कर रहे हैं, तो आप एक तीन कदम चयन प्रक्रिया का प्रदर्शन कर सकते हैं:y iएक्समैंyमैं
- yमैंएक्समैं
- टीमैंएक्समैं
- yमैंटीमैं
वे इस बात के प्रमाण देते हैं कि यह काम क्यों करता है और आपको इस पद्धति से सही आत्मविश्वास अंतराल आदि क्यों मिलते हैं। वे यह भी दिखाते हैं कि यदि आप केवल उपरोक्त प्रतिगमन पर एक LASSO चयन करते हैं और फिर उपचार पर परिणाम और चयनित चर को गलत बिंदु अनुमान और झूठे विश्वास अंतराल प्राप्त करते हैं, जैसे कि ब्योर्न ने पहले ही कहा था।
ऐसा करने का उद्देश्य दो गुना है: अपने शुरुआती मॉडल की तुलना करना, जहां चर चयन को अंतर्ज्ञान या सिद्धांत द्वारा निर्देशित किया गया था, दोहरे-मजबूत चयन मॉडल से आपको यह पता चलता है कि आपका पहला मॉडल कितना अच्छा था। शायद आपका पहला मॉडल कुछ महत्वपूर्ण वर्ग या इंटरैक्शन की शर्तों को भूल गया और इस तरह से गलत तरीके से छोड़े गए कार्यात्मक रूप या छोड़े गए चर से ग्रस्त है। दूसरे, बेलोनी एट अल। (2014) विधि आपके लक्ष्य पैरामीटर पर अनुमान को सुधार सकती है क्योंकि निरर्थक रजिस्टरों को उनकी प्रक्रिया में दूर दंडित किया गया था।