क्या नियमितीकरण मददगार हो सकता है अगर हम केवल मॉडलिंग में रुचि रखते हैं, पूर्वानुमान में नहीं?


19

क्या नियमितीकरण मददगार हो सकता है यदि हम मॉडल के मापदंडों का केवल अनुमान लगाने (और व्याख्या) में रुचि रखते हैं, पूर्वानुमान या भविष्यवाणी में नहीं?

मैं देखता हूं कि यदि आपका लक्ष्य नए डेटा पर अच्छे पूर्वानुमान लगाना है, तो नियमितीकरण / क्रॉस-वैरिफिकेशन कितना उपयोगी है। लेकिन क्या होगा अगर आप पारंपरिक अर्थशास्त्र कर रहे हैं और आप सभी के बारे में परवाह कर रहे हैं अनुमान लगा रहा है ? क्या उस संदर्भ में क्रॉस-वैधीकरण भी उपयोगी हो सकता है? मेरे साथ संघर्ष करने वाली वैचारिक कठिनाई यह है कि हम परीक्षण डेटा पर वास्तव में गणना कर सकते हैं, लेकिन हम कभी भी गणना नहीं कर सकते क्योंकि सच परिभाषा द्वारा कभी नहीं मनाया गया है। (इस धारणा को ध्यान में रखें कि एक सच्चा भी है , अर्थात हम उन मॉडलों के परिवार को जानते हैं जिनसे डेटा उत्पन्न किया गया था।)एल ( वाई , वाई ) एल ( बीटा , बीटा ) बीटा बीटाβL(Y,Y^)L(β,β^)ββ

मान लीजिए कि आपका नुकसान । आप एक पूर्वाग्रह-विचरण व्यापार का सामना करते हैं, है ना? इसलिए, सिद्धांत रूप में, आप कुछ नियमित करने से बेहतर हो सकते हैं। लेकिन आप संभवतः अपने नियमितीकरण पैरामीटर का चयन कैसे कर सकते हैं?L(β,β^)=ββ^

मैं गुणांक \ बीटा \ इक्विव (\ Beta_1, \ beta_2, \ ldots, \ beta_k) के साथ एक रेखीय प्रतिगमन मॉडल का एक सरल संख्यात्मक उदाहरण देखकर खुश हूं β(β1,β2,,βk), जहां शोधकर्ता का नुकसान फ़ंक्शन उदाहरण के लिए ββ^ , या यहां तक ​​कि बस (β1β^1)2 । व्यवहार में, कोई भी उन उदाहरणों में अपेक्षित नुकसान को सुधारने के लिए क्रॉस-सत्यापन का उपयोग कर सकता है?


संपादित करें : DJohnson ने मुझे https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf पर इंगित किया , जो इस प्रश्न के लिए प्रासंगिक है। लेखक लिखते हैं कि

मशीन लर्निंग तकनीक ... \ टोपी {Y} की भविष्यवाणी करने के लिए एक अनुशासित तरीका प्रदान करती है Y^जो (i) डेटा का उपयोग करके यह तय करती है कि कैसे पूर्वाग्रह-व्यापार को बंद किया जाए और (ii) बहुत समृद्ध सेट पर खोज करने की अनुमति देता है चर और कार्यात्मक रूप। लेकिन सब कुछ लागत पर आता है: एक को हमेशा ध्यान रखना चाहिए कि क्योंकि वे Y^ लिए तैयार हैं (वे कई अन्य मान्यताओं के बिना) \ टोपी {\ बीटा} के लिए बहुत उपयोगी गारंटी नहीं देते हैं β^

एक और प्रासंगिक पेपर, फिर से डीजेकोसन के लिए धन्यवाद: http://arxiv.org/pdf/1504.01132v3.pdf । यह पेपर उस प्रश्न को संबोधित करता है जो मैं ऊपर से संघर्ष कर रहा था:

एक ... मशीन शिक्षण विधियों को लागू करने के लिए मौलिक चुनौती जैसे कि प्रतिगमन पेड़ों को ऑफ-शेल्फ की समस्या का कारण अनुमान है कि क्रॉस-वैलिडेशन के आधार पर नियमितीकरण दृष्टिकोण आमतौर पर "जमीनी सच्चाई" को देखने पर निर्भर करते हैं, जो कि वास्तविक परिणाम हैं एक क्रॉस-सत्यापन नमूने में। हालांकि, यदि हमारा लक्ष्य उपचार प्रभावों की औसत चुकता त्रुटि को कम करना है, तो हम मुठभेड़ करते हैं [11] जिसे "कार्य-कारण समस्या की मूलभूत समस्या" कहते हैं: कारण प्रभाव किसी भी व्यक्तिगत इकाई के लिए नहीं देखा जाता है, और इसलिए हम सीधे नहीं करते हैं एक जमीनी सच्चाई है। हम उपचार के कारण प्रभाव के मतलब-चुकता त्रुटि के निष्पक्ष अनुमानों के निर्माण के लिए दृष्टिकोण का प्रस्ताव करके इसे संबोधित करते हैं।


2
क्रॉस-सत्यापन, लेकिन डेटा माइनिंग और मशीन लर्निंग टूलकिट में एक विधि है। एमएल इकोनॉमिक्स में बढ़ते उपयोग को देख रहा है - स्टैनफोर्ड में सुसान अथे की वेबसाइट देखें (वह अर्थशास्त्र में एमएल तकनीकों के एकीकरण में रुचि रखने वाला है) या इस पेपर की भविष्यवाणी नीति समस्याएं क्लेनबर्ग, एट अल।, यहां एक अनगढ़ संस्करण में । cornell.edu/home/kleinber/aer15-prediction.pdf
माइक हंटर

9
कृपया, दोस्तों, असहमत: एमएल कई लोगों को मशीन सीखने का सुझाव देता है और कई अन्य लोगों को अधिकतम संभावना का सुझाव देते हैं। (परिभाषा: आप मशीन के बाड़ के किनारे पर हैं यदि एमएल स्वचालित रूप से मशीन सीखने के रूप में आपके लिए खुद का अनुवाद करता है।)
निक कॉक्स

3
@ अक्षल मेरा अनुभव यह है कि पारंपरिक अर्थमिति, जैसा कि स्नातक और स्नातक दोनों छात्रों को सिखाया जाता है, अनिवार्य रूप से क्रॉस-वैलिडेशन पर शून्य ध्यान देता है। हयाशी को देखें, जो एक क्लासिक पाठ्यपुस्तक है। निश्चित रूप से, शायद क्रॉस-वैलिडेशन और पूर्वाग्रह-भिन्नता व्यापार का उल्लेख विशेष रूप से पूर्वानुमान पर एक कोर्स में किया गया है, लेकिन मुख्य पाठ्यक्रम में नहीं जो सभी छात्रों के साथ शुरू होता है। क्या अब इसकी आवाज़ आपके लिए सही है?
एड्रियन

2
@ एड्रियन मैं देख रहा हूं कि लोग इस सवाल को बहुत व्यापक मानते हुए मतदान कर रहे हैं। ऐसा हो सकता है, लेकिन जैसा कि मैं देख रहा हूं कि आप मूल रूप से पूछ रहे हैं: "क्या सीवी मददगार हो सकता है अगर हम केवल मॉडलिंग में रुचि रखते हैं, पूर्वानुमान में नहीं?" - अगर मैं आपको सही तरीके से समझता हूं, तो आपके प्रश्न को आसानी से संपादित और सरल बनाया जा सकता है, इसलिए यह स्पष्ट है और निश्चित रूप से बहुत व्यापक (यहां तक ​​कि दिलचस्प नहीं है!)।
टिम

2
@ एड्रियन तो यह बहुत दिलचस्प सवाल है! मुझे डर है कि आपने इसे अत्यधिक जटिल बना दिया है और अर्थमिति का संदर्भ यहां महत्वपूर्ण नहीं है (क्योंकि यह अन्य क्षेत्रों के साथ समान है जहां सांख्यिकीय विधियों का उपयोग किया जाता है)। मैं आपको इसे सरल बनाने के लिए अपने प्रश्न को संपादित करने के लिए प्रोत्साहित करूंगा।
टिम

जवाबों:


2

हां, जब हम पक्षपातपूर्ण कम विचरण का अनुमान चाहते हैं। मुझे यहाँ विशेष रूप से गंग की पोस्ट पसंद है कि संकोचन विधियों से क्या समस्या हल होती है? कृपया मुझे यहां गंग की आकृति चिपकाने की अनुमति दें ...

यहाँ छवि विवरण दर्ज करें यदि आप प्लॉट किए गए गोबर की जांच करते हैं, तो आप स्पष्ट होंगे कि हमें नियमितीकरण / सिकुड़न की आवश्यकता क्यों है। सबसे पहले, मुझे यह अजीब लग रहा है कि हमें पक्षपाती अनुमानों की आवश्यकता क्यों है? लेकिन उस आंकड़े को देखते हुए, मुझे एहसास हुआ, कम विचरण मॉडल के बहुत सारे फायदे हैं: उदाहरण के लिए, यह उत्पादन उपयोग में अधिक "स्थिर" है।


हां, लेकिन हम नियमितीकरण पैरामीटर का चयन कैसे करते हैं? जब लक्ष्य भविष्यवाणी त्रुटि को कम करना है, तो हम एक सत्यापन सेट का उपयोग कर सकते हैं। अगर हम कभी भी सही मॉडल मापदंडों का पालन नहीं करते हैं, तो हम एक सत्यापन सेट का उपयोग कैसे कर सकते हैं?
एड्रियन

मेरे प्रश्न के निचले भाग में "कार्य-कारण की मूलभूत समस्या" के बारे में उद्धरण देखें।
एड्रियन

1

क्या क्रॉस-वैलिडेशन मददगार हो सकता है अगर हम केवल मॉडलिंग (यानी मापदंडों का आकलन) में रुचि रखते हैं, पूर्वानुमान में नहीं?

हाँ यह कर सकते हैं। उदाहरण के लिए, दूसरे दिन मैं निर्णय पेड़ों के माध्यम से पैरामीटर महत्व का अनुमान लगा रहा था। जब भी मैं एक पेड़ का निर्माण करता हूं, मैं क्रॉस-सत्यापन त्रुटि की जांच करता हूं। मैं जितना हो सकता है त्रुटि को कम करने की कोशिश करता हूं, फिर मैं मापदंडों के महत्व का आकलन करने के अगले चरण पर जाऊंगा। यह संभव है कि यदि आपके द्वारा बनाया गया पहला पेड़ बहुत खराब है और आप त्रुटि की जांच नहीं करते हैं, तो आपके पास कम सटीक (यदि गलत नहीं है) उत्तर होंगे।

मेरा मानना ​​है कि प्रत्येक तकनीक के नियंत्रण चर की कई संख्या के कारण है। एक नियंत्रण चर में मामूली परिवर्तन भी एक अलग परिणाम प्रदान करेगा।

क्रॉस-सत्यापन त्रुटि की जांच करने के बाद अपने मॉडल को कैसे सुधारें? खैर, यह आपके मॉडल पर निर्भर करता है। उम्मीद है, कुछ समय की कोशिश के बाद आपको सबसे महत्वपूर्ण नियंत्रण चर के कुछ विचार मिलेंगे और कम त्रुटि खोजने के लिए उनमें हेरफेर कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.