उन्नत प्रतिगमन मॉडलिंग उदाहरण


22

मैं एक उन्नत रैखिक प्रतिगमन मामले के अध्ययन की तलाश कर रहा हूं, जो जीएलएम या ओएलएस का उपयोग करके मॉडल जटिल, कई गैर-रैखिक संबंधों के लिए आवश्यक कदमों को दर्शाता है। बुनियादी विद्यालय के उदाहरणों से परे जाने वाले संसाधनों को खोजना आश्चर्यजनक रूप से कठिन है: मैंने जो किताबें पढ़ी हैं उनमें से अधिकांश एक भविष्यवक्ता के बॉक्सकॉक्स के साथ युग्मित प्रतिक्रिया के एक लॉग ट्रांसफ़ॉर्मेशन या सबसे अच्छे मामले में एक प्राकृतिक सीमा से आगे नहीं जाएगी। इसके अलावा सभी उदाहरण मैंने अब तक एक अलग मॉडल में प्रत्येक डेटा ट्रांसफ़ॉर्मेशन समस्या को देखा है, अक्सर एक ही प्रेडिक्टर मॉडल में।

मुझे पता है कि एक BoxCox या YeoJohnson परिवर्तन क्या है। मैं जो देख रहा हूं वह एक विस्तृत, वास्तविक जीवन का अध्ययन है, जहां प्रतिक्रिया / संबंध स्पष्ट नहीं हैं। उदाहरण के लिए, प्रतिक्रिया सख्ती से सकारात्मक नहीं है (इसलिए आप लॉग या बॉक्सकॉक्स का उपयोग नहीं कर सकते हैं), भविष्यवाणियों के पास स्वयं और प्रतिक्रिया के बीच गैर-रैखिक संबंध हैं, और अधिकतम संभावना डेटा परिवर्तन एक मानक 0.33 का अर्थ नहीं लगता है या 0.5 घातांक। इसके अलावा अवशिष्ट विचरण गैर-स्थिर पाया जाता है (यह कभी नहीं है), इसलिए प्रतिक्रिया को भी रूपांतरित करना होगा और गैर-मानक जीएलएम परिवार प्रतिगमन या प्रतिक्रिया परिवर्तन के बीच विकल्प बनाना होगा। शोधकर्ता संभवतः डेटा को ओवरफिट करने से बचने के लिए विकल्प बनाएंगे।

संपादित करें

अब तक मैंने निम्नलिखित संसाधन जुटाए:

  • रिग्रेशन मॉडलिंग रणनीतियाँ, एफ। हरेल
  • एप्लाइड इकोनोमेट्रिक टाइम सीरीज़, डब्ल्यू एंडर्स
  • आर, जी पेट्रीस के साथ गतिशील रैखिक मॉडल
  • एप्लाइड रिग्रेशन एनालिसिस, डी। क्लेनबाम
  • एक परिचय सांख्यिकीय सीखना, जी। जेम्स / डी। Witten

मैं केवल अंतिम (ISLR) पढ़ता हूं और यह एक बहुत अच्छा पाठ है (मेरी नजर में एक 5 पांच सितारे), हालांकि उन्नत प्रतिगमन मॉडलिंग की तुलना में एमएल के लिए अधिक उन्मुख है।

सीवी पर यह अच्छा पद भी है जो एक चुनौतीपूर्ण प्रतिगमन मामले को प्रस्तुत करता है।


8
मेरा मानना ​​है कि फ्रैंक हार्लेज़ पुस्तक ( amazon.com/… ) मददगार हो सकती है।
एडम रॉबिंसन

@AdamRobinsson मैं देख रहा हूं कि TOC कई प्रासंगिक विषयों (बहुभिन्नरूपी मॉडल, स्प्लिन, मल्टीकोलिनरिटी) को छू रहा है, लेकिन क्या उन तरीकों को वास्तविक जीवन उदाहरण में एक साथ चित्रित किया गया है या प्रत्येक विषय को अलग से समझाया गया है? क्योंकि आमतौर पर वास्तविक जीवन में उदाहरण सभी समस्याओं को आप पर एक साथ आते हैं और यह कभी स्पष्ट नहीं होता है कि उन्हें अच्छी तरह से कैसे प्रबंधित किया जाए।
रॉबर्ट कुब्रिक

1
मैंने अभी तक पूरी किताब नहीं पढ़ी है, लेकिन पहले 150 पेज बिल्कुल शानदार रहे हैं (मैं स्टैचियन नहीं हूं, सिर्फ एक उत्साही हूं)। उदाहरण व्यापक और विस्तृत हैं। पुस्तक के साथ RMS (प्रतिगमन मॉडलिंग रणनीतियों) पैकेज आर के साथ है। मैंने डेविड क्लेनबाम्स प्रतिस्पर्धा की पुस्तक पर भी ध्यान दिया है (दुर्भाग्य से शीर्षक को भूल गया) लेकिन इसमें रणनीतियों और उदाहरणों के बारे में बहुत कम (और दो बार महंगा था)।
एडम रॉबिंसन

3
@RobertKubrick: "बहुभिन्नरूपी प्रतिगमन" का अर्थ एक से अधिक प्रतिक्रियाओं के साथ है (आपके द्वारा जोड़े गए टैग के लिए विकी देखें, या यहां )। "एकाधिक प्रतिगमन" का अर्थ एक से अधिक भविष्यवक्ता के साथ है।
Scortchi - को पुनः स्थापित मोनिका

3
आप एंडर्स द्वारा एप्लाइड इकोनोमेट्रिक टाइम सीरीज़ देखना चाह सकते हैं। नया संस्करण पुस्तक के अंत में गैर-रेखीय मॉडल को कवर करता है। लगभग सभी डेटा सार्वजनिक रूप से सेंट लुइस फेड वेबसाइट (आर में क्वांटमोड के माध्यम से सुलभ) पर उपलब्ध हैं, ताकि आप वास्तविक जीवन के उदाहरणों का अनुसरण कर सकें। R के साथ डायनामिक लीनियर मॉडल्स में वास्तविक डेटा के साथ कुछ उदाहरण हैं जो बहुत अच्छे हैं।
एरिक ब्रैडी

जवाबों:


10

रिग्रेशन मॉडलिंग रणनीतियाँ और आईएसएलआर, जो पहले ही दूसरों द्वारा उल्लेखित किए गए हैं, दो बहुत अच्छे सुझाव हैं। मेरे पास कुछ अन्य हैं जिन पर आप विचार करना चाहते हैं।

कुह्न और जॉनसन द्वारा एप्लाइड प्रिडिक्टिव मॉडलिंग में कई अच्छे केस स्टडीज शामिल हैं और यह बहुत सुंदर है।

आर के साथ प्रैक्टिकल डेटा साइंस अपने अनुप्रयोगों के संदर्भ में व्यावहारिक (प्रतिगमन) मॉडलिंग का व्यवहार करता है ज्यादातर एक व्यावसायिक स्थिति में पूर्वानुमान मॉडल के रूप में।-

सामान्यीकृत एडिटिव मॉडल: साइमन वुड द्वारा आर के साथ एक परिचय सामान्यीकृत एडिटिव मॉडल का एक अच्छा उपचार है और आप mgcvआर के लिए अपने पैकेज का उपयोग करके उन्हें कैसे फिट करते हैं। इसमें कुछ व्यावहारिक व्यावहारिक उदाहरण हैं। GAM मॉडल का उपयोग "सही" परिवर्तन का पता लगाने के लिए एक विकल्प है क्योंकि यह एक डेटा विस्तारक तरीके से एक तख़्ता विस्तार और दंडित अधिकतम-संभावना अनुमान के माध्यम से किया जाता है। हालांकि, अभी भी अन्य विकल्प हैं जिन्हें बनाने की आवश्यकता है, उदाहरण के लिए लिंक फ़ंक्शन का विकल्प।

Mboost आर के लिए पैकेज भी GAM मॉडल फिट बैठता है, लेकिन बढ़ाने के माध्यम से एक अलग दृष्टिकोण का उपयोग कर। मैं पैकेज (विगनेट्स में से एक) के लिए ट्यूटोरियल की सिफारिश करता हूं।

मैं हेंड्री और डोरनिक द्वारा एम्पिरिकल मॉडल डिस्कवरी और थ्योरी मूल्यांकन का भी उल्लेख करूंगा , हालांकि मैंने अभी तक इस पुस्तक को खुद नहीं पढ़ा है। यह मेरे लिए सिफारिश की गई थी।


एप्लाइड प्रिडिक्टिव मॉडलिंग ... सो-सो। मुझे ISLR पसंद है।
रॉबर्ट कुब्रिक

5

सबसे अच्छा पाठ्यक्रम सामग्री है कि आप उन्नत, कई, जटिल (नॉनलाइनर सहित) प्रतिगमन पर पा सकते हैं, फ्रैंक ई। हरेल जूनियर द्वारा लिखित पुस्तक प्रतिगमन मॉडलिंग रणनीतियों पर आधारित है।

पुस्तक में टिप्पणियों पर चर्चा की जा रही है लेकिन इस सामग्री पर नहीं, जो स्वयं एक महान संसाधन है।


2

मैं जोशुआ डी। एग्रीस्ट और जॉर्न-स्टीफ़न पिस्चके की पुस्तक को ज्यादातर हानिरहित अर्थमिति सुझाऊंगा

यह सबसे वास्तविक दुनिया है, पृथ्वी के लिए नमक, पाठ मैं खुद का और यह सुपर सस्ता है, लगभग $ 26.00 नया। पुस्तक स्नातक सांख्यिकीविद् / अर्थशास्त्री के लिए लिखी गई है, इसलिए यह काफी उन्नत है।

अब यह पुस्तक वास्तव में आपके लिए इस मायने में नहीं है कि यह "जटिल, कई गैर-रेखीय रिश्तों" पर ध्यान केंद्रित नहीं करता है, जितना कि एंडोएजीनिटी, व्याख्या और चतुर प्रतिगमन डिजाइन जैसे कोर फंडामेंटल्स।

लेकिन मैं इस पुस्तक को एक बिंदु बनाने की कोशिश कर रहा हूं। कौन सा है, जब यह प्रतिगमन विश्लेषण की वास्तविक दुनिया के अनुप्रयोग की बात आती है, तो सबसे चुनौतीपूर्ण मुद्दों का आमतौर पर इस तथ्य से कोई लेना-देना नहीं होता है कि हमारे मॉडल पर्याप्त रूप से जटिल नहीं हैं ... मेरा विश्वास है कि हम ड्रम-अप बहुत जटिल हैं मॉडल के! बल्कि सबसे बड़ा मुद्दा जैसी चीजें हैं

  1. Endogeneity
  2. हमारे पास आवश्यक सभी डेटा नहीं हैं
  3. बहुत डेटा के बाद ... और यह सब गड़बड़ है!
  4. बहुत से लोग अपने स्वयं के मॉडल की सही ढंग से व्याख्या नहीं कर सकते हैं (एक समस्या जो अधिक प्रचलित हो जाती है क्योंकि हम मॉडल को अधिक जटिल बनाते हैं)

GMM, नॉन-लीनियर फिल्टर्स और नॉन-पैरामीट्रिक रिग्रेशन की दृढ़ समझ आपके द्वारा सूचीबद्ध सभी विषयों को कवर करती है और जैसे-जैसे आप सीखते जाते हैं, सीखते जा सकते हैं। हालांकि, वास्तविक दुनिया के आंकड़ों के साथ, इन रूपरेखाओं में अनावश्यक रूप से जटिल होने की क्षमता है, अक्सर हानिकारक रूप से ऐसा होता है।

सभी अक्सर यह पूरी तरह से सामान्यीकृत और अत्यधिक परिष्कृत होने के बजाय चतुराई से सरल होने की क्षमता है, जो आपको वास्तविक दुनिया के विश्लेषण के साथ सबसे अधिक लाभ पहुंचाता है। यह पुस्तक आपको पूर्व की मदद करेगी।


1

आप आर (आईएसएलआर) के साथ सांख्यिकीय अध्ययन के परिचय का उल्लेख कर सकते हैं, पुस्तक मामलों के साथ विस्तार से विभाजन और बहुपद प्रतिगमन के बारे में बात करती है।


1

मुझे यकीन नहीं है कि आपके प्रश्न का उद्देश्य क्या है। मैं ग्रीन के इकोनोमेट्रिक विश्लेषण पाठ की सिफारिश कर सकता हूं । इसमें कागज के संदर्भों का एक टन है। पुस्तक में प्रत्येक उदाहरण एक प्रकाशित पेपर का संदर्भ देता है।

आपको एक स्वाद देने के लिए, p.195 पर उदाहरण 7.6 "एक लॉगलाइनर मॉडल इनकम फॉर इंटरएक्शन इफेक्ट्स" देखें। यह एक कागज और डेटा सेट को संदर्भित करता है: रेजिना टी। रिपहैन, अचिम वंबाच और एंड्रियास मिलियन, " स्वास्थ्य देखभाल की मांग में प्रोत्साहन प्रभाव: एक बिवरिएट पैनल काउंट डेटा अनुमान ", एप्लाइड इकोनोमेट्रिक्स की पत्रिका, वॉल्यूम। 18, नंबर 4, 2003, पीपी। 387-405।

उदाहरण लॉगलाइनियर मॉडल और इंटरैक्शन प्रभाव के उपयोग के बारे में है। आप पूरे पेपर को पढ़ सकते हैं, या इस पाठ्यपुस्तकों का वर्णन कर सकते हैं। यह एक बना हुआ मामला नहीं है। यह एक वास्तविक प्रकाशित शोध है। यह है कि लोग वास्तव में अर्थशास्त्र अनुसंधान में सांख्यिकीय तरीकों का उपयोग करते हैं।

जैसा कि मैंने लिखा है कि पुस्तक उन्नत सांख्यिकीय विधियों के उपयोग पर इस तरह के उपयोग के मामलों से प्रेरित है।


0

क्या आपने फाइनेंशियल टाइम सीरीज़ एनालिसिस के कुछ पाठ्यक्रमों / पुस्तकों पर ध्यान दिया है जो रुए त्सय (यूसीकोगो) लिखते हैं?

http://faculty.chicagobooth.edu/ruey.tsay/teaching/

Ruey Tsays कक्षाएं और पाठ्यपुस्तक वित्तीय बाजारों में उपयोग के लिए बनाए गए प्रकार के जटिल रजिस्टरों के वित्त में कई वास्तविक दुनिया उदाहरण प्रदान करती हैं। अध्याय 1 मल्टीफॉर्मर प्रतिगमन मॉडल के साथ शुरू होता है और अध्याय 5 या 6 द्वारा सीज़नल ऑटोरेगिविव टाइम सीरीज़ मॉडल तक फैलता है।


2
हाँ, मैंने किया और इसे बिल्कुल पसंद नहीं है। यह बहुत विस्तृत है (कुछ भी अस्थिरता मॉडल से उच्च आवृत्ति तक ARIMA ...), प्रत्येक विषय को हल्के से स्पर्श करें (हाथ में इतने सारे विषयों के साथ कैसे नहीं कर सकते) और आर अध्ययन और चुनौतियां कम से कम हो जाती हैं। यह एकेडमिक पेपर और पहले से बताई गई थ्योरी / मॉडल है जो आप कहीं और पा सकते हैं। यह वास्तव में स्कूल के मामलों से मेरा तात्पर्य है जो वास्तविक दुनिया, उन्नत समस्या में कई चुनौतियों की जटिलता से कभी नहीं निपटते हैं।
रॉबर्ट कुब्रिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.