अनुचित रैखिक मॉडल कब मजबूत रूप से सुंदर हो जाते हैं?


9

प्रशन:

  • क्या अनुचित रैखिक मॉडल व्यवहार में उपयोग किए जाते हैं या वे वैज्ञानिक पत्रिकाओं में समय-समय पर वर्णित किसी प्रकार की जिज्ञासा हैं? यदि हां, तो वे किन क्षेत्रों में उपयोग किए जाते हैं?
  • क्या ऐसे मॉडल के अन्य उदाहरण हैं?
  • अंत में, मानक त्रुटियां, p-values, R2 ऐसे मॉडलों के लिए ओएलएस से लिया गया आदि सही होना चाहिए, या उन्हें किसी तरह सही किया जाना चाहिए?

पृष्ठभूमि: साहित्य में समय-समय पर अनुचित रैखिक मॉडल का वर्णन किया जाता है। सामान्य तौर पर, ऐसे मॉडल के रूप में वर्णित किया जा सकता है

y=a+biwixi+ε

क्या उन्हें प्रतिगमन से अलग बनाता है wjमॉडल में अनुमानित गुणांक नहीं हैं , लेकिन वे वजन हैं जो हैं

  • प्रत्येक चर के लिए बराबर wi=1( इकाई भारित प्रतिगमन ),
  • सहसंबंधों के आधार पर wi=ρ(y,xi) (दाना एंड डावेस, 2004),
  • बेतरतीब ढंग से चुना गया (डावेस, 1979),
  • 1 नकारात्मक रूप से संबंधित चर के लिए y, 1 सकारात्मक रूप से संबंधित चर के लिए y (वेनर, 1976)।

इसके अलावा कुछ प्रकार की सुविधा स्केलिंग का उपयोग करना आम है, जैसे कि चर को परिवर्तित करना Z-scores। तो, इस तरह के मॉडल को रेखीय प्रतिगमन को सरल बनाने के लिए सरल बनाया जा सकता है

y=a+bv+ε

कहाँ पे v=wix, और बस ओएलएस प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है।

संदर्भ:
डॉव, रॉबिन एम। (1979)। निर्णय लेने में अनुचित रैखिक मॉडल की मजबूत सुंदरताअमेरिकी मनोवैज्ञानिक, 34, 571-582।

ग्रेफ, ए। (2015)। समान रूप से भारित भविष्यवक्ताओं का उपयोग करके पूर्वानुमानों में सुधार करनाजर्नल ऑफ बिजनेस रिसर्च, 68 (8), 1792-1799।

वेनर, हॉवर्ड (1976)। रैखिक मॉडल में गुणांक का अनुमान लगाना: यह कोई बात नहीं बनाता हैमनोवैज्ञानिक बुलेटिन 83 (2), 213।

दाना, जे और डावेस, आरएम (2004)। सामाजिक विज्ञान भविष्यवाणियों के लिए प्रतिगमन के लिए सरल विकल्पों की श्रेष्ठताजर्नल ऑफ एजुकेशनल एंड बिहेवियरल स्टैटिस्टिक्स, 29 (3), 317-331।


3
किस अर्थ में इन मॉडलों से प्राप्त आंकड़े "गलत" होंगे?
whuber

1
जब wis पूर्व-निर्दिष्ट और हैं bअनुमान है, यह सिर्फ पूर्वानुमानों पर किए गए डेटा में कमी है - विभिन्न रूपों में सामान्य रूप से (उदाहरण के लिए ग्लासगो कोमा स्केल और चार्लसन सह-रुग्णता सूचकांक) देखें - जो सामान्य एसआरएस ढांचे में प्रवेश की वैधता को प्रभावित नहीं करेगा। कबy निर्धारित करने के लिए प्रयोग किया जाता है wiएस, मानक त्रुटियों और सी। मुझे लगता है कि आशावादी दिशा में होगा।
Scortchi - को पुनः स्थापित मोनिका

1
यह एक सूचित टिप्पणी नहीं थी - कागज अभी भी मेरे "पढ़ने के लिए" ढेर पर हैं। मुझे बस आश्चर्य हुआ: - "क्यों 'अनुचित'?"। एक भविष्यवक्ता के लिए अन्य चर का रैखिक संयोजन होना असामान्य नहीं है - कई मापों का एक औसत, एक प्रमुख घटक स्कोर, एक अन्य प्रतिगमन से एक भविष्यवाणी, एक तेजी से सुचारू समय श्रृंखला से स्तर, या एक अच्छी तरह से स्थापित मूल्य की गणना। या तदर्थ सूचकांक। प्रतिक्रिया के भार से वज़न का आकलन नहीं करना, छोटे नमूनों के आकार के साथ अति-फिटिंग से बचने में मदद करता है।
Scortchi - को पुनः स्थापित मोनिका

1
जैसे बेदहु (2000), "एक साधारण कोमोबायिटी स्केल डायलिसिस रोगियों में नैदानिक ​​परिणामों और लागतों की भविष्यवाणी करता है" एम। जे। मेड।, 108 , 8 मॉडल समीकरण का एक ही रूप है जहाँ तुम्हारा हैxis को डायबिटीज, लिम्फोमा, और सी।, और; के लिए संकेतक चर के रूप में परिभाषित किया गया है wis पूर्व-निर्दिष्ट हैं। मुझे लगता है कि मैं जो कह रहा हूं वह यह है कि "अनुचित" और "उचित" प्रतिगमन मॉडल के बीच का अंतर ईश्वर प्रदत्त सेट की धारणा पर टिका हुआ हैxiएस, जिनमें से प्रत्येक के लिए एक "उचित" मॉडल एक गुणांक का अनुमान लगाता है।
Scortchi - को पुनः स्थापित मोनिका

4
कब wi=ρ(y,xi), & अगर ρअनुमान लगाया गया था कि एक ही डेटा से मॉडल फिट होता है, वह मछली का एक अलग केतली होगा।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


1

वास्तव में, यह मुझे लगता है कि यह ग्रहण किए गए सहसंयोजक संरचनाओं का एक वर्गीकरण है। दूसरे शब्दों में, यह एक प्रकार का बायेसियन पूर्व मॉडलिंग है।

सामान्य एमएलआर प्रक्रिया पर मजबूती के कारण यह लाभ होता है क्योंकि मापदंडों की संख्या (df) कम हो जाता है, और संवर्धित लोप चर चर , OVB के कारण अशुद्धि का परिचय देता है । OVB की वजह से ढलान चपटी है,|β^|<|β|, निर्धारण का गुणांक कम हो गया है R^2<R2

मेरा व्यक्तिगत अनुभव यह है कि बायेसियन दृष्टिकोण से बेहतर बेहतर मॉडलिंग का उपयोग करना है; परिवर्तन मापदंडों, अन्य मानदंडों का उपयोग करें, और / या nonlinear तरीकों का उपयोग करें। यही है, एक बार समस्या के भौतिकी और तरीकों का ठीक से पता लगाया जाता है और समन्वित किया जाता है, एफ आँकड़े, दृढ़ संकल्प के गुणांक, आदि में गिरावट के बजाय सुधार होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.