अगर मैं हर नमूना अवलोकन को रैखिक प्रतिगमन मॉडल में दोहराता हूं और प्रतिगमन को फिर से जांचता हूं तो परिणाम कैसे प्रभावित होगा?


15

मान लें कि मेरे पास एन अवलोकन हैं, संभवतः कई कारक हैं और मैं प्रत्येक अवलोकन को दो बार (या एम बार) दोहराता हूं कि एनएम के इस नए सेट पर प्रतिगमन केवल मूल टिप्पणियों पर एक प्रतिगमन की तुलना कैसे होगी?

जवाबों:


13

वैचारिक रूप से, आप कोई "नई" जानकारी नहीं जोड़ रहे हैं, लेकिन आप अधिक सटीक रूप से उस जानकारी को "जानते" हैं।

इसलिए यह छोटे मानक त्रुटियों के साथ समान प्रतिगमन गुणांक में परिणाम देगा।

उदाहरण के लिए, स्टाटा में, विस्तारित एक्स फ़ंक्शन प्रत्येक अवलोकन एक्स बार डुप्लिकेट करता है।

sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515    .001586    -2.43   0.018    -.0070138   -.0006891
      length |  -.0795935   .0553577    -1.44   0.155    -.1899736    .0307867
       _cons |   47.88487    6.08787     7.87   0.000       35.746    60.02374
------------------------------------------------------------------------------

expand 5

regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515   .0006976    -5.52   0.000    -.0052232   -.0024797
      length |  -.0795935   .0243486    -3.27   0.001    -.1274738   -.0317131
       _cons |   47.88487   2.677698    17.88   0.000     42.61932    53.15043
------------------------------------------------------------------------------

जैसा कि आप देख सकते हैं, पूर्व में नगण्य गुणांक (लंबाई) विस्तारित मॉडल में सांख्यिकीय रूप से महत्वपूर्ण हो जाते हैं, उस सटीकता का प्रतिनिधित्व करते हैं जिसके साथ आप "जानते" हैं कि आप क्या जानते हैं।


हां मानक त्रुटियां वास्तव में कम होती हैं। कुछ इसके लिए भारित रैखिक प्रतिगमन की सलाह देते हैं .. क्या कोई विधि है जिसे आप इसे ठीक करने के लिए उपयोग करते हैं?
बीबीडीन्स 16

3

w=argminw||Xwy||2
XyMM

सहमत हैं, लेकिन मुझे लगता है कि t आँकड़े और मानक त्रुटियों को N से NM में परिवर्तन को बदलना चाहिए?
पैलेस चैन

MNPNP
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.