एक नामांकन पढ़ने के संबंध में स्पष्टीकरण


10

सूत्र के लिए rms पैकेज के साथ mtcars डेटासेट से बनाया गया एक नामांक निम्नलिखित है:

mpg ~ wt + am + qsec

यहां छवि विवरण दर्ज करें

मॉडल खुद को 0.85 और पी <0.00001 के आर 2 के साथ अच्छा लगता है

> mod

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

मैं स्पष्ट नहीं हूँ कि ये 'पॉइंट्स', 'टोटल पॉइंट्स' और 'लीनियर प्रेडिक्टर' क्या हैं। इनमें से कौन सा mpg, परिणाम चर का प्रतिनिधित्व करता है? मैं किसी भी स्पष्टीकरण की सराहना करूंगा।

संपादित करें: बिंदुओं आदि के आसान पढ़ने के लिए @Glen_b द्वारा उत्कृष्ट सुझावों पर विचार करते हुए, निम्नलिखित एक वैकल्पिक नाम हो सकता है:

यहां छवि विवरण दर्ज करें

चूंकि परिणाम या प्रतिक्रिया चर उपलब्ध है, इसलिए इसका उपयोग 'रैखिक भविष्यवक्ता' शब्द के बजाय किया जा सकता है। यह आत्म-व्याख्यात्मक भी हो जाता है कि कैसे नॉमोग्राम को पढ़ने की आवश्यकता है।


वहाँ संपादित में अच्छा आरेख
Glen_b -Reinstate मोनिका

जवाबों:


11

ठीक है, चूंकि आपका मॉडल रैखिक है, रैखिक भविष्यवक्ता के बराबर अपेक्षित mpg के साथ, आप रैखिक भविष्यवक्ता पैमाने से सीधे mpg पढ़ सकते हैं।

प्रत्येक चर के लिए, आप प्रासंगिक पैमाने पर इसका मूल्य पाते हैं। उदाहरण के लिए, कल्पना करें कि हम एक कार के लिए एक अनुमानित mpg खोजना चाहते हैं wt=4, am=1, qsec=18:

यहां छवि विवरण दर्ज करें

जो लगभग 18.94 का अनुमानित mpg देता है। समीकरण में प्रतिस्थापन 18.95 देता है, इसलिए यह बहुत करीब है। (व्यवहार में आप शायद केवल निकटतम पूरे बिंदु पर काम करेंगे - और यहां लगभग 2 आंकड़ा सटीकता प्राप्त करें - "19 mpg" - बाहर, यहां 3-4 के बजाय आंकड़े।)

मेरे मन में इस तरह के आरेख के मुख्य लाभों में से एक यह है कि आप तुरंत प्रतिक्रिया (DV) पर विभिन्न भविष्यवाणियों चर (IV) में परिवर्तनों के सापेक्ष प्रभाव को देखते हैं। यहां तक ​​कि जब आपको किसी भी गणना के लिए आरेख की आवश्यकता नहीं होती है, तब भी चर के सापेक्ष प्रभावों को प्रदर्शित करने के मामले में इसका बहुत महत्व हो सकता है।


टिप्पणियों से अनुवर्ती प्रश्न:

क्या यह गैर-रैखिक या बहुपद प्रतिगमन के लिए उसी तरह काम करता है?

E(Y)y^=b0+bx1+f(x2)

या तो:

f

f

x1

x2f

यहां छवि विवरण दर्ज करें

x2

यहां छवि विवरण दर्ज करें

f(x)x=2.23

ऐसे कार्यों के लिए कई मोड़ होना संभव है, जहां तराजू कई बार टूटेंगे और पलटेंगी - लेकिन अक्ष रेखा में केवल दो पक्ष होते हैं।

पॉइंट-टाइप नोमोग्राम के साथ यह कोई कठिनाई नहीं प्रस्तुत करता है, क्योंकि कोई भी ओवरलैप नहीं होने तक अतिरिक्त स्केल-सेक्शन को ऊपर या नीचे (या आमतौर पर, मूल रूप से अक्ष की दिशा में) स्थानांतरित कर सकता है।

(एक से अधिक टर्निंग पॉइंट संरेखण-प्रकार के नॉमोग्राम के लिए एक समस्या हो सकती है; हार्लेल की पुस्तक में दिखाया गया एक समाधान एक संदर्भ रेखा से सभी पैमानों को थोड़ा ऑफसेट करना है, जिस पर मूल्य की स्थिति वास्तव में ली गई है।)


Y

इन सभी स्थितियों के उदाहरण हरेल के प्रतिगमन मॉडलिंग रणनीतियों में पाए जा सकते हैं ।



बस एक दो साइड वाले नोट

  1. मैं संबंधित खंड के शीर्ष और निचले भाग में दो बिंदुओं को देखना पसंद करूंगा ; अन्यथा यह सही "लाइन अप" करना मुश्किल है क्योंकि आपको अनुमान लगाना होगा कि 'ऊर्ध्वाधर' क्या है। कुछ इस तरह:

    यहां छवि विवरण दर्ज करें

    हालाँकि, जैसा कि मैं टिप्पणियों में नोट करता हूं, आरेख के अंतिम खंड (कुल अंक और रैखिक भविष्यवक्ता) के लिए, शायद एक दूसरे बिंदु के पैमाने का एक बेहतर विकल्प केवल बैक-टू-बैक तराजू की एक जोड़ी होगा (कुल अंक एक पर पक्ष, दूसरे पर रैखिक भविष्यवक्ता), इस तरह:

    यहां छवि विवरण दर्ज करें

    जिसमें हम यह जानने की आवश्यकता से बचते हैं कि 'ऊर्ध्वाधर' क्या है।

  2. केवल दो निरंतर भविष्यवाणियों और एक एकल द्विआधारी कारक के साथ, हम काफी आसानी से एक अधिक पारंपरिक संरेखण नामांक का निर्माण कर सकते हैं :

    यहां छवि विवरण दर्ज करें

    इस मामले में आप बस लगता है wtऔर qsecउनके तराजू पर मूल्यों और उन्हें एक लाइन के साथ शामिल हो; जहां वे mpgअक्ष को पार करते हैं , हम मूल्य को पढ़ते हैं (जबकि amचर यह निर्धारित करता है कि mpgआपके द्वारा पढ़ी गई धुरी के किस तरफ )। इस तरह के एक साधारण मामले में, इस तरह के नामोग्राम का उपयोग तेज और सरल होता है, लेकिन कई भविष्यवक्ताओं के लिए सामान्यीकरण करना कम आसान हो सकता है, जहां वे अनिष्टकारी बन सकते हैं। आपके प्रश्न में अंक-शैली का नामांकित (जैसा कि प्रतिगमन मॉडलिंग रणनीतियों में और rmsआर में पैकेज में लागू किया गया है ) अधिक भिन्न रूप से जोड़ सकते हैं। बातचीत से निपटने के दौरान यह काफी लाभकारी हो सकता है।


स्पष्ट, सचित्र स्पष्टीकरण के लिए धन्यवाद। क्या यह गैर-रैखिक या बहुपद प्रतिगमन के लिए उसी तरह काम करता है?
रंसो

1
मैंने इस अतिरिक्त प्रश्न का उत्तर देने के लिए अपना उत्तर संपादित किया है।
Glen_b -Reinstate मोनिका

2
यह एक अद्भुत पोस्ट ग्लेन है। मुझे लगता है कि मैं डिफ़ॉल्ट रूप से अतिरिक्त पैमाने को जोड़ने के लिए nomogramफ़ंक्शन की plotविधि को संशोधित करने जा रहा हूं Points। बढ़िया सुझाव !!
फ्रैंक हरेल

1
@FrankHarrell नहीं, क्योंकि आप अंकों और कुल बिंदुओं के बीच कोई संबंध नहीं पढ़ते हैं - उन्हें एक ही पृष्ठ पर होने की आवश्यकता नहीं है। समस्या 'वर्टिकल' ढूंढ रही है इसलिए आप कुल-बिंदुओं से रैखिक भविष्यवक्ता तक को सटीक रूप से पढ़ सकते हैं। अगर वे दो तराजू बहुत करीब या छूने वाले हैं, बजाय दो इंच अलग कहने के, यह एक मुद्दा नहीं है। जब वे अलग हो जाते हैं, तो ऊर्ध्वाधर खोजने में त्रुटि की कुछ डिग्री का मतलब परिणाम में त्रुटि का एक सा हो सकता है। आपको अभी भी पहले खंड में दो अंकों के तराजू की आवश्यकता है, क्योंकि आपके पास कई भविष्यवाणियां हो सकती हैं और वे सभी अंक पैमाने से सटे नहीं हो सकते।
Glen_b -Reinstate मोनिका

1
@FrankHarrell व्यक्तिगत रूप से मुझे लगता है कि एक ग्रिड डिस्प्ले को अव्यवस्थित करता है, और इसके मूल्य को अस्पष्ट करता है; जब मैं कर सकता हूं तो ग्रिड से बचता हूं। जब तक ग्रिड स्केल के रूप में ठीक नहीं होता (जो मुझे लगता है कि नेत्रहीन रूप से भयानक होगा), वे एक विकल्प के बिना डिग्री के सटीक होने की एक ही डिग्री की अनुमति नहीं देते हैं, मैं एक दूसरे बिंदु पैमाने में संपादन समाप्त करूंगा (जैसा मैंने यहां किया था) मैं इसे दो उद्देश्यों के लिए उपयोग करने योग्य स्थिति के रूप में प्राप्त करने के लिए प्राप्त कर रहा हूं, जिन्हें मैं देख रहा हूं (i) अस्पष्ट योगदान के बिना पूर्वानुमानित मूल्यों के यथोचित सटीक अनुमान लगा रहा हूं। सापेक्ष योगदान की स्पष्टता। प्रतिक्रिया के लिए) ..
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.