आर स्क्वायर नकारात्मक कब है?


77

मेरी समझ यह है कि ऋणात्मक नहीं हो सकता है क्योंकि यह का वर्ग है। हालांकि मैंने एक स्वतंत्र चर और एक आश्रित चर के साथ SPSS में एक सरल रैखिक प्रतिगमन चलाया। मेरा SPSS आउटपुट मुझे लिए एक नकारात्मक मान देता है । अगर मुझे R से हाथ की गणना करनी है तो सकारात्मक होगा। SPSS ने इसे नकारात्मक मानने के लिए क्या किया है?आर 2 आर 2R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

कोड मैंने उपयोग किया है:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

मुझे एक नकारात्मक मूल्य मिलता है। क्या कोई समझा सकता है कि इसका क्या मतलब है?

नकारात्मक आरएसकेआर

यहाँ छवि विवरण दर्ज करें


3
क्या इससे आपके सवाल का जवाब मिलता है? आंकड़े.stackexchange.com/questions/6181/… यदि नहीं, तो कृपया अधिक जानकारी प्रदान करें: यह "SPSS आउटपुट" किस प्रक्रिया का है?
whuber

2
क्या आपके रैखिक प्रतिगमन मॉडल में एक अवरोधन है?
एनपीई

2
@ फिर से, आप किस SPSS प्रक्रिया का उपयोग कर रहे हैं?
whuber

1
@ एक समय मैं सुझाव देता हूं कि आप समय श्रृंखला उत्तर की अवहेलना करें, क्योंकि आपका डेटा समय श्रृंखला नहीं है और आप समय श्रृंखला प्रक्रिया का उपयोग नहीं कर रहे हैं। क्या आपको वाकई यकीन है कि आर स्क्वेर को नकारात्मक मूल्य के रूप में दिया गया है? इसका परिमाण सही है: । मैंने SPSS सहायता के माध्यम से यह देखने के लिए देखा है कि क्या शायद एक सम्मेलन के रूप में नकारात्मक आर के लिए आर-वर्ग मूल्य को नकार दिया गया है, लेकिन मुझे ऐसा कोई सबूत नहीं दिखता है कि यह मामला है। शायद आप आउटपुट का एक स्क्रीन शॉट पोस्ट कर सकते हैं जहां आप आर-स्क्वेर पढ़ रहे हैं? (0.395)2=0.156
whuber

1
आश्रित चर घरों की कीमत है इसलिए यह संभव है कि 95% सीआई शायद 120,000। दुर्भाग्य से मैं यहाँ डेटा पोस्ट नहीं कर सकता क्योंकि यह डेटा उपयोग की शर्तों के विपरीत होगा।
ऐनी

जवाबों:


105

आर 2 आर 2 आर 2R2 एक क्षैतिज सीधी रेखा (शून्य परिकल्पना) के साथ चुने हुए मॉडल के फिट की तुलना करता है। यदि चुना गया मॉडल एक क्षैतिज रेखा से भी बदतर है, तो नकारात्मक है। ध्यान दें कि हमेशा किसी भी चीज़ का वर्ग नहीं होता है, इसलिए गणित के किसी भी नियम का उल्लंघन किए बिना इसका नकारात्मक मूल्य हो सकता है। केवल नकारात्मक है जब चुना गया मॉडल डेटा की प्रवृत्ति का पालन नहीं करता है, इसलिए एक क्षैतिज रेखा से भी बदतर फिट बैठता है।R2R2R2

उदाहरण: एक रेखीय प्रतिगमन मॉडल के लिए फिट डेटा विवश है ताकि अवरोधन बराबर हो ।1500Y1500

यहाँ छवि विवरण दर्ज करें

इन आंकड़ों को देखते हुए मॉडल का कोई मतलब नहीं है। यह स्पष्ट रूप से गलत मॉडल है, शायद दुर्घटना द्वारा चुना गया।

मॉडल का फिट (बिंदु के माध्यम से जाने के लिए विवश एक सीधी रेखा (0,1500)) क्षैतिज रेखा के फिट से भी बदतर है। इस प्रकार मॉडल से राशि का वर्ग क्षैतिज रेखा के योग से वर्ग से बड़ा है । की गणना । जब से अधिक होता है , तो यह समीकरण लिए एक नकारात्मक मान की गणना करता है ।( एस एस मुन्ना ) आर 2 1 - एस एस reg(SSreg)(SStot)R2 एसएसरेगएसएसमुन्नाआर21SSregSStotSSregSStotR2

कोई बाधा नहीं के साथ रैखिक प्रतिगमन के साथ, सकारात्मक (या शून्य) होना चाहिए और सहसंबंध गुणांक, के वर्ग के बराबर होता है । एक नकारात्मक केवल रैखिक प्रतिगमन के साथ संभव है जब या तो अवरोधन या ढलान विवश होता है ताकि "सबसे अच्छी तरह से फिट" लाइन (बाधा को देखते हुए) एक क्षैतिज रेखा से अधिक खराब हो। नॉनलाइनियर रिग्रेशन के साथ, नकारात्मक हो सकता है जब भी सबसे अच्छा फिट मॉडल (चुने हुए समीकरण, और इसकी बाधाओं, यदि कोई हो) एक क्षैतिज रेखा की तुलना में खराब डेटा को फिट करता है। आर आर 2 आर 2R2rR2R2

नीचे पंक्ति: एक नकारात्मक एक गणितीय असंभव या कंप्यूटर बग का संकेत नहीं है। इसका सीधा सा मतलब है कि चुना हुआ मॉडल (अपनी अड़चनों के साथ) डेटा को वास्तव में खराब करता है।R2


3
@JMS यह विपरीत है कि मेरा Googling क्या इंगित करता है: "/ ORIGIN" इंटरसेप्ट को 0 पर ठीक करता है; "/ NOORIGIN" "SPSS बताता निरंतर" (दबाने के लिए नहीं एक परिचयात्मक SPSS करने के लिए Windows के लिए गाइड )
whuber

10
@ शुभकर्ता सही। @ हार्वे-motulsky एक नकारात्मक आर ^ 2 मूल्य है एक गणितीय असंभव (और एक कंप्यूटर बग पता चलता है) (एक अवरोधन के साथ) नियमित OLS प्रतिगमन के लिए। यह वही है जो 'पंजीकरण' कमांड करता है और मूल पोस्टर के बारे में क्या पूछ रहा है। इसके अलावा, OLS प्रतिगमन के लिए, आर ^ 2 है की भविष्यवाणी की और कहा मूल्यों के बीच वर्ग सह-संबंध। इसलिए, यह गैर-नकारात्मक होना चाहिए। एक पूर्वसूचक के साथ सरल ओएलएस प्रतिगमन के लिए, यह भविष्यवक्ता और आश्रित चर के बीच चुकता सहसंबंध के बराबर है - फिर से, यह गैर-नकारात्मक होना चाहिए।
वोल्फगैंग

1
@ शुभचिंतक। मेरी गलती; स्पष्ट रूप से मैं SPSS का उपयोग नहीं करता हूं - या स्पष्ट रूप से पढ़ता हूं :)
JMS

1
@whuber। मैंने एक पैरा जोड़ा है जो बताता है कि रैखिक प्रतिगमन के साथ, R2 केवल नकारात्मक हो सकता है जब अवरोधन (या शायद ढलान) संकुचित हो। कोई बाधा नहीं होने के साथ, आर 2 को सकारात्मक होना चाहिए और आर के वर्ग, सहसंबंध गुणांक के बराबर होना चाहिए।
हार्वे मोटुलस्की जुएल

1
@ हर्वेमोतुलस्की, इस मामले में अवरोध या ढलान विवश नहीं थे। ऐसा लगता है कि आप कह रहे हैं कि अगर ये विवश हैं तो रुका हुआ ऋण नकारात्मक हो सकता है। क्या आप इस बारे में विस्तार से बता सकते हैं कि इस विशेष मामले में क्या हुआ होगा?
ऐनी

18

क्या आप अपने प्रतिगमन में एक अवरोधक को शामिल करना भूल गए हैं? मैं SPSS कोड से परिचित नहीं हूं, लेकिन हयाशी के अर्थमिति के पृष्ठ 21 पर:

यदि रजिस्टरों में एक स्थिरांक शामिल नहीं है लेकिन (जैसा कि कुछ प्रतिगमन सॉफ़्टवेयर पैकेज करते हैं) तब भी आप सूत्र द्वारा गणना करते हैंR2

R2=1i=1nei2i=1n(yiy¯)2

तो ऋणात्मक हो सकता है। ऐसा इसलिए है, क्योंकि अवरोधन के लाभ के बिना, प्रतिगमन निर्भर चर को ट्रैक करने के मामले में नमूना की तुलना में बदतर कर सकता है (यानी, अंश भाजक से अधिक हो सकता है)।R2

मैं जाँच करूँगा और सुनिश्चित करूँगा कि SPSS आपके प्रतिगमन में अवरोधन सहित है।


4
NOORIGIN ने अपने कोड में बताया कि इंटरसेप्ट मॉडल में शामिल था
ttnphns

2
वह अजीब है। मैंने अनुमान लगाया NOORIGINहोगा कि इसका मतलब यह होगा कि मॉडल में इंटरसेप्ट को शामिल नहीं किया गया था, बस नाम बंद हो गया।
मैट ओ'ब्रायन

6

यह तब हो सकता है जब आपके पास एक समय श्रृंखला होती है जो कि नीड है और आप फॉर्म के एक अनुपयुक्त ARIMA मॉडल (0,1,0) का निर्माण करते हैं जो कि पहले बहाव के साथ कोई अंतर नहीं है, फिर विचरण (वर्ग का योग - SSE) अवशिष्ट मूल श्रृंखला के विचरण (वर्ग SSO का योग) से बड़ा होगा। इस प्रकार समीकरण 1-SSE / SSO SSE execeedS SSO के रूप में एक ऋणात्मक संख्या प्राप्त करेगा। हमने इसे तब देखा है जब उपयोगकर्ता एक मान्य मॉडल को फिट करते हैं या एक उपयुक्त ARIMA संरचना को पहचानने / बनाने के लिए अपर्याप्त प्रक्रियाओं का उपयोग करते हैं। बड़ा संदेश यह है कि एक मॉडल आपकी दृष्टि को खराब कर सकता है (एक जोड़ी खराब चश्मे की तरह)। आपके डेटा तक पहुंच के बिना मुझे अन्यथा आपके दोषपूर्ण परिणामों की व्याख्या करने में समस्या होगी। क्या आपने इसे आईबीएम के ध्यान में लाया है?

एक कल्पित मॉडल के प्रति-उत्पादक होने के विचार को हार्वे मोटुलस्की द्वारा प्रतिध्वनित किया गया है। महान पोस्ट हार्वे!


1
स्टेट। धन्यवाद। नहीं, मैंने आईबीएम से बात नहीं की है। डेटा समय श्रृंखला नहीं है। यह समय डेटा में बिंदु से है।
ऐनी

5
@ एक और अन्य: चूंकि आपका डेटा समय श्रृंखला नहीं है और आप समय श्रृंखला प्रक्रिया का उपयोग नहीं कर रहे हैं, कृपया मेरे उत्तर की अवहेलना करें। समय श्रृंखला के साथ शामिल होने वाले अन्य लोगों ने नकारात्मक आर चौकों का अवलोकन किया है, जो मेरे पद को रोचक और स्पर्धात्मक रूप से सूचनात्मक पा सकते हैं। दूसरों को दुर्भाग्य से नहीं हो सकता है।
आयरिशस्टैट

@ इरिस्टटैट: क्या आप कृपया हार्वे मोटुलस्की पोस्ट की लिंक जोड़ सकते हैं?
kjetil b halvorsen

हार्वे ने यहां सवाल का जवाब दिया।
आयरिशस्टैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.