यदि डेटा रैखिक नहीं है, तो क्या एक रेखीय प्रतिगमन महत्वपूर्ण हो सकता है?


11

मैंने एक रेखीय प्रतिगमन का प्रदर्शन किया जो एक महत्वपूर्ण परिणाम के साथ आया था लेकिन जब मैंने लीनियरिटी के लिए स्कैटर-प्लॉट की जांच की तो मुझे विश्वास नहीं था कि डेटा रैखिक था।

क्या स्कैल्पलॉट का निरीक्षण किए बिना रैखिकता के लिए परीक्षण करने के लिए कोई अन्य तरीके हैं?

क्या रेखीय प्रतिगमन महत्वपूर्ण हो सकता है अगर यह रैखिक नहीं था?

[बिखराव को शामिल करने के लिए संपादित]

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें


3
प्रश्नों और कई उत्तरों की कई व्याख्याएं हो सकती हैं (लेकिन मूल रूप से उत्तर सभी मामलों में हां है, और जैसा कि आपके परिणाम प्रमाण हैं, यह आपके मामले में निश्चित रूप से संभव है)। क्या आप स्कैटरप्लॉट दिखा सकते हैं? फिर अन्य लोग समझ सकते हैं कि आपके डेटा के रेखीय होने का क्या अर्थ है और इस मायने में कि महत्वपूर्ण परिणाम वैसे भी मौजूद हैं।
सेक्स्टस एम्पिरिकस

5
साधारण उदाहरणों के एक शास्त्रीय सेट के लिए आंकड़े देखें ।stackexchange.com/search?q=anscombe+quartetआँकड़ों पर .stackexchange.com / a / 152034 / 919 मैंने एक एल्गोरिथ्म पोस्ट किया है जो उदाहरणों के निर्माण में सक्षम है, लगभग किसी भी परिस्थिति के बारे में जो आप सोच सकते हैं।
whuber

निश्चित रूप से , जब सामान्य प्रवृत्ति रैखिक होती है, तब भी निओलिनियरिटी को अनदेखा करते हुए, आवेदन में समझौता निष्कर्ष निकाला जा सकता है। उदाहरण के लिए, यदि सच्चा संबंध यह है कि तेजी से गिरता है, तो भर में सपाट हो जाता है, तो इस की रैखिक व्याख्या है कि सभी मूल्यों पर कुछ औसत राशि से गिरता है , जबकि सच्चा संबंध यह है कि अधिक तेजी से गिरता है एक बहुत संकरा रेंज के , और के शेष सीमा पर और अधिक या कम अप्रभावित है। रैखिक व्याख्या नैदानिक ​​उपचार प्रभावों के लिए, या नीतिगत व्यय प्रभावों के लिए खराब होगी। X Y X Y X XYXYXYXX
एलेक्सिस

इसके अलावा: रेखीय प्रतिगमन महत्वपूर्ण नहीं है या नहीं, बल्कि उदाहरण के लिए, , , परीक्षण महत्वपूर्ण हैं या नहीं , महत्वपूर्ण हो सकता है या नहीं, स्वतंत्रता के कुछ डिग्री के साथ। एच 0 : β एक्स = एच 0 : एफ = एच 0 : आर 2 = H0:β0=cH0:βx=cH0:F=cH0:R2=c
एलेक्सिस

धीमी प्रतिक्रिया के लिए प्रतिक्रियाओं और माफी के लिए धन्यवाद - मैं प्रौद्योगिकी से दूर रहा हूं! मैंने उन रजिस्टरों के लिए स्कैटरग्राफ को शामिल करने के लिए पोस्ट को संपादित किया है जो महत्वपूर्ण थे। आगे बढ़ने के लिए कोई सलाह बहुत सराहना की जाएगी।
13

जवाबों:


18

रैखिक मॉडल के रूप में मॉडलिंग करते समय मोनोटोनिक नॉनलाइनियर संबंध लगभग हमेशा महत्वपूर्ण दिखाई देंगे। अगर रिश्ता नॉनलाइन है और मोनोटोनिक नहीं है तो यह सैंपल पर निर्भर करता है।

मोनोटोनिक रिश्तों के उदाहरण लघुगणक और विषम शक्तियां जैसे । गैर मोनोटोनिक रिश्तों का उदाहरण यहां तक ​​कि शक्तियां हैं और त्रिकोणमितीय कार्य जैसे ।y = x 3 y = x 2 y = sin xy=lnxy=x3y=x2y=sinx

उदाहरण के लिए, यदि आपका नमूना लिए है , तो मॉडल के रूप में रूप में महत्वपूर्ण होगा, प्लॉट देखें:y = पाप एक्स y ~ xx[1,1]y=sinxyx

यहाँ छवि विवरण दर्ज करें

हालांकि, यदि आपका नमूना , तो रैखिक मॉडलिंग बिल्कुल काम नहीं करेगा: x[0,π]यहाँ छवि विवरण दर्ज करें


13
+1। लेकिन कृपया ध्यान दें कि सही शब्द "मोनोटोनिक" है। "नीरस" का अर्थ दोहराव के माध्यम से सुस्त और थकाऊ है।
whuber

22
@whuber, ने मेरे उत्तर को संपादित किया, लेकिन किसी को इस बात से सहमत होना चाहिए कि bunant और हर्षित की तुलना में सुस्त और थकाऊ हैपाप xlnxsinx
Aksakal

+1 मैं यह भी बताने का सुझाव दूंगा कि मोनोटोनिक का अर्थ क्या है।
मार्क व्हाइट

थैंक्यू, मैंने स्कैप्लेट्स को शामिल करने के लिए पोस्ट को अपडेट किया है। आगे बढ़ने के लिए कोई सलाह बहुत सराहना की जाएगी।
13

मुझे पता नहीं है कि वहाँ प्रति पंक्ति रैखिकता के लिए एक परीक्षण है। आप नॉनलाइन रिग्रेशन शब्द जोड़ सकते हैं और उनके महत्व का परीक्षण कर सकते हैं, उदाहरण के लिए । (xx¯)2
अक्कल

3

हां, अक्सकल सही है और एक रेखीय प्रतिगमन महत्वपूर्ण हो सकता है अगर सही संबंध गैर-रेखीय है। एक रेखीय प्रतिगमन आपके डेटा के माध्यम से सबसे अच्छी तरह से फिट होने की एक लाइन पाता है और बस परीक्षण करता है कि क्या ढलान 0 से काफी अलग है।

गैर-रैखिकता के लिए एक सांख्यिकीय परीक्षण खोजने की कोशिश करने से पहले, मैं सुझाव देना चाहूंगा कि आप पहले क्या मॉडल बनाना चाहते हैं। क्या आप अपने दो चर के बीच एक रैखिक (गैर-रैखिक) संबंध की उम्मीद कर रहे हैं? आप वास्तव में क्या उजागर करने की कोशिश कर रहे हैं? अगर यह समझ में आता है कि कार की गति और ब्रेकिंग दूरी के बीच उदाहरण के लिए एक गैर-रैखिक संबंध है, तो आप अपने स्वतंत्र चर के चुकता शब्द (या अन्य परिवर्तन) जोड़ सकते हैं।

साथ ही, आपके डेटा (स्कैल्पलॉट) का एक दृश्य निरीक्षण एक बहुत शक्तिशाली तरीका है और आपके विश्लेषण में एक आवश्यक पहला कदम है।


YX

इसके अलावा: सीवी, पावेल में आपका स्वागत है!
एलेक्सिस

2
@ अलेक्सिस यू आर राइट। लेकिन एक द्विघात शब्द जोड़ना अभी भी कुछ ग्रंथों में अशुभता की जांच करने के लिए एक त्वरित और गंदे तरीके के रूप में देखा जाता है (कोई भी यह नहीं सुझाव दे रहा है कि यह केवल और न ही गैर-मॉडल बनाने का पहला तरीका है), इसलिए मैं हूँ उस मार्ग के बारे में बहुत चिंतित नहीं हैं।
whuber

+1 @ शुभंकर, मैंने कई शोधकर्ताओं, छात्रों और फैकल्टी को एक स्कैटर प्लॉट को "नॉनलाइनरिटी के लिए परीक्षण कैसे करें" के रूप में पहली जांच के रूप में एक द्विघात शब्द जोड़ने का अभ्यास करने का सामना किया है, एक नकारात्मक परिणाम के साथ व्याख्या की जा रही है क्योंकि रैखिक पर्याप्त है। "। (द्विघात नियम वास्तव में उपयोगी हो सकते हैं, और मैंने उन्हें अपने शोध में इस्तेमाल किया है। :) मुझे लगता है कि "त्वरित और गंदे" पर मेरा दृष्टिकोण यह है कि जो सामान आसान पढ़ाया जाता है, वह शोधकर्ताओं के भारी बहुमत के लिए कठिन हो जाता है । .. मुझे लगता है कि गैरपारंपरिक प्रतिगमन रैखिक के रूप में "आसान" और अन्वेषण के लिए एक बेहतर उपकरण है।
एलेक्सिस

@Alexis धन्यवाद। मुझे लगता है कि आपने मुझे गलत समझा है। मैं गैर-रैखिकता के परीक्षण के लिए चुकता शब्द जोड़ने की सिफारिश नहीं कर रहा था, लेकिन निश्चित रूप से चुकता शर्तों (या अन्य परिवर्तनों के लिए मामले बनाए जा सकते हैं। आर्थिक डेटा अक्सर लॉग-रूपांतरित होते हैं)। मुझे लगता है कि खोजपूर्ण और व्याख्यात्मक विश्लेषण के बीच अंतर करने की आवश्यकता है। यदि एक चुकता रिश्ते को मानने के लिए पर्याप्त आधार हैं तो इस परीक्षण की आवश्यकता है। आप जो प्रस्ताव कर रहे हैं वह एक अधिक खोजपूर्ण दृष्टिकोण है।
पावेल

-2

मैं हर बात से सहमत हूं कि अक्सकला कहती है। लेकिन पहले सवाल के रूप में मुझे लगता है कि जवाब सहसंबंध है। सहसंबंध उस सीमा को मापता है जिससे डेटा सेट x और y के बीच एक रैखिक संबंध होता है।


2
y=lnx

@ गुंग हां मैं करता हूं। आप उनके किस कथन को गलत मानते हैं? मुझे यह सुझाव देने की अनुमति दें कि मैं समझता हूं कि रैखिक और गैर-रेखीय शब्द का क्या अर्थ है और, जैसा कि अक्षल के उत्तर में है, एक सटीक और गैर-रैखिक संबंध वाले चर के उदाहरणों को खोजना वास्तव में आसान है। बहरहाल, सहसंबंध रैखिक संबंध का एक उपाय है और +/- 1 के सहसंबंध का अर्थ है कि संबंध वास्तव में रैखिक है। किसी भी सहसंबंध से कम का मतलब है कि संबंध (बिल्कुल नहीं) रैखिक है, लेकिन यह काफी करीब हो सकता है।
meh

1
ओपी ने "एक रेखीय प्रतिगमन का प्रदर्शन किया जो एक महत्वपूर्ण परिणाम के साथ सामने आया", लेकिन स्कैल्पलॉट ने निहित किया कि संबंध रैखिक नहीं था। एक सहसंबंध भी महत्वपूर्ण होगा, वास्तव में, यदि प्रतिगमन में केवल 1 एक्स-चर था, प्रतिगमन और सहसंबंध से पी-मूल्य समान होगा। लेकिन अगर महत्वपूर्ण प्रतिगमन के बावजूद संबंध रैखिक नहीं था, तो यह महत्वपूर्ण सहसंबंध के बावजूद रैखिक नहीं होगा। इस प्रकार, एक महत्वपूर्ण सहसंबंध इस बात का सबूत नहीं है कि संबंध रैखिक है।
गंग - मोनिका

1
r=1r=1r1

1
यह अत्यधिक सूक्ष्म या यहां तक ​​कि नाइटपैकिंग लग सकता है, लेकिन (ए) मैं मानता हूं कि सहसंबंध एक द्विभाजित संबंध की रैखिकता को मापने का एक तरीका है - यह एक गणितीय प्रमेय है, सब के बाद - लेकिन (बी) एक सामान्य प्रस्ताव के रूप में, मुझे संदेह है कि यह अशुद्धि का आकलन करने के लिए एक बहुत ही कच्चे रास्ते से अधिक के रूप में माना जा सकता है गैर-पूर्णता के साक्ष्य उच्च पूर्ण नमूना सहसंबंध के साथ एक डाटासेट में हड़ताली हो सकते हैं और छोटे निरपेक्ष सहसंबंध के साथ एक डेटासेट में पूरी तरह से अनुपस्थित हो सकते हैं। (सीसी @gung)
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.