एक रेखीय प्रतिगमन मॉडल या गैर-रेखीय प्रतिगमन मॉडल के बीच निर्णय लेना


10

एक रैखिक प्रतिगमन मॉडल या गैर-रेखीय प्रतिगमन मॉडल का उपयोग करने के बीच किसी को कैसे तय करना चाहिए?

मेरा लक्ष्य वाई की भविष्यवाणी करना है।

साधारण और y डेटासेट के मामले में, मैं आसानी से तय कर सकता हूं कि स्कैटर प्लॉट की साजिश रचने के लिए कौन से प्रतिगमन मॉडल का उपयोग किया जाना चाहिए।xy

जैसे बहु-संस्करण के मामले में और y । मैं कैसे तय कर सकता हूं कि किस प्रतिगमन मॉडल का उपयोग किया जाना है? यही है, मैं कैसे सरल रैखिक मॉडल या गैर रेखीय मॉडल जैसे क्वाड्रिक, क्यूबिक आदि के साथ जाने के बारे में निर्णय लूंगा।x1,x2,...xny

क्या कोई तकनीक या सांख्यिकीय दृष्टिकोण या चित्रमय भूखंडों का पता लगाने और तय करने के लिए कि किस प्रतिगमन मॉडल का उपयोग किया जाना है?


"नॉन-लीनियर मॉडल" एक बहुत व्यापक श्रेणी है। क्या आपके मन में एक था? आपके विश्लेषण लक्ष्य क्या हैं?
छायाकार

यह आपके लक्ष्यों पर निर्भर करता है। क्या आप एक भविष्यवाणी / पूर्वानुमान मॉडल का निर्माण कर रहे हैं?
अक्कल

भविष्यवाणी ही मेरा लक्ष्य है।
शकीथयद

1
यदि आप "डेटा को प्लॉट" दृष्टिकोण की तरह कुछ के बाद कर रहे हैं, लेकिन कई भविष्यवक्ताओं के लिए, इसमें परिवर्ती प्लॉट जोड़े गए हैं जो कुछ मूल्य के हो सकते हैं। लेकिन अगर आपका लक्ष्य भविष्यवाणी है, तो समस्या यह है कि आप डेटा को देखने के आधार पर क्या चुन रहे हैं, इसलिए यह आपके द्वारा अन्य डेटा की तुलना में डेटा पर बेहतर दिखाई देगा (और कई अन्य मुद्दे हैं जो इस तरह के साथ आते हैं) मॉडल चयन के लिए दृष्टिकोण) - नमूना भविष्य कहनेवाला क्षमता का सही मूल्यांकन करने के लिए आपको एक होल्ड नमूना पर चीजों का आकलन करने की आवश्यकता है / क्रॉस सत्यापन जैसी किसी चीज पर विचार करें।
Glen_b -Reinstate मोनिका

1
आपको उपयोगी संबंधित चर्चा मिल सकती है जो मैंने कुछ समय पहले शुरू की है।
B

जवाबों:


10

यह आंकड़ों का एक क्षेत्र है जिसे मॉडल चयन कहा जाता है। इस क्षेत्र में बहुत सारे शोध किए गए हैं और इसका कोई निश्चित और आसान जवाब नहीं है।

X1,X2X3X32X1,X2X3X1,X2,X3X32(जटिल मॉडल)। मॉडल निर्माण में आपके पास (कम से कम) निम्नलिखित दो मुख्य लक्ष्यों में से एक है:

  1. X1YX2,...Xp
  2. YY

यदि आपका लक्ष्य नंबर 1 है, तो मैं लिकेलिहुड रेशियो टेस्ट (LRT) की सलाह देता हूं। LRT का उपयोग तब किया जाता है जब आपके पास नेस्टेड मॉडल होते हैं और आप जानना चाहते हैं कि "क्या डेटा पारम्परिक मॉडल की तुलना में जटिल मॉडल से आने की अधिक संभावना है?"। यह आपको अंतर्दृष्टि देगा कि कौन सा मॉडल आपके डेटा के बीच संबंध को बेहतर ढंग से समझाता है।

k


कृपया, क्या आप लक्ष्यों (1) और (2) के बीच अंतर को स्पष्ट कर सकते हैं? वर्तमान में बहुत अंतर नहीं है।
tnnphns

@ttnphns मैंने दो लक्ष्यों का एक संक्षिप्त विवरण जोड़ा।
TrynnaDoStat 16

@TrynnaDoStat यहाँ बयान द्वारा भ्रमित किया गया है उस मॉडल को चुनें जो सबसे अच्छा काम कर रही है। सर्वश्रेष्ठ मॉडल से आप रैखिक (पार्सिमोनियस) मॉडल और जटिल मॉडल के बीच चयन करने का मतलब .... सही? क्योंकि मुझे पता है कि k- गुना है, अनदेखी डेटा पर मॉडल के प्रदर्शन की जांच करने के लिए छुट्टी-एक-आउट सीवी का उपयोग किया जाता है। उनका उपयोग मॉडल चयन के लिए नहीं किया जाता है। मैं यहाँ उलझन में हूँ।
4

1

जब मैं "रिग्रेशन के लिए लिनियर या नॉन-लीनियर मॉडल" के लिए Google करता हूं, तो मुझे कुछ लिंक मिलते हैं, जो इस किताब को आगे बढ़ाते हैं: http://www.graphpad.com/manuals/prism4/RegressionBook.pdf यह पुस्तक दिलचस्प नहीं है, और मैं डॉन '100% (कुछ कारणों से) पर भरोसा नहीं है।

मुझे यह लेख भी मिला: http://hunch.net/?p=524 शीर्षक के साथ: लगभग सभी प्राकृतिक समस्याओं में ग़ैरबराबरी की आवश्यकता होती है

मुझे बहुत अच्छी व्याख्या के साथ भी ऐसा ही सवाल मिला: /programming/1148513/difference-between-a-linear-problem-and-a-non-linear-problem-essence-of-dot-pro

मेरे अनुभव के आधार पर, जब आप नहीं जानते कि कौन सा मॉडल उपयोग करता है, दोनों का उपयोग करें और अन्य सुविधाओं का प्रयास करें।


0

जैसा कि आप कहते हैं, रैखिक मॉडल आमतौर पर गैर-रेखीय मॉडल की तुलना में सरल होते हैं, जिसका अर्थ है कि वे तेजी से चलते हैं (निर्माण और भविष्यवाणी), व्याख्या और व्याख्या करना आसान है, और आमतौर पर त्रुटि माप में सीधे-आगे। तो लक्ष्य यह पता लगाना है कि क्या रेखीय प्रतिगमन की धारणाएं आपके डेटा के साथ हैं (यदि आप रैखिक का समर्थन करने में विफल हैं, तो बस गैर-रैखिक के साथ जाएं)। आमतौर पर आप अपने एकल-चर भूखंड को सभी चर के साथ व्यक्तिगत रूप से दोहराते हैं, अन्य सभी चर स्थिर रखते हुए।

शायद अधिक महत्वपूर्ण बात है, हालांकि, आप जानना चाहते हैं कि क्या आप अपने डेटा को रैखिक स्थान पर स्थानांतरित करने के लिए किसी प्रकार का परिवर्तन, चर इंटरैक्शन या डमी चर लागू कर सकते हैं। यदि आप मान्यताओं को मान्य करने में सक्षम हैं, या यदि आप अपने डेटा को अच्छी तरह से अच्छी तरह से प्रेरित या अन्यथा समझदारी से परिवर्तनों या संशोधनों को लागू करने के लिए जानते हैं, तो आप उस परिवर्तन के साथ आगे बढ़ना चाहते हैं और रैखिक प्रतिगमन का उपयोग करना चाहते हैं। एक बार जब आपके पास अवशिष्ट होते हैं, तो आप उन्हें गैर-रेखीय तरीकों पर आगे बढ़ने की आवश्यकता होने पर आगे का निर्णय लेने के लिए बनाम अनुमानित मूल्यों या स्वतंत्र चर की साजिश कर सकते हैं।

ड्यूक में यहाँ रैखिक प्रतिगमन की मान्यताओं का एक उत्कृष्ट टूटना है । चार मुख्य मान्यताओं को सूचीबद्ध किया गया है, और प्रत्येक को मॉडल पर प्रभाव में कैसे तोड़ा जाता है, डेटा में इसका निदान कैसे किया जाता है, और अनुमान लगाने के लिए डेटा को "ठीक" (यानी बदलने या जोड़ने) के संभावित तरीके। यहाँ चार मान्यताओं को संक्षेप में शीर्ष से एक छोटा सा अंश दिया गया है, लेकिन आपको वहाँ जाना चाहिए और ब्रेकडाउन को पढ़ना चाहिए।

चार प्रमुख धारणाएं हैं जो अनुमान या भविष्यवाणी के प्रयोजनों के लिए रैखिक प्रतिगमन मॉडल के उपयोग को सही ठहराती हैं:

(i) निर्भर और स्वतंत्र चर के बीच संबंध की रैखिकता और परिवर्धन:

(ए) आश्रित चर का अपेक्षित मूल्य प्रत्येक स्वतंत्र चर का एक सीधा-रेखा कार्य है, जो अन्य को निर्धारित करता है।

(b) उस पंक्ति का ढलान अन्य चरों के मूल्यों पर निर्भर नहीं करता है।

(c) आश्रित चर के अपेक्षित मूल्य पर विभिन्न स्वतंत्र चर के प्रभाव योगात्मक होते हैं।

(ii) त्रुटियों की सांख्यिकीय स्वतंत्रता (विशेष रूप से, समय श्रृंखला डेटा के मामले में लगातार त्रुटियों के बीच कोई संबंध नहीं)

(iii) त्रुटियों की समरूपता (निरंतर विचरण)

(ए) बनाम समय (समय श्रृंखला डेटा के मामले में)

(b) भविष्यवाणियों के विरुद्ध

(c) किसी स्वतंत्र चर के विरुद्ध

(iv) त्रुटि वितरण की सामान्यता।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.