नॉनलाइन रिग्रेशन के लिए आत्मविश्वास और भविष्यवाणी अंतराल का आकार


13

क्या गैर-रेखीय प्रतिगमन के आसपास विश्वास और भविष्यवाणी बैंड प्रतिगमन रेखा के आसपास सममित माना जाता है? मतलब वे घंटे-कांच के आकार पर नहीं लेते हैं जैसा कि रैखिक प्रतिगमन के लिए बैंड के मामले में होता है। ऐसा क्यों है?

यहाँ प्रश्न में मॉडल है:
यहाँ आंकड़ा है:

F(x)=(AD1+(xC)B)+D

http://i57.tinypic.com/2q099ok.jpg

और यहाँ समीकरण है:

यहाँ छवि विवरण दर्ज करें


आपका प्रश्न स्पष्ट नहीं है, क्योंकि आप 1 वाक्य में "सममित होने वाले हैं" यह पूछने से शिफ्ट करते हैं, यह अर्थ करने के लिए कि वे वाक्य 2 में नहीं हैं और पूछ रहे हैं (संभवत:) वे वाक्य में क्यों नहीं हैं 3. क्या आप बना सकते हैं यह अधिक सुसंगत / स्पष्ट है?
गूँज - मोनिका

ठीक है, मुझे इसे इस तरह से पूछना चाहिए - प्रतिगमन रेखा के आसपास आत्मविश्वास और भविष्यवाणी बैंड सममित क्यों होते हैं जब प्रतिगमन गैर-रैखिक होता है लेकिन रैखिक होने पर एक घंटे के गिलास के आकार पर ले जाता है?
सर्ज

00

तुम सही हो। बैंड नकारात्मक क्षेत्र में पार करता है। हालाँकि, मुझे स्वयं बैंड के मूल्यों में कोई दिलचस्पी नहीं है, बल्कि बैंड सीमा के अनुरूप EC50 मूल्यों में है। क्या इस तरह से बैंड के निर्माण का कोई विकल्प है?
सर्ज

हां, लेकिन जैसा कि मैंने बताया कि वे जटिल हो सकते हैं। सामान्यीकृत कम से कम वर्ग और समय श्रृंखला विधियाँ सीरियल सहसंबंध के साथ सामना कर सकती हैं। नॉन-एडिटिव एरर को हैंडल करने के लिए डिपेंडेंट वेरिएबल का नॉनलाइनियर ट्रांसफॉर्मेशन एक टूल है। एक अधिक परिष्कृत उपकरण एक सामान्यीकृत रैखिक मॉडल है। विकल्प आंशिक रूप से आश्रित चर की प्रकृति पर निर्भर करते हैं। BTW, हालाँकि मैं अनिश्चित हूँ कि आप "EC50 मूल्यों" से क्या मतलब है (ऐसा लगता है कि आप खुराक-प्रतिक्रिया रिश्तों को मॉडलिंग कर रहे हैं), सचित्र बैंड से गणना की गई कुछ भी संदिग्ध होगा।
whuber

जवाबों:


8

आत्मविश्वास और भविष्यवाणी बैंड को आम तौर पर सिरों के पास व्यापक होने की उम्मीद की जानी चाहिए - और उसी कारण से कि वे हमेशा साधारण प्रतिगमन में ऐसा करते हैं; आम तौर पर पैरामीटर अनिश्चितता मध्य की तुलना में सिरों के पास व्यापक अंतराल की ओर ले जाती है

आप सिमुलेशन द्वारा इसे आसानी से देख सकते हैं, या तो किसी दिए गए मॉडल से डेटा का अनुकरण करके, या पैरामीटर वेक्टर के नमूना वितरण से अनुकरण करके।

ग़ैर-रेखीय प्रतिगमन के लिए की जाने वाली सामान्य (लगभग सही) गणना में एक स्थानीय रैखिक सन्निकटन शामिल होता है (यह हार्वे के उत्तर में दिया गया है), लेकिन उन लोगों के बिना भी जो कुछ चल रहा है, उसकी कुछ धारणा हमें मिल सकती है।

हालाँकि, वास्तविक गणना करना असंसदीय है और यह हो सकता है कि कार्यक्रम गणना में एक शॉर्टकट ले सकते हैं जो उस प्रभाव को अनदेखा करता है। यह भी संभव है कि कुछ आंकड़ों और कुछ मॉडलों के लिए प्रभाव अपेक्षाकृत छोटा और देखने में कठिन हो। वास्तव में भविष्यवाणी अंतराल के साथ, विशेष रूप से बड़े विचरण के साथ, लेकिन बहुत सारे डेटा के साथ यह कभी-कभी साधारण रैखिक प्रतिगमन में वक्र को देखने के लिए कठिन हो सकता है - वे लगभग सीधे देख सकते हैं, और यह सीधेपन से विचलन को अपेक्षाकृत आसान है।

यहां इस बात का उदाहरण दिया गया है कि केवल माध्य के लिए एक आत्मविश्वास अंतराल के साथ इसे देखना कितना कठिन हो सकता है (भविष्यवाणी अंतराल को देखने के लिए बहुत कठिन हो सकता है क्योंकि उनके सापेक्ष भिन्नता बहुत कम है)। यहां कुछ डेटा और एक नॉनलाइनियर कम से कम वर्ग फिट हैं, जनसंख्या के लिए एक आत्मविश्वास अंतराल के साथ (इस मामले में नमूना वितरण से उत्पन्न होने के बाद से मैं सही मॉडल जानता हूं, लेकिन कुछ ऐसा ही एसिम्प्टोटिक सन्निकटन या बूटस्ट्रैपिंग द्वारा किया जा सकता है):

यहाँ छवि विवरण दर्ज करें

बैंगनी सीमाएं नीले भविष्यवाणियों के लगभग समान दिखती हैं ... लेकिन वे नहीं हैं। यहाँ उन अनुमानित भविष्यवाणियों के नमूना वितरण की मानक त्रुटि है:

यहाँ छवि विवरण दर्ज करें

जो स्पष्ट रूप से स्थिर नहीं है।


संपादित करें:

उन "स्प" भावों को, जिन्हें आपने पोस्ट किया था, रैखिक रिग्रेशन के लिए भविष्यवाणी अंतराल से सीधे आते हैं !


क्या आप यह भी कह रहे हैं कि केंद्र से दूर जाने पर पैरामीटर अनिश्चितता में वृद्धि के कारण बैंड को नॉनलाइन रिग्रेशन के मामले में भी सिरों पर चौड़ा होना चाहिए, लेकिन क्या यह उतना स्पष्ट नहीं है? या क्या कोई सैद्धांतिक कारण है कि यह चौड़ीकरण नॉनलाइनर रिग्रेशन के मामले में नहीं होता है? मेरे बैंड निश्चित रूप से बहुत सममित दिखते हैं।
सर्ग

1
उस चौड़ीकरण के लिए विशिष्ट होना चाहिए, लेकिन यह हर nonlinear मॉडल के साथ उसी तरह नहीं होगा और हर मॉडल के साथ स्पष्ट नहीं होगा, और क्योंकि यह करना उतना आसान नहीं है कि किसी दिए गए प्रोग्राम द्वारा उस तरीके की गणना नहीं की जा सकती है । मुझे नहीं पता कि आप जिस बैंड को देख रहे हैं, उसकी गणना कैसे की गई है - मैं माइंड रीडर नहीं हूं, और मैं उस प्रोग्राम का कोड नहीं देख सकता, जिसका आपने नाम भी नहीं बताया है।
Glen_b -Reinstate मोनिका

@ user1505202, यह पूरी तरह से जवाब देने के लिए एक कठिन सवाल बना हुआ है। क्या आप बता सकते हैं कि आपका मॉडल क्या है (इसका कार्यात्मक रूप)? क्या आप उस चित्र की छवि संलग्न कर सकते हैं जो आपके लिए चिंताजनक है?
गूँज - मोनिका

1
धन्यवाद। मेरे पास संख्याएँ हैं और वे अनिवार्य रूप से स्थिर हैं - प्रतिगमन रेखा और प्रत्येक भविष्यवाणी सीमा के बीच का अंतर 18.21074 के मध्य से लेकर अंत में 18.24877 तक है। तो, थोड़ा चौड़ा, लेकिन बहुत मामूली। वैसे, @ गुंग, मुझे समीकरण मिला जो भविष्यवाणी अंतराल की गणना करता है। यह है:Y-hat +/- sp(Y-hat)
सर्ज

1
यह उस प्रकार की भिन्नता के बारे में है जिसे आप लार्जिश नमूनों के साथ एक भविष्यवाणी अंतराल के साथ देख सकते हैं। सपा क्या है?
Glen_b -Reinstate मोनिका

5

गैर-रेखीय प्रतिगमन द्वारा फिट होने वाले घटता-घटता आत्मविश्वास और भविष्यवाणी बैंड के गणित को इस क्रॉस-मान्य पृष्ठ में समझाया गया है यह दर्शाता है कि बैंड हमेशा / आमतौर पर सममित नहीं होते हैं।

और यहाँ अधिक शब्दों और कम गणित के साथ एक स्पष्टीकरण दिया गया है:

सबसे पहले, चलो G | x को परिभाषित करते हैं, जो एक्स के एक विशेष मूल्य पर मापदंडों का ग्रेडिएंट है और मापदंडों के सभी सर्वोत्तम-फिट मानों का उपयोग करता है। परिणाम एक वेक्टर है, जिसमें प्रति पैरामीटर एक तत्व है। प्रत्येक पैरामीटर के लिए, इसे डीवाई / डीपी के रूप में परिभाषित किया जाता है, जहां वाई एक्स के सभी विशेष मूल्य और सभी सर्वश्रेष्ठ-फिट पैरामीटर मानों को दिए गए वक्र का वाई मान है, और पी मापदंडों में से एक है।)

G '| x वह ग्रेडिएंट वेक्टर है जिसे ट्रांसपोज़ किया जाता है, इसलिए यह मानों की एक पंक्ति के बजाय एक कॉलम है। कोव कोविरियस मैट्रिक्स (पिछले पुनरावृत्ति से उलटा हेसियन) है। यह एक वर्ग मैट्रिक्स है जिसमें मापदंडों की संख्या के बराबर पंक्तियों और स्तंभों की संख्या होती है। मैट्रिक्स में प्रत्येक आइटम दो मापदंडों के बीच सहसंयोजक है। हम Cov का उपयोग सामान्यीकृत सहसंयोजक मैट्रिक्स का उल्लेख करने के लिए करते हैं , जहां प्रत्येक मान -1 और 1 के बीच होता है।

अब गणना करें

c = G '| x * Cov * G | x।

परिणाम एक्स के किसी भी मूल्य के लिए एक एकल संख्या है।

आत्मविश्वास और भविष्यवाणी बैंड सर्वश्रेष्ठ फिट वक्र पर केंद्रित होते हैं, और वक्र के ऊपर और नीचे एक समान राशि का विस्तार करते हैं।

विश्वास बैंड वक्र द्वारा ऊपर और नीचे का विस्तार करते हैं:

= sqrt (c) * sqrt (SS / DF) * क्रिटिकल (विश्वास%, DF)

भविष्यवाणी बैंड, वक्र के ऊपर और नीचे एक और दूरी का विस्तार करते हैं:

= sqrt (c + 1) * sqrt (SS / DF) * क्रिटिकल (विश्वास%, DF)

इन दोनों समीकरणों में, c (ऊपर परिभाषित) का मान X के मान पर निर्भर करता है, इसलिए आत्मविश्वास और भविष्यवाणी बैंड वक्र से एक निरंतर दूरी नहीं हैं। एसएस का मूल्य फिट के लिए योग का वर्ग है, और डीएफ स्वतंत्रता की डिग्री की संख्या (डेटा बिंदुओं की संख्या शून्य से मापदंडों की संख्या) है। क्रिटिकल आप चाहते हैं कि विश्वास स्तर (परंपरागत रूप से 95%) और स्वतंत्रता की डिग्री की संख्या के आधार पर टी वितरण से एक स्थिर है। 95% की सीमा और काफी बड़े df के लिए, यह मान 1.96 के करीब है। यदि DF छोटा है, तो यह मान अधिक है।


धन्यवाद, हार्वे। मैं अपने कार्य के लिए मापदंडों का ढाल प्राप्त करने पर काम कर रहा हूं। क्या आप किसी भी काम किए गए उदाहरण के बारे में जानते हैं, क्योंकि मैं इस बात पर स्पष्ट नहीं हूं कि सहसंयोजक मैट्रिक्स कैसे प्राप्त किया जाता है।
सर्ज

यदि आप ग्राफपैड प्रिज्म डेमो का उपयोग करते हैं, तो आप अपने इच्छित किसी भी मॉडल में डेटा फिट कर सकते हैं, और सहसंयोजक मैट्रिक्स (डायग्नोस्टिक्स टैब में चुना गया एक वैकल्पिक परिणाम) और आत्मविश्वास या भविष्यवाणी बैंड (दोनों संख्याओं और एक ग्राफ के रूप में; डायग्नोस्टिक्स टैब)। यह एक उदाहरण के रूप में काफी अच्छा नहीं है, लेकिन कम से कम आप सहसंयोजक मैट्रिक्स की तुलना कर सकते हैं और देख सकते हैं कि समस्या पहले है या बाद में ...
हार्वे मोटुलस्की

हालांकि दो बातें। 1. प्रिज्म ने मुझे Cov मैट्रिक्स दिया। हालाँकि, यह संपूर्ण डेटासेट के लिए केवल एक नंबर है। क्या मुझे प्रति X मान एक मूल्य नहीं चाहिए? 2. मुझे ग्राफ में प्रिडिक्शन बैंड मिलता है, लेकिन मैं चाहूंगा कि इसमें आउटपुट वैल्यूज हों। प्रिज्म ऐसा करने के लिए प्रकट नहीं होता है। मैं प्रिज्म के लिए बहुत नया हूं और इसलिए मैंने हर जगह नहीं देखा होगा, लेकिन मैंने कोशिश की!
सर्ज

1. सहसंयोजक मैट्रिक्स उस डिग्री को दर्शाता है जिसमें मापदंडों को परस्पर जोड़ा जाता है। तो हर जोड़ी के मापदंडों के लिए एक मूल्य है कि आप नॉनलाइन रिग्रेशन को फिट करने के लिए कहें। 2. प्रिज्म या भविष्यवाणी बैंड के लिए प्लस / माइनस मान के साथ प्रिज्म को वक्र के XY निर्देशांक की एक तालिका बनाने के लिए कहने के लिए रेंज टैब पर देखें। 3. प्रिज्म के साथ तकनीकी सहायता के लिए, ईमेल support@graphpad.com सांख्यिकीय सवालों के लिए इस मंच का उपयोग करें, न कि तकनीकी सहायता के लिए।
हार्वे मोटुलस्की
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.