वक्र फिट करते समय, मैं अपने फिट किए गए मापदंडों के लिए 95% विश्वास अंतराल की गणना कैसे करूं?


12

मैं अपने डेटा को एक पैरामीटर निकालने के लिए कर्व कर रहा हूं। हालाँकि, मैं अनिश्चित हूं कि उस पैरामीटर की निश्चितता क्या है और मैं इसकी % विश्वास अंतराल की गणना / अभिव्यक्ति कैसे करूंगा ।95

डेटासेट वाले डेटा के लिए कहें जो तेजी से घटता है, मैं प्रत्येक डेटासेट के लिए एक वक्र फिट करता हूं। फिर मैं जो जानकारी निकालना चाहता हूं, वह है एक्सपोनेंट । मैं के मूल्यों पता और का मूल्य मैं में दिलचस्पी नहीं है (एक चर कि जनसंख्या से आता है, नहीं प्रक्रिया इम मॉडल की कोशिश कर रहा thats)।t abta

मैं इन मापदंडों को फिट करने के लिए गैर-रेखीय प्रतिगमन का उपयोग करता हूं। हालाँकि मुझे नहीं पता कि किसी भी तरीके के लिए % विश्वास अंतराल की गणना कैसे की जाती है , इसलिए व्यापक उत्तर भी स्वागत योग्य हैं।95

f=aebt
उदाहरण डेटा और फिट

एक बार मेरे पास लिए मेरा मूल्य है , मैं इसकी % आत्मविश्वास अंतराल की गणना कैसे करूं ? अग्रिम में धन्यवाद!95b95


आप डेटा कैसे फिट करते हैं? क्या आपके फ़ंक्शन को OLS फिट करने के लिए रूपांतरित किया गया है?
जॉनी

मैं जवाबों पर आपकी टिप्पणियों से देखता हूं कि आप वास्तव में कम से कम वर्ग कर रहे हैं। यदि आपने उस जानकारी के साथ शुरुआत की है तो आपके पास और भी अच्छे उत्तर होंगे। मैंने कम से कम एक प्रासंगिक टैग जोड़ा है।
Glen_b -Reinstate Monica

@Glen_b आह बीमार भविष्य में और अधिक पूर्ण हो और इसे प्रश्न में जोड़ दें। मैंने हालांकि इसके बारे में सोचा था। कुछ डेटासेट के साथ मैं पूर्ण L1 की दूरी का उपयोग करता हूं और अन्य समय मैं अभी भी रैखिक प्रतिगमन का उपयोग करता हूं। इसलिए मुझे व्यापक उत्तर मिलने की उम्मीद थी।
सिंह

यदि आप कम से कम वर्गों, L1 प्रतिगमन और नॉनलाइनियर कम से कम वर्गों के उत्तर चाहते हैं, तो इसके बारे में स्पष्ट होना सबसे अच्छा होगा।
Glen_b -Reinstate मोनिका

जवाबों:


10

रेखीय प्रतिगमन और फिर रेखीय प्रतिगमन का उपयोग करने के साथ समस्या यह है कि अवशिष्ट के गॉसियन वितरण की धारणा रूपांतरित डेटा के लिए सही होने की संभावना नहीं है।

यह आमतौर पर nonlinear प्रतिगमन का उपयोग करने के लिए बेहतर है। अधिकांश गैर-रेखीय प्रतिगमन कार्यक्रम मानक त्रुटि और सर्वोत्तम-फिट मापदंडों के आत्मविश्वास अंतराल की रिपोर्ट करते हैं। यदि आपका नहीं है, तो ये समीकरण मदद कर सकते हैं।

इस समीकरण का उपयोग करके प्रत्येक मानक त्रुटि की गणना की जाती है:

SE(Pi) = sqrt[ (SS/DF) * Cov(i,i) ]

  • Pi: i-th समायोज्य (गैर-स्थिर) पैरामीटर
  • एसएस: चुकता अवशिष्टों का योग
  • DF: स्वतंत्रता की डिग्री (प्रतिगमन द्वारा फिट किए गए मापदंडों की डेटा संख्या माइनस संख्या)
  • कोव (आई, आई): आई-वें विकर्ण तत्व कोविरियन मैट्रिक्स
  • sqrt (): वर्गमूल

और यहां सर्वोत्तम-फिट मान, इसकी मानक त्रुटि और स्वतंत्रता की डिग्री की संख्या से प्रत्येक पैरामीटर के लिए आत्मविश्वास अंतराल की गणना करने के लिए समीकरण है।

From [BestFit(Pi)- t(95%,DF)*SE(Pi)]  TO  [BestFit(Pi)+
 t(95%,DF)*SE(Pi)] 
  • BestFit (Pi) i-th पैरामीटर के लिए सबसे अच्छा मूल्य है
  • टी, डीएफ की निर्दिष्ट संख्या के लिए 95% विश्वास के लिए टी वितरण से मूल्य है।
  • डीएफ स्वतंत्रता की डिग्री है।

    95% आत्मविश्वास के लिए एक्सेल के साथ उदाहरण (इसलिए अल्फा = 0.05) और स्वतंत्रता की 23 डिग्री: = TINV (0.05,23) DF स्वतंत्रता की डिग्री के बराबर होती है (डेटा बिंदुओं की संख्या माइनस संख्या प्रतिगमन द्वारा फिट होती है)


यह बिल्कुल वही है जिसकी मुझे जरूरत थी, धन्यवाद! मैंने Matlab में lsqcurvefit का उपयोग किया , यह आत्मविश्वास अंतराल या मानक त्रुटि को आउटपुट नहीं करता है। यह लैग्रेंज गुणक (?), अवशिष्ट और अवशिष्ट के वर्ग 2-मानक देता है। अब उस और आपके उत्तर से मुझे गणना की जा सकती है कि मुझे क्या चाहिए!
लियो

3

यदि आपके डेटा के लिए एक उपयुक्त मॉडल पर विश्वास है:

f=aebt

तब आप अपने प्रतिक्रिया डेटा को लॉग रूपांतरित कर सकते हैं जैसे कि एक उपयुक्त मॉडल है:

f=abt

साथ और । रूपांतरित डेटा को सरल रेखीय प्रतिगमन और अवरोधन और ढलान के लिए एक अनुमान के साथ-साथ प्राप्त की गई मानक त्रुटियों के साथ फिट किया जा सकता है। यदि महत्वपूर्ण टी मान और मानक त्रुटि पैरामीटर अनुमान पर लागू होती है, तो उस पैरामीटर अनुमान के लिए एक विश्वास अंतराल का गठन किया जा सकता है। आर में:एक ' = एल एन ( एक )f=ln(f)a=ln(a)

# Rough simulated data set.
set.seed(1)
a <- 50; b <- 0.2; n <- 25
x <- 1:n
y <- a*(exp(-b * x))
y <- y + rnorm(n, sd=0.25)
y <- ifelse(y>0, y, 0.1)
plot(x,y)

# Linearise:
y2 <- log(y)
plot(x,y2)

# Fit model to transformed data
model <- lm(y2 ~ x)
summary(model)
confint(model)

# Or:
param <- summary(model)$coefficients[, 1]; se <- summary(model)$coefficients[, 2]
param + qt(0.975, 23) * se
param - qt(0.975, 23) * se

यदि आप भविष्यवाणी करने के लिए मॉडल का उपयोग कर रहे हैं, तो आपको यह सुनिश्चित करना चाहिए कि SLR की धारणाएं पूरी हो गई हैं - iid । N(0,σ2)


आह धन्यवाद! एक बहुत अच्छा और पूरा जवाब! यह मैं उपयोग कर सकता हूं यदि मैं एक रैखिक फिट करता हूं, जो मैं भी कभी-कभी करता हूं। मुझे आशा है कि आप बुरा नहीं मानेंगे कि मैं हार्विस का उत्तर स्वीकार करता हूं, क्योंकि इस मामले में मेरा सवाल लीनियर फिट के बारे में नहीं था। हालांकि अभी भी एक उपयोगी जवाब!
लियो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.