नॉनलाइनियर कम से कम वर्ग फिट के लिए प्रारंभिक मूल्यों का चयन कैसे करें


13

उपरोक्त प्रश्न यह सब कहता है। मूल रूप से मेरा सवाल एक सामान्य फिटिंग फ़ंक्शन (मनमाने ढंग से जटिल हो सकता है) के लिए है जो उन मापदंडों में गैर-स्पष्ट होगा जो मैं अनुमान लगाने की कोशिश कर रहा हूं, फिट को शुरू करने के लिए प्रारंभिक मूल्यों को कैसे चुनता है? मैं नॉनलाइनर कम से कम वर्ग में करने की कोशिश कर रहा हूं। क्या कोई रणनीति या तरीका है? क्या इसका अध्ययन किया गया है? कोई संदर्भ? तदर्थ अनुमान लगाने के अलावा कुछ भी? विशेष रूप से, अभी मैं जिन फिटिंग फॉर्मों के साथ काम कर रहा हूं, उनमें से एक गॉसियन प्लस रैखिक रूप है जिसमें पांच पैरामीटर हैं, जिनका मैं अनुमान लगाने की कोशिश कर रहा हूं, जैसे

y=Ae(xBC)2+Dx+E

जहाँ (abscissa data) और y = log 10 (निर्देशांक डेटा) का अर्थ है कि लॉग-लॉग स्थान में मेरा डेटा एक सीधी रेखा और एक bump की तरह दिखता है जिसे मैं Gaussian द्वारा अनुमानित कर रहा हूँ। मेरे पास कोई सिद्धांत नहीं है, मुझे इस बारे में मार्गदर्शन करने के बारे में कि बिना रेखा के ढलान की तरह शायद रेखांकन और नेत्रगोलक को छोड़कर कैसे फिट किया जाए और टक्कर का केंद्र / चौड़ाई क्या है। लेकिन मेरे पास इनमें से सौ से अधिक ऐसे हैं जो ग्राफिंग और अनुमान लगाने के बजाय ऐसा करते हैं, मैं कुछ दृष्टिकोणों को पसंद करूंगा जो स्वचालित हो सकते हैं।x=log10y=log10

मुझे लाइब्रेरी या ऑनलाइन में कोई संदर्भ नहीं मिल रहा है। केवल एक चीज जिसके बारे में मैं सोच सकता हूं, वह यह है कि केवल बेतरतीब ढंग से प्रारंभिक मूल्यों का चयन करें। MATLAB समान रूप से वितरित [0,1] से यादृच्छिक रूप से मूल्यों को चुनने की पेशकश करता है। इसलिए प्रत्येक डेटा सेट के साथ, मैं यादृच्छिक रूप से आरंभिक रूप से एक हजार बार फिट होता हूं और फिर उच्चतम साथ एक को चुनता हूं ? कोई अन्य (बेहतर) विचार?r2


परिशिष्ट # 1

सबसे पहले, यहां डेटा सेट के कुछ दृश्य प्रतिनिधित्व हैं जो आप लोगों को दिखाते हैं कि मैं किस तरह के डेटा के बारे में बात कर रहा हूं। मैं किसी भी प्रकार के परिवर्तन के बिना दोनों डेटा को उसके मूल रूप में पोस्ट कर रहा हूं और फिर लॉग-लॉग स्पेस में इसका दृश्य प्रतिनिधित्व करता हूं क्योंकि यह दूसरों को विकृत करते हुए डेटा की कुछ विशेषताओं को स्पष्ट करता है। मैं अच्छे और बुरे दोनों डेटा का एक नमूना पोस्ट कर रहा हूं।

अच्छा डेटा लॉग-लॉग अच्छा डेटा बुरा डेटा लॉग-लॉग खराब डेटा

प्रत्येक आकृति के छह पैनलों में से प्रत्येक में चार डेटा सेट दिखाए गए हैं जो एक साथ लाल, हरे, नीले और सियान से युक्त हैं और प्रत्येक डेटा सेट में ठीक 20% अंक हैं। मैं उनमें से प्रत्येक को एक सीधी रेखा के साथ फिट करने की कोशिश कर रहा हूं, क्योंकि डेटा में दिखाई देने वाले धक्कों के कारण एक गाऊसी है।

पहला आंकड़ा कुछ अच्छे आंकड़ों का है। दूसरा आंकड़ा आंकड़े से उसी अच्छे डेटा का लॉग-लॉग प्लॉट है। तीसरा आंकड़ा कुछ खराब आंकड़ों का है। चौथा आंकड़ा तीन का लॉग-लॉग प्लॉट है। बहुत अधिक डेटा है, ये सिर्फ दो सबसेट हैं। अधिकांश डेटा (लगभग 3/4) अच्छा है, मेरे द्वारा दिखाए गए अच्छे डेटा के समान।

अब कुछ टिप्पणियाँ, कृपया मेरे साथ सहन करें क्योंकि यह लंबा हो सकता है लेकिन मुझे लगता है कि यह सब विस्तार से आवश्यक है। मैं यथासंभव संक्षिप्त होने की कोशिश करूँगा।

मैंने मूल रूप से एक साधारण-शक्ति कानून (लॉग-इन स्पेस में सीधी रेखा का अर्थ) की अपेक्षा की थी। जब मैंने लॉग-लॉग स्पेस में सब कुछ प्लॉट किया, तो मैंने लगभग 4.8 मेगाहर्ट्ज पर अप्रत्याशित टक्कर देखी। टक्कर की पूरी तरह से जांच की गई थी और दूसरों के काम में भी खोजा गया था, इसलिए यह नहीं कि हमने गड़बड़ की। यह शारीरिक रूप से वहाँ है और अन्य प्रकाशित कार्यों में भी इसका उल्लेख है। तो फिर मैंने अभी अपने रैखिक रूप में एक गाऊसी शब्द जोड़ा है। ध्यान दें कि यह फिट लॉग-लॉग स्पेस में किया जाना था (इसलिए इस एक सहित मेरे दो प्रश्न)।

अब, पढ़ने के बाद मेरा एक और सवाल करने के लिए स्टम्पी जो पीट द्वारा जवाब (सब पर इन आंकड़ों से संबंधित नहीं) और पढ़ने इस और इस (Clauset द्वारा सामान) और संदर्भ उसमें, मुझे लगता है कि मैं लॉग-लॉग में फिट नहीं चाहिए अंतरिक्ष। इसलिए अब मैं पूर्व-परिवर्तित स्थान में सब कुछ करना चाहता हूं।

प्रश्न 1: अच्छे आंकड़ों को देखते हुए, मुझे अभी भी लगता है कि पहले से तब्दील अंतरिक्ष में एक रेखीय प्लस एक गाऊसी अभी भी एक अच्छा रूप है। मैं उन लोगों से सुनना पसंद करूंगा जिनके पास अधिक डेटा-एक्सपीरियंस है जो वे सोचते हैं। क्या गाऊसी + रैखिक उचित है? क्या मुझे केवल एक गाऊसी करना चाहिए? या एक पूरी तरह से अलग रूप?

प्रश्न 2: प्रश्न 1 का उत्तर जो भी हो, मुझे अभी भी (सबसे अधिक संभावना है) गैर-रैखिक कम से कम वर्ग फिट होंगे, इसलिए अभी भी आरंभीकरण के साथ मदद की आवश्यकता है।

डेटा जहां हम दो सेट देखते हैं, हम लगभग 4-5 मेगाहर्ट्ज पर पहले टक्कर को पकड़ना बहुत पसंद करते हैं। इसलिए मैं अधिक गाऊसी शर्तों को नहीं जोड़ना चाहता हूं और हमारे गाऊसी शब्द को पहली टक्कर पर केंद्रित किया जाना चाहिए जो लगभग हमेशा बड़ा टक्कर है। हम 0.8mHz और 5mHz के बीच "अधिक सटीकता" चाहते हैं। हम उच्च आवृत्तियों के लिए बहुत अधिक परवाह नहीं करते हैं, लेकिन उन्हें पूरी तरह से अनदेखा नहीं करना चाहते हैं। तो शायद किसी तरह का वजन? या बी हमेशा 4.8mHz के आसपास शुरू किया जा सकता है?

fL

L=Ae(fBC)2+Df+E.
  • f
  • L
  • AA>0A
  • B
  • CCC
  • D
  • ELELf=0

Ae(B/C)2+E.

EEf=0

L

प्रश्न 3: इस मामले में आप लोग क्या सोचते हैं? कोई पेशेवरों / विपक्ष? एक्सट्रपलेशन के लिए कोई अन्य विचार? फिर से हम केवल 0 और 1mHz के बीच की अतिरिक्त आवृत्तियों की कम आवृत्तियों की परवाह करते हैं ... कभी-कभी बहुत कम आवृत्तियों, शून्य के करीब। मुझे पता है यह पोस्ट पहले से ही पैक है। मैंने यह सवाल यहां इसलिए पूछा क्योंकि उत्तर संबंधित हो सकते हैं लेकिन अगर आप लोग पसंद करते हैं तो मैं इस प्रश्न को अलग कर सकता हूं और बाद में एक और पूछ सकता हूं।

अंत में, यहां अनुरोध पर दो नमूना डेटा सेट हैं।

0.813010000000000   0.091178000000000   0.012728000000000
1.626000000000000   0.103120000000000   0.019204000000000
2.439000000000000   0.114060000000000   0.063494000000000
3.252000000000000   0.123130000000000   0.071107000000000
4.065000000000000   0.128540000000000   0.073293000000000
4.878000000000000   0.137040000000000   0.074329000000000
5.691100000000000   0.124660000000000   0.071992000000000
6.504099999999999   0.104480000000000   0.071463000000000
7.317100000000000   0.088040000000000   0.070336000000000
8.130099999999999   0.080532000000000   0.036453000000000
8.943100000000001   0.070902000000000   0.024649000000000
9.756100000000000   0.061444000000000   0.024397000000000
10.569000000000001   0.056583000000000   0.025222000000000
11.382000000000000   0.052836000000000   0.024576000000000
12.194999999999999   0.048727000000000   0.026598000000000
13.008000000000001   0.045870000000000   0.029321000000000
13.821000000000000   0.041454000000000   0.067300000000000
14.633999999999999   0.039596000000000   0.081800000000000
15.447000000000001   0.038365000000000   0.076443000000000
16.260000000000002   0.036425000000000   0.075912000000000

पहला स्तंभ मेगाहर्ट्ज में आवृत्तियां हैं, जो हर एक डेटा सेट में समान हैं। दूसरा कॉलम एक अच्छा डेटा सेट (अच्छा डेटा आंकड़ा एक और दो, पैनल 5, लाल मार्कर) और तीसरा कॉलम एक खराब डेटा सेट (खराब डेटा आंकड़ा तीन और चार, पैनल 5, लाल मार्कर) है।

आशा है कि यह कुछ और प्रबुद्ध चर्चा को प्रोत्साहित करने के लिए पर्याप्त है। आप सभी को धन्यवाद।


अतिरिक्त जानकारी के लिए +1, लेकिन अब यह एक नया प्रश्न लगता है। संयोग से, यदि आप पिछले एक को हटाना चाहते हैं तो मुझे लगता है कि यह ठीक होगा, ऐसा लगता है कि आपने अब अपने पास मौजूद अतिरिक्त जानकारी को कवर कर लिया है।
Glen_b -Reinstate Monica

@Glen_b ऐसा क्यों है? यह एक नया प्रश्न क्यों दिखता है? पुराने प्रश्न के रूप में, हम सभी अंक के लिए वेश्या? - पुराने और पुराने दो में दो उत्थान हैं, किसी भी तरह से इसे मर्ज करने के लिए इसलिए मैं उन दो वोटों को भी रख सकता हूं?
फिक्स्ड प्वाइंट

शुरुआत के लिए अच्छी तरह से, अब आप पहले से ही क्या फिट करने के लिए निर्दिष्ट करने के बजाय, आपको क्या फिट होना चाहिए , इसके बारे में पूछ रहे हैं । कई अन्य अंतर हैं, जिनमें से कुछ को मैं काफी महत्वपूर्ण मानूंगा। मैं अपना उत्तर बदलते हुए देखूंगा, लेकिन मुझे लगता है कि यह एक मूल प्रश्न और उत्तर के रूप में खड़ा हो सकता है और आपके नए हिस्से जहाँ आप अन्य चीजें पूछ रहे हैं, वह एक नया हो सकता है। मैं वर्तमान के लिए अपने निर्णय पर छोड़ दूँगा।
Glen_b -Reinstate Monica

@ गलेन_ बी फेयर काफी, मैंने अतिरिक्त प्रश्नों को मारा। तो सवाल अभी भी है, मेरे पास कुछ डेटा हैं जो मैं रैखिक + गौसियन रूप का उपयोग करके फिट करना चाहता हूं, क्या मैं यादृच्छिक आरंभीकरण से बेहतर कर सकता हूं?
फिक्स्ड प्वाइंट

मुझे लगता है कि मेरे वर्तमान उत्तर से पता चलता है कि - कम से कम कुछ परिस्थितियों में - आप बेहतर कर सकते हैं, और @whuber मेरी प्रक्रिया के बारे में अभी भी कुछ सरल बताते हैं। मैं वापस जा सकता हूं और देख सकता हूं कि मैंने आपके डेटा पर कैसा प्रदर्शन किया है, लेकिन जैसा कि अब यह खड़ा है, यह कुछ विचार देता है कि ऐसे शुरुआती बिंदुओं को कैसे सेट किया जाए।
ग्लेन_ब -Reinstate Monica

जवाबों:


10

अगर कोई ऐसी रणनीति थी जो अच्छी और सामान्य दोनों थी - जो कि हमेशा काम करती थी - यह पहले से ही हर गैर-कम से कम वर्गों के कार्यक्रम में लागू की जाएगी और मूल्यों को शुरू करना एक गैर-मुद्दा होगा।

कई विशिष्ट समस्याओं या समस्याओं के परिवारों के लिए, मूल्यों को शुरू करने के लिए कुछ बहुत अच्छे दृष्टिकोण मौजूद हैं; कुछ पैकेज विशिष्ट nonlinear मॉडल के लिए या अधिक सामान्य दृष्टिकोणों के साथ अच्छी शुरुआत मूल्य गणना के साथ आते हैं जो अक्सर काम करते हैं, लेकिन अधिक विशिष्ट कार्यों या प्रारंभ मूल्यों के प्रत्यक्ष इनपुट के साथ मदद करनी पड़ सकती है।

कुछ स्थितियों में अंतरिक्ष की खोज करना आवश्यक है, लेकिन मुझे लगता है कि आपकी स्थिति ऐसी होने की संभावना है कि अधिक विशिष्ट रणनीतियों की संभावना सार्थक होगी - लेकिन एक अच्छा डिजाइन करने के लिए बहुत अधिक डोमेन ज्ञान की आवश्यकता होती है जो हमारे पास होने की संभावना नहीं है।

x

yx

A

कुछ सैंपल डेटा में मदद मिलेगी - यदि आप सक्षम हैं तो विशिष्ट मामले और कठिन।


संपादित करें: यहां एक उदाहरण है कि यदि समस्या बहुत शोर नहीं है, तो आप काफी अच्छी तरह से कैसे कर सकते हैं:

आपके मॉडल से उत्पन्न कुछ डेटा यहां दिए गए हैं (जनसंख्या मान A = 1.9947, B = 10, C = 2.828, D = 0.09, E = 5):

nls डेटा

वे मूल्य जो मैं अनुमान लगा पा रहा था वे हैं
(as = 1.658, Bs = 10.001, Cs = 3.053, Ds = 0.0881, Es = 5.026)

उस स्टार्ट मॉडल का फिट इस तरह दिखता है:

nlstart

कदम थे:

  1. D और E का मोटा अनुमान लगाने के लिए Theil रिग्रेशन को फिट करें
  2. Theil रिग्रेशन के फिट को घटाएं
  3. एक चिकनी वक्र फिट करने के लिए LOESS का उपयोग करें
  4. A का मोटा अनुमान पाने के लिए चोटी का पता लगाएं, और B का मोटा अनुमान लगाने के लिए चोटी के अनुरूप x-मान
  5. LOESS फ़िट्स को लें जिनके y-मान हैं> A के अनुमानों का 60% अवलोकनों के रूप में और एक द्विघात फिट करते हैं
  6. B के अनुमान को अद्यतन करने और C का अनुमान लगाने के लिए द्विघात का उपयोग करें
  7. मूल डेटा से, गाऊसी के अनुमान को घटाएं
  8. डी और ई के अनुमान को अद्यतन करने के लिए उस समायोजित डेटा के लिए एक और Theil प्रतिगमन को फिट करें

इस मामले में, मूल्य एक nonlinear फिट शुरू करने के लिए बहुत उपयुक्त हैं।

मैंने इसे Rकोड के रूप में लिखा था लेकिन MATLAB में भी ऐसा ही किया जा सकता था।

मुझे लगता है कि इससे बेहतर चीजें संभव हैं।

यदि डेटा बहुत शोर कर रहे हैं, यह अच्छी तरह से काम नहीं करेगा।


Edit2: यह वह कोड है जिसका उपयोग मैंने R में किया है, अगर किसी को दिलचस्पी है:

gausslin.start <- function(x,y) {

  theilreg <- function(x,y){
    yy <- outer(y, y, "-")
    xx <- outer(x, x, "-")
    z  <- yy / xx
    slope     <- median(z[lower.tri(z)])
    intercept <- median(y - slope * x)
    cbind(intercept=intercept,slope=slope)
  }

  tr <- theilreg(x,y1)
  abline(tr,col=4)
  Ds = tr[2]
  Es = tr[1]
  yf  <- y1-Ds*x-Es
  yfl <- loess(yf~x,span=.5)

  # assumes there are enough points that the maximum there is 'close enough' to 
  #  the true maximum

  yflf   <- yfl$fitted    
  locmax <- yflf==max(yflf)
  Bs     <- x[locmax]
  As     <- yflf[locmax]

  qs     <- yflf>.6*As
  ys     <- yfl$fitted[qs]
  xs     <- x[qs]-Bs
  lf     <- lm(ys~xs+I(xs^2))
  bets   <- lf$coefficients
  Bso    <- Bs
  Bs     <-  Bso-bets[2]/bets[3]/2
  Cs     <- sqrt(-1/bets[3])
  ystart <- As*exp(-((x-Bs)/Cs)^2)+Ds*x+Es

  y1a <- y1-As*exp(-((x-Bs)/Cs)^2)
  tr  <- theilreg(x,y1a)
  Ds  <- tr[2]
  Es  <- tr[1]
  res <- data.frame(As=As, Bs=Bs, Cs=Cs, Ds=Ds, Es=Es)
  res
}

# population parameters: A = 1.9947 , B = 10, C = 2.828, D = 0.09, E = 5
# generate some data
set.seed(seed=3424921)
x  <- runif(50,1,30)
y  <- dnorm(x,10,2)*10+rnorm(50,0,.2)
y1 <- y+5+x*.09 # This is the data
xo <- order(x)

starts <- gausslin.start(x,y1)
ystart <- with(starts, As*exp(-((x-Bs)/Cs)^2)+Ds*x+Es)
plot(x,y1)
lines(x[xo],ystart[xo],col=2)

3
+1। फिट को एक हजार बार दोहराते हुए और सबसे अच्छा चुनने (अगर मैं सही ढंग से समझता हूं) एक अजीब विचार लगता है: नॉनलिअर कम से कम वर्ग को यह बताना चाहिए कि क्या मॉडल डेटा के लिए उचित है और अच्छे प्रारंभिक मूल्य हैं। स्वाभाविक रूप से, दूसरा वह है जिसके बारे में आप पूछ रहे हैं। लेकिन इसका अर्थ यह लगता है कि प्रत्येक फिट के लिए अलग-अलग शुरुआती मूल्य चुनने की आवश्यकता हो सकती है।
निक कॉक्स

1
@NickCox यह सामने आई समस्याओं की श्रेणी में आता है - अगर मुझे पहले के पदों से सही याद आता है, तो ओपी को इन समस्याओं की बड़ी संख्या मिलती है, लेकिन मैंने पहले अच्छे सुझाव देने के लिए पर्याप्त विवरण देखकर याद नहीं किया, हालांकि मैंने थोड़ा सा निवेश किया था समय संभावित दृष्टिकोणों के साथ खेल रहा है (जो कि पोस्ट करने के लिए कुछ भी निश्चित नहीं था)। ओपी की संभावना है कि उस तरह का डोमेन ज्ञान हो जो अच्छे शुरुआत मूल्यों को प्राप्त कर सकता है जो उसकी समस्याओं को लगभग हमेशा हल करता है।
Glen_b -Reinstate Monica


3
|A|BA>0CA1/4A>0A<0

2
BB

6

इस तरह के नॉनलाइनर मॉडल को फिट करने के लिए एक सामान्य तरीका है। इसमें पहले, अंतिम आवृत्ति मान पर निर्भर चर के मूल्यों के साथ रेखीय मापदंडों को फिर से जोड़ना और बीच में एक अच्छा बिंदु 6'th बिंदु कहना शामिल है। फिर आप इन मापदंडों को निर्धारित कर सकते हैं और न्यूनतमकरण के पहले चरण में नॉनलाइनियर पैरामीटर के लिए हल कर सकते हैं और फिर समग्र 5 मापदंडों को कम कर सकते हैं।

Schnute और मैंने 1982 के आसपास यह पता लगाया जब मछली के लिए विकास मॉडल फिटिंग।

http://www.nrcresearchpress.com/doi/abs/10.1139/f80-172

हालांकि इस पेपर को पढ़ना जरूरी नहीं है। इस तथ्य के कारण कि पैरामीटर रैखिक हैं, मॉडल के स्थिर पैरामीटरकरण का उपयोग करने के लिए समीकरणों के 3x3 रैखिक प्रणाली को स्थापित करना और हल करना आवश्यक है।

आपके मॉडल के लिए रैखिक भाग एक मैट्रिक्स द्वारा निर्धारित किया जाता हैM

M=(exp(((x(1)B)/C)2)x(1)1exp(((x(6)B)/C)2)x(6)1exp(((x(n)B)/C)2)x(n)1)
n=20
DATA_SECTION
  init_int n
  int mid
 !! mid=6;
  init_matrix data(1,n,1,3)
  vector x(1,n)
  vector y(1,n)
 !! x=column(data,1);
 !! y=column(data,3);   //use column 3
PARAMETER_SECTION
  init_number L1(3)     //(3) means estimate in phase 3
  init_number Lmid(3)
  init_number Ln(3)

  vector L(1,3)
  init_number log_B       // estimate in phase 1
  init_number log_C(2)    // estimate in phase 2 
  matrix M(1,3,1,3);
  objective_function_value f
  sdreport_vector P(1,3)
  sdreport_number B
  sdreport_number C
  vector pred(1,n);
PROCEDURE_SECTION
  L(1)=L1;
  L(2)=Lmid;
  L(3)=Ln;
  B=exp(log_B);
  C=exp(log_C);
  M(1,1)=exp(-square((x(1)-B)/C));
  M(1,2)=x(1);
  M(1,3)=1;
  M(2,1)=exp(-square((x(mid)-B)/C));
  M(2,2)=x(mid);
  M(2,3)=1;
  M(3,1)=exp(-square((x(n)-B)/C));
  M(3,2)=x(n);
  M(3,3)=1;

  P=solve(M,L);  // solve for standard parameters 
                 // P is vector corresponding to A,D,E

  pred=P(1)*exp(-square((x-B)/C))+P(2)*x+P(3);
  if (current_phase()<4)
    f+=norm2(y-pred);
  else
    f+=0.5*n*log(norm2(y-pred))  //concentrated likelihood

BCBBC

यहाँ छवि विवरण दर्ज करें

खराब डेटा के साथ आपके मामले के लिए, यह काफी आसानी से फिट बैठता है और (सामान्य) पैरामीटर अनुमान हैं:

         estimate    std dev
A      2.0053e-01 5.8723e-02
D      1.6537e-02 4.7684e-03
E     -1.8197e-01 7.3355e-02
B      3.0609e+00 5.0197e-01
C      5.6154e+00 9.4564e-01]

डेव, यह दिलचस्प है, लेकिन यह कुछ सवाल उठाता है। बिल्कुल "आप इस तरह के गैर-मॉडल मॉडल" से क्या मतलब है? प्रश्न "जेनेरिक फिटिंग फ़ंक्शन" का संदर्भ देकर शुरू होता है, लेकिन आपका विवरण केवल "समग्र 5 मापदंडों" को संदर्भित करता है।
whuber

मेरा मतलब है कि वॉनबर्टानाल्फ़ी, या लॉजिस्टिक या डबल एक्सपोनेंशियल जैसे मॉडल। सभी मामलों में मॉडल कुछ मापदंडों में रैखिक है और अन्य में nonlinear है। लोग आम तौर पर गैर रेखीय मापदंडों पर ध्यान केंद्रित करके अधिक स्थिर पैरामीटर प्राप्त करने के लिए उन्हें बदलने की कोशिश करते हैं। हालाँकि यह गलत तरीका है। यह रैखिक पैरामीटराइजेशन है जिसे संशोधित किया जाना चाहिए इसलिए उदाहरण के लिए 4 पैरामीटर लॉजिस्टिक के लिए मॉडल ऊपरी और निचले स्पर्शोन्मुख में रैखिक है, लेकिन इन मापदंडों का उपयोग करने के बजाय सबसे छोटे और सबसे बड़े इंडस्ट्रीज़ के लिए अनुमानित मूल्यों का उपयोग करना चाहिए। वर।
फोरनेयर

@davefournier आपके पेपर का उत्तर देने और इंगित करने के लिए धन्यवाद। आपका पेपर थोड़ा मुश्किल लग रहा है, लेकिन तकनीक दिलचस्प लग रही है इसलिए इसे पढ़ने के लिए इंतजार नहीं कर सकता।
फिक्स्ड प्वाइंट

2

यदि आपको कई बार ऐसा करना है तो मैं आपको सुझाव दूंगा कि आप शुरुआती मूल्यों को प्रदान करने के लिए SSE फ़ंक्शन पर एक इवोल्यूशनरी एल्गोरिथम का उपयोग करें।

दूसरी ओर आप GEOGEBRA का उपयोग मापदंडों के लिए स्लाइडर्स का उपयोग करके फ़ंक्शन बनाने के लिए कर सकते हैं और शुरुआती मान प्राप्त करने के लिए उनके साथ खेल सकते हैं।

या डेटा से मानों का प्रारंभ अवलोकन द्वारा किया जा सकता है।

  1. D और E डेटा के ढलान और अवरोधन (गौसियन की अनदेखी) से आते हैं
  2. A, Dx + E रेखा के अनुमान से गाऊसी की अधिकतम दूरी की ऊर्ध्वाधर दूरी है।
  3. बी गौसियन के अधिकतम का x मान है
  4. गॉसियन की सी स्पष्ट चौड़ाई है

1

मूल्यों को शुरू करने के लिए आप एक साधारण न्यूनतम वर्ग फिट कर सकते हैं। इसका ढलान और अवरोधन डी और ई के लिए शुरुआती मूल्य होंगे। सबसे बड़ा अवशिष्ट ए के लिए शुरुआती मूल्य होगा। सबसे बड़े अवशिष्ट की स्थिति बी के लिए शुरुआती मूल्य होगा। हो सकता है कि कोई और सिग्मा के लिए प्रारंभिक मूल्य सुझा सकता है।

हालांकि, विषय-वस्तु के ज्ञान से किसी भी प्रकार के यंत्रवत समीकरण को प्राप्त किए बिना गैर-रैखिक कम से कम वर्ग जोखिम भरा व्यवसाय है, और बहुत से अलग-अलग फिट करने से चीजें और भी अधिक संदिग्ध हो जाती हैं। क्या आपके प्रस्तावित समीकरण के पीछे कोई विषय वस्तु ज्ञान है? क्या अन्य स्वतंत्र चर हैं जो 100 या इतने अलग-अलग फिट के बीच अंतर से संबंधित हैं? यह मदद कर सकता है यदि आप उन अंतरों को एक एकल समीकरण में शामिल कर सकते हैं जो एक बार में सभी डेटा को फिट करेंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.