चौरसाई के लिए बंटवारे चौरसाई तुलना बनाम?

25

मैं कुछ वक्र को सुचारू करने के लिए लूस या एक चौरसाई विभाजन का उपयोग करने के लिए पेशेवरों / विपक्षों को बेहतर ढंग से समझने की इच्छा रखता हूं।

मेरे प्रश्न का एक और रूपांतर यह है कि अगर एक तरह से स्मूथिंग स्लाइन का निर्माण होता है तो लोस का उपयोग करने के समान परिणाम प्राप्त होंगे।

किसी भी संदर्भ या अंतर्दृष्टि का स्वागत किया जाता है।

regression splines loess

— ताल गलिली
स्रोत

ताल, निम्नलिखित अच्छी तरह से उद्धृत लेख कई गैर-पैरामीट्रिक प्रतिगमन बुजा, ए, हस्ती, टी।, और टिब्शिरानी, आर। (1989) को देखता है। रैखिक स्मूदी और एडिटिव मॉडल । सांख्यिकी के इतिहास , 17 (2), 453-510, सर्वश्रेष्ठ।

— एलेक्सिस

16

यहां कुछ आर कोड / उदाहरण दिए गए हैं जो आपको एक फिट और एक तंदुरुस्त फिट के लिए फिट की तुलना करने देंगे:

library(TeachingDemos)
library(splines)

tmpfun <- function(x,y,span=.75,df=3) {
    plot(x,y)
    fit1 <- lm(y ~ ns(x,df))
    xx <- seq( min(x), max(x), length.out=250 )
    yy <- predict(fit1, data.frame(x=xx))
    lines(xx,yy, col='blue')
    fit2 <- loess(y~x, span=span)
    yy <- predict(fit2, data.frame(x=xx))
    lines(xx,yy, col='green')
    invisible(NULL)
}

tmplst <- list( 
    span=list('slider', from=0.1, to=1.5, resolution=0.05, init=0.75),
    df=list('slider', from=3, to=25, resolution=1, init=3))

tkexamp( tmpfun(ethanol$E, ethanol$NOx), tmplst )

आप इसे अपने डेटा के साथ आज़मा सकते हैं और अन्य प्रकारों या विकल्पों को आज़माने के लिए कोड बदल सकते हैं। आप यह भी देख सकते हैं कि loess.demoटीचिंगडेमोस पैकेज में फंक्शन को बेहतर तरीके से समझने के लिए लूप अल्गोरिथम क्या करता है। ध्यान दें कि आप जिस चीज को देखते हैं, वह अक्सर दूसरे इंटरपोलेशन स्मूदी (कभी-कभी खुद की एक पट्टी) के साथ लॉयस का एक संयोजन होता है, loess.demoफ़ंक्शन वास्तव में स्मूथ और कच्ची दोनों को फिट दिखाता है।

सैद्धांतिक रूप से आप हमेशा एक ऐसी पट्टी पा सकते हैं जो किसी अन्य निरंतर फ़ंक्शन को जितना आप चाहें उतना करीब से पता लगा सकती है, लेकिन यह संभावना नहीं है कि समुद्री मील का एक सरल विकल्प होगा जो मज़बूती से किसी भी डेटा सेट के लिए एक करीब फिट के लिए एक अनुमानित सन्निकटन देगा।

— ग्रेग हिमपात
स्रोत

हाय ग्रेग: 1) उत्तर के लिए धन्यवाद। 2) मुझे आपका loess.demo फंक्शन बहुत पसंद है ...

— Tal Galili

29

एक चौरसाई तख़्ता या शतरंज से वास्तविक परिणाम बहुत समान होने जा रहे हैं। वे समर्थन के किनारों पर थोड़ा अलग दिख सकते हैं, लेकिन जब तक आप यह सुनिश्चित करते हैं कि यह एक "प्राकृतिक" चौरसाई है, वे वास्तव में समान दिखेंगे।

यदि आप स्कैटरप्लॉट में "स्मूथ" जोड़ने के लिए सिर्फ एक का उपयोग कर रहे हैं, तो एक दूसरे पर पसंद करने का कोई वास्तविक कारण नहीं है। यदि इसके बजाय आप नए डेटा पर भविष्यवाणियां करना चाहते हैं, तो आम तौर पर एक चौरसाई का उपयोग करना बहुत आसान है। इसका कारण यह है कि चौरसाई स्लाइन मूल डेटा का प्रत्यक्ष आधार विस्तार है; यदि आपने इसे बनाने के लिए 100 समुद्री मील का उपयोग किया है तो इसका मतलब है कि आपने मूल चर से ~ 100 नए चर बनाए हैं। इसके बजाय केवल अनुभव किए गए सभी मूल्यों (या बड़े डेटा के लिए स्तरीकृत सबसेट) पर प्रतिक्रिया का अनुमान है।

सामान्य तौर पर, चौरसाई करने के लिए दंड मूल्य को अनुकूलित करने के लिए स्थापित एल्गोरिदम हैं (आर में mgcv शायद यह सबसे अच्छा करता है)। लोसे काफी स्पष्ट कटौती के रूप में नहीं है, लेकिन आप आमतौर पर किसी भी कार्यान्वयन से उचित उत्पादन प्राप्त करेंगे। MGCV आपको फ्रीडम के समकक्ष डिग्री के लिए भी एक फील देता है ताकि आप यह महसूस कर सकें कि आपका डेटा "नॉन-लीनियर" कैसे है।

मुझे लगता है कि जब बहुत बड़े डेटा पर मॉडलिंग करते हैं, तो एक सरल प्राकृतिक तख़्ता अक्सर या तो एक चौरसाई या लूप की तुलना में न्यूनतम गणना के लिए समान परिणाम प्रदान करता है।

— शिया पार्क
स्रोत

+1, अच्छा जवाब! मुझे स्पष्ट सैद्धांतिक प्रदर्शनी पसंद है।

— गूँग - मोनिका

हालांकि वे समर्थन के किनारों के पास भिन्न क्यों हैं?

— इमू

1

x

$x$