चौरसाई के लिए बंटवारे चौरसाई तुलना बनाम?


25

मैं कुछ वक्र को सुचारू करने के लिए लूस या एक चौरसाई विभाजन का उपयोग करने के लिए पेशेवरों / विपक्षों को बेहतर ढंग से समझने की इच्छा रखता हूं।

मेरे प्रश्न का एक और रूपांतर यह है कि अगर एक तरह से स्मूथिंग स्लाइन का निर्माण होता है तो लोस का उपयोग करने के समान परिणाम प्राप्त होंगे।

किसी भी संदर्भ या अंतर्दृष्टि का स्वागत किया जाता है।


ताल, निम्नलिखित अच्छी तरह से उद्धृत लेख कई गैर-पैरामीट्रिक प्रतिगमन बुजा, ए, हस्ती, टी।, और टिब्शिरानी, ​​आर। (1989) को देखता है। रैखिक स्मूदी और एडिटिव मॉडलसांख्यिकी के इतिहास , 17 (2), 453-510, सर्वश्रेष्ठ।
एलेक्सिस

जवाबों:


16

यहां कुछ आर कोड / उदाहरण दिए गए हैं जो आपको एक फिट और एक तंदुरुस्त फिट के लिए फिट की तुलना करने देंगे:

library(TeachingDemos)
library(splines)

tmpfun <- function(x,y,span=.75,df=3) {
    plot(x,y)
    fit1 <- lm(y ~ ns(x,df))
    xx <- seq( min(x), max(x), length.out=250 )
    yy <- predict(fit1, data.frame(x=xx))
    lines(xx,yy, col='blue')
    fit2 <- loess(y~x, span=span)
    yy <- predict(fit2, data.frame(x=xx))
    lines(xx,yy, col='green')
    invisible(NULL)
}

tmplst <- list( 
    span=list('slider', from=0.1, to=1.5, resolution=0.05, init=0.75),
    df=list('slider', from=3, to=25, resolution=1, init=3))

tkexamp( tmpfun(ethanol$E, ethanol$NOx), tmplst )

आप इसे अपने डेटा के साथ आज़मा सकते हैं और अन्य प्रकारों या विकल्पों को आज़माने के लिए कोड बदल सकते हैं। आप यह भी देख सकते हैं कि loess.demoटीचिंगडेमोस पैकेज में फंक्शन को बेहतर तरीके से समझने के लिए लूप अल्गोरिथम क्या करता है। ध्यान दें कि आप जिस चीज को देखते हैं, वह अक्सर दूसरे इंटरपोलेशन स्मूदी (कभी-कभी खुद की एक पट्टी) के साथ लॉयस का एक संयोजन होता है, loess.demoफ़ंक्शन वास्तव में स्मूथ और कच्ची दोनों को फिट दिखाता है।

सैद्धांतिक रूप से आप हमेशा एक ऐसी पट्टी पा सकते हैं जो किसी अन्य निरंतर फ़ंक्शन को जितना आप चाहें उतना करीब से पता लगा सकती है, लेकिन यह संभावना नहीं है कि समुद्री मील का एक सरल विकल्प होगा जो मज़बूती से किसी भी डेटा सेट के लिए एक करीब फिट के लिए एक अनुमानित सन्निकटन देगा।


हाय ग्रेग: 1) उत्तर के लिए धन्यवाद। 2) मुझे आपका loess.demo फंक्शन बहुत पसंद है ...
Tal Galili

29

एक चौरसाई तख़्ता या शतरंज से वास्तविक परिणाम बहुत समान होने जा रहे हैं। वे समर्थन के किनारों पर थोड़ा अलग दिख सकते हैं, लेकिन जब तक आप यह सुनिश्चित करते हैं कि यह एक "प्राकृतिक" चौरसाई है, वे वास्तव में समान दिखेंगे।

यदि आप स्कैटरप्लॉट में "स्मूथ" जोड़ने के लिए सिर्फ एक का उपयोग कर रहे हैं, तो एक दूसरे पर पसंद करने का कोई वास्तविक कारण नहीं है। यदि इसके बजाय आप नए डेटा पर भविष्यवाणियां करना चाहते हैं, तो आम तौर पर एक चौरसाई का उपयोग करना बहुत आसान है। इसका कारण यह है कि चौरसाई स्लाइन मूल डेटा का प्रत्यक्ष आधार विस्तार है; यदि आपने इसे बनाने के लिए 100 समुद्री मील का उपयोग किया है तो इसका मतलब है कि आपने मूल चर से ~ 100 नए चर बनाए हैं। इसके बजाय केवल अनुभव किए गए सभी मूल्यों (या बड़े डेटा के लिए स्तरीकृत सबसेट) पर प्रतिक्रिया का अनुमान है।

सामान्य तौर पर, चौरसाई करने के लिए दंड मूल्य को अनुकूलित करने के लिए स्थापित एल्गोरिदम हैं (आर में mgcv शायद यह सबसे अच्छा करता है)। लोसे काफी स्पष्ट कटौती के रूप में नहीं है, लेकिन आप आमतौर पर किसी भी कार्यान्वयन से उचित उत्पादन प्राप्त करेंगे। MGCV आपको फ्रीडम के समकक्ष डिग्री के लिए भी एक फील देता है ताकि आप यह महसूस कर सकें कि आपका डेटा "नॉन-लीनियर" कैसे है।

मुझे लगता है कि जब बहुत बड़े डेटा पर मॉडलिंग करते हैं, तो एक सरल प्राकृतिक तख़्ता अक्सर या तो एक चौरसाई या लूप की तुलना में न्यूनतम गणना के लिए समान परिणाम प्रदान करता है।


+1, अच्छा जवाब! मुझे स्पष्ट सैद्धांतिक प्रदर्शनी पसंद है।
गूँग - मोनिका

हालांकि वे समर्थन के किनारों के पास भिन्न क्यों हैं?
इमू

1
एक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.