LOESS जो छूट देता है


14
  • क्या LOESS जैसी कोई मॉडलिंग तकनीक है जो शून्य, एक, या अधिक छूट के लिए अनुमति देती है, जहां पर छूट का समय एप्रीओरी नहीं जाना जाता है?
  • यदि एक तकनीक मौजूद है, तो क्या आर में मौजूदा कार्यान्वयन है?

1
ज्ञात x- मानों पर, या अज्ञात x-मानों में विसंगतियां? (ज्ञात एक्स काफी आसान है)
Glen_b -Reinstate Monica

@ मुझे पता चला कि प्रश्न: मैं उन परिस्थितियों में दिलचस्पी रखता हूं जहां असंतोष का समय ज्ञात नहीं है।
जेरोमाइ एंगलिम सेप

यह एक मूर्ख / मूर्खतापूर्ण प्रश्न हो सकता है, लेकिन आप कहते हैं कि "टाइमिंग": क्या यह समय श्रृंखला के साथ उपयोग के लिए है? मेरा मानना ​​है कि नीचे दिए गए अधिकांश उत्तर इसे ("चेंज पॉइंट, आदि") मानते हैं, हालांकि LOESS को गैर-समय-सीरीज़ स्थितियों में, असंगतताओं के साथ लागू किया जा सकता है। मुझे लगता है।
वेन

जवाबों:


15

ऐसा लगता है कि आप प्रत्येक सेगमेंट में स्वतंत्र चौरसाई के बाद कई बदलाव का पता लगाना चाहते हैं। (जांच ऑनलाइन हो सकती है या नहीं, लेकिन आपका आवेदन ऑनलाइन होने की संभावना नहीं है।) इस पर बहुत सारा साहित्य है; इंटरनेट की खोज फलदायी है।

  • डीए स्टीफंस ने 1994 में बायेसियन चेंजप्वाइंट डिटेक्शन का एक उपयोगी परिचय (ऐप। स्टेट। 43 # 1 पीपी 159-178: JSTOR ) लिखा ।
  • हाल ही में पॉल फर्नहेड अच्छा काम कर रहा है (उदाहरण के लिए, कई बदलाव की समस्याओं के लिए सटीक और कुशल बायेसियन अनुमान , स्टैट कम्पुट (2006) 16: 203-213: फ्री पीडीएफ )।
  • डी बैरी एंड जेए हार्टिगन द्वारा एक सुंदर विश्लेषण के आधार पर एक पुनरावर्ती एल्गोरिदम मौजूद है
    • परिवर्तन बिंदु मॉडल, ऐन के लिए उत्पाद विभाजन मॉडल । स्टेट। 20: 260-279: JSTOR ;
    • चेंज प्वाइंट प्रॉब्लम्स के लिए बायेसियन एनालिसिस, JASA 88: 309-319: JSTOR
  • बैरी एंड हार्टिगन अल्गोरिद्म का एक कार्यान्वयन O. Seidou & TBMJ Ourda, Recursion-based Multiple Changepoint Detection in Multivariate Linear Regression और Application to River Streamflows, Water Res में प्रलेखित है । रेस।, 2006: फ्री पीडीएफ

मैंने किसी भी आर कार्यान्वयन के लिए मुश्किल नहीं देखा है (मैंने थोड़ी देर पहले एक गणितज्ञ में कोडित किया था) लेकिन अगर आप एक खोज करते हैं तो एक संदर्भ की सराहना करेंगे।


3
मुझे bcp R पैकेज jstatsoft.org/v23/i03/paper मिला, जो बैरी एंड हार्टिगन अल्गोरिदम को लागू करता है
जेरोमी एंग्लिम

@Jeromy: आर पैकेज के लिए और संदर्भों के लिंक डालने के लिए धन्यवाद।
whuber

7

koencker की टूटी हुई रेखा प्रतिगमन के साथ करते हैं, इस विगनेट के पृष्ठ 18 को देखें

http://cran.r-project.org/web/packages/quantreg/vignettes/rq.pdf

व्हीबर की अंतिम टिप्पणी के जवाब में:

यह अनुमानक इस तरह परिभाषित किया गया है।

, एक्स ( मैं )एक्स ( मैं - 1 )xR ,x(i)x(i1)i

,ei:=yiβix(i)β0

, z - = अधिकतम ( - z , 0 ) ,z+=max(z,0)z=max(z,0)

, λ 0τ(0,1)λ0

min.βRn|τ,λi=1nτei++i=1n(1τ)ei+λi=2n|βiβi1|

वांछित quantile देता है (उदाहरण में यानी, τ = 0.9 )। λ ब्रेकपॉइंट की संख्या को निर्देशित करता है: λ बड़े के लिए यह अनुमानक बिना ब्रेक पॉइंट (क्लासिकला लीनियर क्वांटाइल रिग्रेशन एसेलेटर के अनुरूप) को सिकोड़ता है।ττ=0.9λλ

क्वांटाइल स्मूदनिंग स्प्लिंस रोजर कोएन्कर, पिन एनजी, स्टीफन पोर्टनॉय बायोमेट्रिका, वॉल्यूम। 81, नंबर 4 (दिसंबर, 1994), पीपी। 673-680

पुनश्च: एक ही नाम के साथ एक खुला acess वर्किंग पेपर है, लेकिन यह एक ही बात नहीं है।


यह एक साफ विचार है: संदर्भ के लिए धन्यवाद। हालांकि, उस विशेष फिट के अवशेष बहुत खराब दिखते हैं, जो मुझे आश्चर्यचकित करता है कि यह संभावित बदलावों को कितनी अच्छी तरह से पहचानता है।
whuber

व्हुबेर: मुझे नहीं पता कि आप क्वांटाइल रिग्रेशन के सिद्धांत से कितने परिचित हैं। इन रेखाओं का स्प्लीन पर एक बड़ा लाभ है: वे किसी भी त्रुटि वितरण को नहीं मानते हैं (अर्थात वे अवशेषों को गौसियन नहीं मानते हैं)।
user603

@kwak यह दिलचस्प लग रहा है। सामान्य त्रुटि वितरण नहीं मान लेना मेरे अनुप्रयोगों में से एक के लिए उपयोगी होगा।
जेरोमे एंग्लीम

वास्तव में, आप इस अनुमान से बाहर निकलते हैं कि वास्तविक सशर्त मात्राएँ हैं: संक्षेप में, ये स्प्लिइन / LOESS-regressions हैं कि दंपति के लिए बॉक्सपॉट क्या हैं (मतलब, एसडी): आपके डेटा का एक बहुत समृद्ध दृश्य। वे गैर-गाऊसी संदर्भ में भी वैधता बनाए रखते हैं (जैसे कि असममित त्रुटियां, ...)।
user603

@kwak: एक्स-कोऑर्डिनेट के साथ अवशिष्टों का भारी संबंध है। उदाहरण के लिए, नकारात्मक या छोटे सकारात्मक अवशिष्ट के लंबे रन हैं। उनके पास एक गौसियन वितरण है या नहीं, फिर, सारहीन है (साथ ही किसी भी खोजपूर्ण विश्लेषण में अप्रासंगिक): यह सहसंबंध दर्शाता है कि फिट खराब है।
whuber

6

इस समस्या को हल करने के लिए कुछ तरीके और संबद्ध आर संकुल हैं

तरंगिका thresolding आकलन प्रतिगमन में discontonuities के लिए अनुमति देता है। आप आर में पैकेज वेवथ्रेश का उपयोग कर सकते हैं।

जब आपके पास विसंगतियां होती हैं तो बहुत सारे पेड़ आधारित तरीके (वेवलेट के विचार से दूर नहीं) उपयोगी होते हैं। इसलिए पैकेज ट्रेथ्रेश, पैकेज ट्री!

" स्थानीय अधिकतम संभावना " विधियों के अकाल में ... अन्य लोगों के बीच: पॉशेल और स्पोकेन का काम: अनुकूली भार चौरसाई (पैकेज एवेन्यू) कैथरीन लोडर द्वारा काम: पैकेज लोफिट

मुझे लगता है कि स्थानीय रूप से अलग-अलग बैंडविड्थ के साथ किसी भी कर्नेल चिकनी बात को इंगित करता है, लेकिन मुझे उसके लिए आर पैकेज नहीं पता है।

नोट: मुझे वास्तव में यह नहीं पता है कि LOESS और रिग्रेशन में क्या अंतर है ... क्या यह विचार है कि LOESS में एल्गोरिदम "ऑन लाइन" होना चाहिए?


1
पुनः लोड करें: शायद मेरी शब्दावली बिल्कुल सही नहीं है। LOESS द्वारा मैं उन मॉडलों का जिक्र कर रहा हूं जो स्थानीय रूप से कर्व फिटिंग के कुछ फॉर्म का उपयोग करके X से Y की भविष्यवाणी करते हैं। उदाहरण के लिए, जैसा कि इनमें से अधिकांश ग्राफ़ में देखा गया है: google.com/…
जेरोमी एंग्लीम

2

गैर-रेखीय प्रतिगमन फ़ंक्शन नेल्स, बी स्प्लिनेन्स (स्पलाइन पैकेज में bs फ़ंक्शन, उदाहरण के लिए) और ifelse फ़ंक्शन का उपयोग करके R में एक समाधान कोड करना संभव होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.