GAM बनाम लोड बनाम विभाजन


14

प्रसंग : मैं इसलिए मैं उपयोग कर रहा हूँ एक scatterplot कि पैरामीट्रिक प्रकट नहीं होता है में एक रेखा खींच करना चाहते हैं, geom_smooth()में ggplotमें R। यह स्वचालित रूप से रिटर्न करता है geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.मैं इकट्ठा जीएएम सामान्यीकृत additive मॉडल के लिए खड़ा हूं और यह एक क्यूबलाइन का उपयोग करता है।

निम्नलिखित धारणाएँ सही हैं?

  • Loess विशिष्ट मूल्यों पर प्रतिक्रिया का अनुमान लगाता है।

  • स्प्लिनेस वे सन्निकटन होते हैं जो डेटा को फिट करने वाले अलग-अलग टुकड़ों के कार्यों को जोड़ते हैं (जो सामान्यीकृत योजक मॉडल बनाते हैं), और क्यूबिक स्प्लिन यहाँ इस्तेमाल होने वाले विशिष्ट प्रकार के तख्ते हैं।

अंत में, कब स्प्लिन का उपयोग किया जाना चाहिए, एलएईएसई का उपयोग कब किया जाना चाहिए?


3
यदि gamफ़ंक्शन पैकेज से एक है gam, तो यह वास्तव में स्प्लीन और स्थानीय बहुपद दोनों को चौरसाई करेगा; LOESS स्थानीय बहुपद का एक विशेष कार्यान्वयन है, जिसमें कुछ अतिरिक्त सामान जोड़े जाते हैं (जैसे बड़े अवशिष्ट को कम करना)।
Glen_b -Reinstate मोनिका

जवाबों:


17

जो सबसे ज्यादा मायने रखता है वह है स्वतंत्रता की प्रभावी डिग्री की संख्या जो आप प्रत्येक दृष्टिकोण को देते हैं। नॉनपामेट्रिक स्मूचर्स के लिए जैसे कि लूज़ इसे बैंडविड्थ द्वारा नियंत्रित किया जाता है जबकि रिग्रेशन स्प्लिन के लिए df अधिक स्पष्ट होता है और प्रत्येक गाँठ के लिए एक df खर्च होता है। लोस और स्प्लीन दोनों और बीच संबंधों का अनुमान लगा रहे हैं । स्प्लिन्स इस अर्थ में अधिक सामान्य हैं कि उनका उपयोग विभिन्न प्रकार के संदर्भों में किया जा सकता है।XY

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.