मैं यह पता लगाने की कोशिश कर रहा हूं कि कैसे एक mgcv में चौरसाई मापदंडों को नियंत्रित करने के लिए: गाम मॉडल।
मेरे पास एक द्विपद चर है जिसे मैं मुख्य रूप से x और y के एक फ़ंक्शन के रूप में मॉडल करने की कोशिश कर रहा हूं जो एक निश्चित ग्रिड पर समन्वय करता है, साथ ही कुछ अन्य चर अधिक मामूली प्रभावों के साथ। अतीत में मैंने पैकेज लोफिट और सिर्फ (एक्स, वाई) मूल्यों का उपयोग करके एक बहुत अच्छे स्थानीय प्रतिगमन मॉडल का निर्माण किया है।
हालांकि, मैं अन्य चर को मॉडल में शामिल करने का प्रयास करना चाहता हूं, और यह सामान्यीकृत additive मॉडल (GAM) की तरह लग रहा था। संकुल गम और mgcv को देखने के बाद, दोनों का GAM फ़ंक्शन होता है, मैंने बाद के लिए चुना क्योंकि मेलिंग सूची थ्रेड्स में कई टिप्पणियां इसकी सिफारिश करती हैं। एक नकारात्मक पक्ष यह है कि यह एक स्थानीय प्रतिगमन चिकना का समर्थन नहीं करता है जैसे कि लोटस या लोकोफिट।
शुरू करने के लिए, मैं बस (x, y) निर्देशांक का उपयोग करते हुए, लगभग हर स्थान मॉडल को दोहराने की कोशिश करना चाहता था। मैंने नियमित और टेंसर उत्पाद दोनों को सुगम बनाने की कोशिश की:
my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1)
my.gam.s <- gam(z ~ s(x, y), family=binomial(logit), data=my.data, scale = -1)
हालांकि, मॉडल से भविष्यवाणियों की साजिश करते हुए, वे लोफिट मॉडल की तुलना में बहुत अधिक चिकनी हैं। इसलिए मैं मॉडल को ट्यून करने की कोशिश कर रहा हूं कि ज्यादा से ज्यादा न देखूं। मैंने मापदंडों को सपा और कश्मीर को समायोजित करने की कोशिश की है, लेकिन यह मेरे लिए स्पष्ट नहीं है कि वे कैसे चौरसाई को प्रभावित करते हैं। लोफिट में, एनएन पैरामीटर कम इस्तेमाल किए जाने वाले छोटे मूल्यों और अधिक "विगलिंग" के साथ उपयोग किए गए पड़ोस की अवधि को नियंत्रित करता है, जो ग्रिड पर कुछ क्षेत्रों को पकड़ने में मदद करता है जहां द्विपद परिणामों की संभावना तेजी से बदलती है। मैं उसी तरह का व्यवहार करने में सक्षम करने के लिए गम मॉडल की स्थापना के बारे में कैसे जाऊंगा?