स्प्लिन या फ्रैक्शनल पॉलीओनियम्स का उपयोग करते समय लापता डेटा से कैसे निपटा जा सकता है?


12

मैं मल्टीवेरिबल मॉडल बिल्डिंग पढ़ रहा हूं : पैट्रिक रोइस्टन और विली सॉबर्रेई द्वारा सतत चर के लिए आंशिक पोलीनोमियल पर आधारित प्रतिगमन विश्लेषण के लिए एक व्यावहारिक दृष्टिकोण । अब तक, मैं प्रभावित हूं और यह एक दिलचस्प दृष्टिकोण है जिसे मैंने पहले नहीं माना था।

लेकिन लेखक लापता डेटा से नहीं निपटते हैं। दरअसल, पी। 17 वे कहते हैं कि लापता डेटा "कई अतिरिक्त समस्याओं का परिचय देता है। यहां पर विचार नहीं किया गया है।"

क्या भिन्नात्मक बहुपद> के साथ बहु संसेचन कार्य करता है

एफपी, कुछ मायनों में (लेकिन सभी नहीं) स्प्लिन का एक विकल्प है। क्या स्पलाइन रिग्रेशन के लिए लापता डेटा से निपटना आसान है?


क्या आप लापता एक्स या लापता वाई या दोनों के साथ काम कर रहे हैं?
Glen_b -Reinstate Monica

2
+1 (!) मैं वास्तव में किसी और से इसी तरह का प्रश्न पूछते हुए देखकर खुश हूं। हाल ही में मैंने इस प्रश्न को पोस्ट किया: R. के चूहों में प्रतिबंधित क्यूबिक स्प्लिन का उपयोग कैसे करें, इसके बारे में आँकड़ें ।stackexchange.com /questions/ 295977/… । मैं विशेष रूप से स्पाइन के लिए विकल्प चुनूंगा क्योंकि उन्हें एक भिन्नात्मक बहुपद निर्दिष्ट करने की आवश्यकता नहीं होती है, जबकि स्पाइन काफी कार्यात्मक रूपों के लिए पर्याप्त लचीले होते हैं। मुझे नहीं पता कि यह आपके प्रश्न का उत्तर देता है या नहीं (इसलिए यह टिप्पणी)।
IWS

2
यह एक दिलचस्प सवाल है, (संभव उत्तर के एक आयाम के रूप में) खुलने और लापता डेटा को समायोजित करने की उनकी क्षमता के विपरीत इन कई चौरसाई / प्रक्षेप तकनीकों की आलोचना को प्रभावित करने की संभावना है। (कुछ हद तक, लापता होने के लिए नाजुकता एक आधुनिक विधि के लिए एक 'शर्मिंदगी' है।) मैं केवल इस बात को ध्यान में रखते हुए ध्यान देता हूं कि एक बायेसियन कार्यान्वयन आपको आपके मुफ्त के लिए 'प्रतिरूपण' मिलेगा।
डेविड सी। नोरिस

2
@ DavidC.Nrisris आपकी टिप्पणी मुझे अट्रैक्ट करती है! क्या आप इस बारे में विस्तार से बता सकते हैं कि बायेसियन तरीके 'मुफ्त में' (जो मुझे लगता है कि आप विश्लेषण के तरीकों को उचित रूप से, 'स्वचालित रूप से और डिफ़ॉल्ट रूप से नियंत्रित करते हैं') को याद करते हैं। (या मुझे एक संदर्भ में इंगित करें)
IWS

2
यहां "फ्री" का नो-फ्री-लंच हिस्सा यह है कि आपको एक बायेसियन मॉडल लिखना चाहिए, जो डेटा जनरेट करने की प्रक्रिया ( DGP ) के बारे में स्पष्ट रूप से सोचता है । एक बार जब आप ऐसा कर लेते हैं, तो आप लापता मानों को [उपद्रव] मापदंडों के रूप में मानते हैं। (बायेसियन में, "सब कुछ एक पैरामीटर है"। अव्यक्त चर भी देखें ।) आपका MCMC तब अनिवार्य रूप से उस DGP का शोषण करता है जिसे आपने "लापता मान" को "मुफ्त में" लगाने के लिए निर्दिष्ट किया है, जबकि यह साथ में ठगता है।
डेविड सी। नोरिस

जवाबों:


1

(एक्स)(एक्स)=एक्स+एक्स.5()1Σ(एक्स)

आपके द्वारा उपयोग किए जा रहे सॉफ़्टवेयर को मानने पर x के प्रत्येक अनन्य मान के लिए एक मानक त्रुटि अनुमान प्रदान कर सकते हैं, आप मानक त्रुटियों की गणना के लिए रुबिन (सर्वेक्षणों में गैर-प्रतिरूपण के लिए एकाधिक प्रतिरूपण; 1987) का उपयोग कर सकते हैं। कई प्रतिरूपण के साथ स्वतंत्रता की डिग्री के लिए छोटे और बड़े नमूना सूत्र हैं। बड़े सैंपल फॉर्मूला (रुबिन में भी) सिर्फ मानक त्रुटि के समान इनपुट लेता है, इसलिए इसका उपयोग भी किया जा सकता है। छोटा नमूना मामला एक इनपुट के रूप में मॉडल की स्वतंत्रता की डिग्री लेता है; मेरे लिए यह स्पष्ट नहीं है कि क्या यह सूत्र यहां लागू किया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.