model-selection पर टैग किए गए जवाब

मॉडल का चयन जजिंग की एक समस्या है कि कुछ सेट से कौन सा मॉडल सबसे अच्छा प्रदर्शन करता है। लोकप्रिय तरीकों में , एआईसी और बीआईसी मानदंड, परीक्षण सेट और क्रॉस-मान्यता शामिल हैं। कुछ हद तक, सुविधा चयन मॉडल चयन का एक उपप्रकार है। आर2

1
एक मॉडल से शर्तें छोड़ने के बाद स्वतंत्रता के उचित अवशिष्ट डिग्री
मैं इस प्रश्न के आसपास की चर्चा और विशेष रूप से फ्रैंक हैरेल की टिप्पणी पर विचार कर रहा हूं कि एक कम मॉडल में विचरण का अनुमान (यानी जिसमें से कई व्याख्यात्मक चर का परीक्षण और अस्वीकार कर दिया गया है) को यू के सामान्यीकृत डिग्री का उपयोग करना …

4
CART का उपयोग करते समय "चर महत्व" को कैसे मापें / रैंक करें? (विशेष रूप से R से {rpart} का उपयोग करते हुए)
आरएटीआर (आर) का उपयोग करके एक कार्ट मॉडल (विशेष रूप से वर्गीकरण ट्री) का निर्माण करते समय, यह जानना अक्सर दिलचस्प होता है कि मॉडल के लिए पेश किए गए विभिन्न चर का क्या महत्व है। इस प्रकार, मेरा प्रश्न है: कार्ट मॉडल में भाग लेने वाले चर के रैंकिंग …

3
क्या AIC विभिन्न प्रकार के मॉडल की तुलना कर सकता है?
मैं R में गैर-रेखीय मॉडल की तुलना करने के लिए AIC (Akaike's Information Criterion) का उपयोग कर रहा हूं। क्या AIC की तुलना विभिन्न प्रकार के मॉडल से करना मान्य है? विशेष रूप से, मैं glm द्वारा फिट किए गए एक मॉडल की तुलना कर रहा हूं, जिसमें ग्लैमर (lme4) …

3
AIC मॉडल तुलना के लिए आवश्यक शर्तें
वास्तव में पूर्वापेक्षाएँ क्या हैं, जिन्हें काम की तुलना में एआईसी मॉडल के लिए पूरा करने की आवश्यकता है? मैं इस सवाल के आसपास आया जब मैंने इस तरह की तुलना की: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) …

4
मॉडल अनिश्चितता को संबोधित करते हुए
मैं सोच रहा था कि क्रॉसविलेक्टेड समुदाय के बायेसियन कैसे मॉडल अनिश्चितता की समस्या को देखते हैं और वे इससे कैसे निपटना पसंद करते हैं? मैं अपने प्रश्न को दो भागों में बाँटने की कोशिश करूँगा: मॉडल अनिश्चितता से कैसे महत्वपूर्ण (आपके अनुभव / राय में) है? मुझे मशीन लर्निंग …

5
एक मिश्रित मॉडल में एक कारक को यादृच्छिक के रूप में मानने से उल्टा क्या है?
मुझे कुछ कारणों से एक मॉडल कारक को यादृच्छिक के रूप में लेबल करने के लाभों को गले लगाने में समस्या है। मेरे लिए यह ऐसा प्रतीत होता है कि लगभग सभी मामलों में सभी कारकों के अनुसार तय किया गया इष्टतम उपचार है। सबसे पहले, फिक्स्ड बनाम रैंडम का …

4
क्या आपके पास उन विश्लेषण तकनीकों पर वैश्विक दृष्टि है?
मैं वर्तमान में एक ऐसी परियोजना पर हूं, जहां मुझे मूल रूप से जरूरत है, जैसे हम सब समझते हैं कि आउटपुट इनपुट से कैसे संबंधित है । यहाँ ख़ासियत यह है कि डेटा मुझे एक बार में एक टुकड़ा दिया जाता है, इसलिए मैं हर बार जब मैं एक …

2
विषय मॉडल में विषय स्थिरता
मैं एक ऐसी परियोजना पर काम कर रहा हूं, जहां मैं ओपन-एंडेड निबंधों की एक श्रृंखला की सामग्री के बारे में कुछ जानकारी निकालना चाहता हूं। इस विशेष परियोजना में, 148 लोगों ने एक बड़े प्रयोग के एक काल्पनिक छात्र संगठन के बारे में निबंध लिखा। यद्यपि मेरे क्षेत्र में …

3
समय श्रृंखला में AIC बनाम क्रॉस सत्यापन: छोटा नमूना मामला
मुझे एक समय श्रृंखला सेटिंग में मॉडल चयन में दिलचस्पी है। संक्षिप्तता के लिए, मान लीजिए कि मैं अलग-अलग लैग ऑर्डर वाले ARMA मॉडल के पूल से एक ARMA मॉडल का चयन करना चाहता हूं। अंतिम आशय पूर्वानुमान है । द्वारा मॉडल चयन किया जा सकता है परिणाम का सत्यापन …

2
क्यों विल्कस 1938 प्रक्षेपीकृत मॉडल के लिए प्रूफ का काम नहीं करता है?
प्रसिद्ध 1938 के पेपर में (" समग्र परिकल्पनाओं के परीक्षण के लिए संभावना अनुपात का बड़ा-नमूना वितरण ", गणितीय सांख्यिकी के विवरण, 9: 60-62), सैमुअल विल्क्स ने (लॉग संभावना अनुपात) के विषम वितरण का व्युत्पन्न किया। नेस्टेड परिकल्पनाओं के लिए, इस धारणा के तहत कि बड़ी परिकल्पना सही ढंग से …

4
शाओ के परिणाम छुट्टी-एक-आउट क्रॉस-सत्यापन पर कब लागू होते हैं?
क्रॉस-वैलिडेशन द्वारा अपने पेपर रैखिक मॉडल चयन में , जुन शाओ दर्शाता है कि बहुभिन्नरूपी रैखिक प्रतिगमन में चर चयन की समस्या के लिए, छुट्टी-एक-आउट क्रॉस सत्यापन (एलओओसीवी) की विधि 'एसिम्पटोट असंगत' है। सादे अंग्रेजी में, यह बहुत अधिक चर वाले मॉडल का चयन करता है। एक सिमुलेशन अध्ययन में, …

1
उचित स्कोरिंग नियमों में से चुनना
उचित स्कोरिंग नियमों के अधिकांश संसाधनों में लॉग-लॉस, बैरियर स्कोर या गोलाकार स्कोरिंग जैसे विभिन्न स्कोरिंग नियमों का उल्लेख है। हालांकि, वे अक्सर उनके बीच के मतभेदों पर ज्यादा मार्गदर्शन नहीं देते हैं। (प्रदर्शनी ए: विकिपीडिया ।) लॉगरिदमिक स्कोर को अधिकतम करने वाले मॉडल को चुनना अधिकतम संभावना मॉडल को …

3
बड़े , छोटे समस्या से निपटने के दौरान मॉडल की स्थिरता
परिचय: मेरे पास एक शास्त्रीय "बड़े पी, छोटे एन समस्या" के साथ एक डेटासेट है। उपलब्ध नमूनों की संख्या n = 150 जबकि संभावित भविष्यवक्ताओं की संख्या p = 400। परिणाम एक सतत चर है। मैं सबसे "महत्वपूर्ण" वर्णनकर्ताओं को ढूंढना चाहता हूं, अर्थात, जो परिणाम की व्याख्या करने और …

2
मॉडल चयन बेयसियन या क्रॉस-सत्यापन के लिए सबसे अच्छा तरीका?
जब विभिन्न मॉडलों या चयन करने के लिए कई विशेषताओं के बीच चयन करने का प्रयास किया जाता है, तो कहें कि भविष्यवाणी मैं दो दृष्टिकोणों के बारे में सोच सकता हूं। डेटा को प्रशिक्षण और परीक्षण सेट में विभाजित करें। अभी भी बेहतर है, बूटस्ट्रैपिंग या के-गुना क्रॉस-सत्यापन का …

2
एक अनुमानक की ओरेकल संपत्ति क्या है?
एक अनुमानक की ओरेकल संपत्ति क्या है ? मॉडलिंग लक्ष्य क्या है (भविष्यवाणी, व्याख्यात्मक, ...) के लिए प्रासंगिक ओरेकल संपत्ति है ? दोनों सैद्धांतिक रूप से कठोर और (विशेष रूप से) सहज स्पष्टीकरण का स्वागत है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.