सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
हाइपरपरमेटर्स के आकलन के लिए अनुभवजन्य बे बनाम क्रॉस-सत्यापन
एक पदानुक्रमित मॉडल को देखते हुए , मैं मॉडल को फिट करने के लिए दो चरण की प्रक्रिया चाहता हूं। सबसे पहले, hyperparameters के एक मुट्ठी भर ठीक θ , और फिर मानकों के बाकी पर बायेसियन अनुमान कर φ । हाइपरपरमेटर्स को ठीक करने के लिए मैं दो विकल्पों …

1
दो अनुपातों के अनुपात में आत्मविश्वास अंतराल
मेरे पास दो अनुपात हैं (उदाहरण के लिए, नियंत्रण लेआउट में एक लिंक पर क्लिकथ्रू दर (CTR) और प्रयोगात्मक लेआउट में एक लिंक पर CTR), और मैं इन अनुपातों के अनुपात के आसपास 95% विश्वास अंतराल की गणना करना चाहता हूं। मैं यह कैसे करु? मुझे पता है कि मैं …

1
एक चर के भीतर विचरण और जोड़ीदार दूरी के बीच लिंक
कृपया, यह साबित करें कि अगर हमारे पास दो चर (समान नमूना आकार) और और में विचरण से अधिक है , तो भीतर डेटा बिंदुओं के बीच चुकता अंतर (यानी, वर्ग यूक्लिडियन दूरी) का योग भी अधिक से अधिक है। कि भीतर ।वाईXXXYYYवाईXXXYYYवाईXXXYYY

2
क्या AdaBoost कम या ज्यादा होने का खतरा है?
मैंने विभिन्न (प्रतीत होता है) कथनों का खंडन करते हुए पढ़ा है कि क्या AdaBoost (या अन्य बूस्टिंग तकनीक) अन्य शिक्षण विधियों की तुलना में कम या ज्यादा होने का खतरा है। क्या एक या दूसरे पर विश्वास करने के अच्छे कारण हैं? यदि यह निर्भर करता है, तो यह …

2
क्या दो वितरणों के बीच हेलिंगर दूरी का एक निष्पक्ष अनुमानक है?
एक सेटिंग में जहां कोई देखता है को घनत्व साथ एक वितरण से वितरित किया , मुझे आश्चर्य है कि अगर घनत्व , अर्थात् लिए एक और वितरण के लिए Hellinger दूरी का एक निष्पक्ष अनुमानक ( आधार पर ) है।X1,…,XnX1,…,XnX_1,\ldots,X_nfffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.

4
पी-वैल्यू की एक-दूसरे से तुलना करने में क्या समझदारी है?
मेरे पास दो आबादी (पुरुष और महिलाएं) हैं, जिनमें से प्रत्येक में नमूने हैं। प्रत्येक नमूने के लिए मेरे पास दो गुण हैं A & B (प्रथम वर्ष ग्रेड प्वाइंट औसत, और SAT स्कोर)। मैंने ए एंड बी के लिए अलग से एक टी-टेस्ट का उपयोग किया है: दोनों को …

5
प्रयोगात्मक डिजाइन में एक ब्लॉक क्या है?
प्रयोगात्मक डिजाइन में ब्लॉक की धारणा के बारे में मेरे दो सवाल हैं: (1) ब्लॉक और फैक्टर में क्या अंतर है? (२) मैंने कुछ पुस्तकों को पढ़ने की कोशिश की लेकिन कुछ स्पष्ट नहीं है: ऐसा लगता है कि लेखक हमेशा यह मानते हैं कि "ब्लॉक फैक्टर" और अन्य कारकों …

2
बायेसियन विश्वसनीय अंतराल प्रक्रियाओं के लिए निर्णय-सैद्धांतिक औचित्य क्या है?
(यह देखने के लिए कि मैंने यह क्यों लिखा है, इस प्रश्न के उत्तर के नीचे टिप्पणियों की जाँच करें ।) III त्रुटियां और सांख्यिकीय निर्णय सिद्धांत टाइप करें गलत प्रश्न का सही उत्तर देने को कभी-कभी टाइप III त्रुटि कहा जाता है। सांख्यिकीय निर्णय सिद्धांत अनिश्चितता के तहत निर्णय …

3
संयोजन मशीन सीखने के मॉडल
मैं नए तरह के डेटामाइनिंग / मशीन लर्निंग / आदि के लिए नया हूँ। और भविष्यवाणियों में सुधार करने के लिए एक ही मॉडल के कई मॉडल और रन को संयोजित करने के कुछ तरीकों के बारे में पढ़ रहे हैं। एक दंपति पत्र (जो सिद्धांत और ग्रीक अक्षरों पर …

2
केयरट री-सैंपलिंग के तरीके
मैं caretविभिन्न मॉडलिंग प्रक्रियाओं का परीक्षण करने के लिए R में लाइब्रेरी का उपयोग कर रहा हूं । trainControlवस्तु एक एक फिर से नमूने विधि निर्दिष्ट करने के लिए अनुमति देता है। तरीकों में वर्णित हैं प्रलेखन अनुभाग 2.3 और शामिल हैं: boot, boot632, cv, LOOCV, LGOCV, repeatedcvऔर oob। हालांकि …
20 r  resampling  caret 

8
"लैब नोटबुक" सॉफ़्टवेयर के लिए विचार?
तो यह एक अजीब फिट है, हालांकि वास्तव में मुझे लगता है कि यह किसी भी साइट के लिए एक अजीब फिट है, इसलिए मैंने सोचा कि मैं इसे अपने डेटा-क्रंचिंग भाइयों के बीच यहां कोशिश करूंगा। मैं जीव विज्ञान से महामारी विज्ञान और जीव विज्ञान के लिए आया था, …

2
मिश्रित प्रभाव मॉडल (मुख्य रूप से यादृच्छिक प्रभाव) की अनुमति तुलना
मैं R में lme4 पैकेज का उपयोग करते हुए मिश्रित प्रभावों को देख रहा हूं। मैं मुख्य रूप से lmerकमांड का उपयोग कर रहा हूं, इसलिए मैं अपने प्रश्न को उस सिंटैक्स का उपयोग करने वाले कोड के माध्यम से लिखूंगा । मुझे लगता है कि एक सामान्य आसान प्रश्न …

4
क्या कोई सांख्यिकीय परीक्षण है जो पैरामीट्रिक और गैर पैरामीट्रिक है?
क्या कोई सांख्यिकीय परीक्षण है जो पैरामीट्रिक और गैर पैरामीट्रिक है? यह सवाल एक इंटरव्यू पैनल ने पूछा था। क्या यह वैध प्रश्न है?

2
द्विपद प्रतिगमन और लॉजिस्टिक प्रतिगमन के बीच अंतर क्या है?
मैंने हमेशा लॉजिस्टिक रिग्रेशन के बारे में सोचा है जैसे कि द्विपद रिग्रेशन का एक विशेष मामला है जहां लिंक फ़ंक्शन लॉजिस्टिक फ़ंक्शन (इसके बजाय, प्रोबेट फंक्शन) है। एक और सवाल पर जवाब पढ़ने से , हालांकि, ऐसा लगता है कि मैं भ्रमित हो सकता हूं, और एक लॉजिस्टिक लिंक …

6
प्रतिगमन मॉडल से किसी शब्द को कब छोड़ना है?
किसी को सलाह दे सकता है अगर निम्नलिखित समझ में आता है: मैं 4 भविष्यवक्ताओं के साथ एक साधारण रैखिक मॉडल के साथ काम कर रहा हूं। मैं दो दिमागों में हूं कि क्या कम से कम महत्वपूर्ण शब्द छोड़ना है। यह -value 0.05 से थोड़ा अधिक है। मैंने इसे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.