सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
Auto.arima () में R में xreg तर्क कैसे सेटअप करें? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 6 साल पहले बंद हुआ । मैं एक छोटी सी परियोजना पर एक …

1
Lognormal यादृच्छिक चर के लिए बनाए रखने योग्य सहसंबंध
पर विचार करें lognormal यादृच्छिक परिवर्तनीय एक्स1एक्स1X_1 और एक्स2एक्स2X_2 के साथ log(X1)∼N( 0 , 1 )log⁡(X1)~एन(0,1)\log(X_1)\sim \mathcal{N}(0,1) , और लॉग( एक्स)2) ∼ एन( 0 , σ2)लॉग⁡(एक्स2)~एन(0,σ2)\log(X_2)\sim \mathcal{N}(0,\sigma^2) । ρ मिनट ρ ( एक्सρअधिकतमρअधिकतम\rho_{\max}ρमिनटρमिनट\rho_{\min}ρ ( एक्स)1, एक्स2)ρ(एक्स1,एक्स2)\rho (X_1,X_2) ρmax=ρ(exp(Z),exp(σZ))ρmax=ρ(exp⁡(Z),exp⁡(σZ))\rho_{\max}=\rho (\exp(Z),\exp(\sigma Z)) और ρmin=ρ(exp(Z),exp(−σZ))ρmin=ρ(exp⁡(Z),exp⁡(−σZ))\rho_{\min}=\rho (\exp(Z),\exp(-\sigma Z)) , लेकिन उन्होंने comonotonicity और countercomonotonicity …

2
विचलन के बारे में प्रतिगमन क्यों है?
मैं यह नोट पढ़ रहा हूं । पृष्ठ 2 पर, यह बताता है: "किसी दिए गए प्रतिगमन मॉडल द्वारा डेटा में कितने विचरण को समझाया गया है?" "प्रतिगमन व्याख्या गुणांक के माध्य के बारे में है; उनका विचलन उनके बारे में है।" मैंने कई बार इस तरह के बयानों के …

2
एक सममित वितरण की परिभाषा क्या है?
एक सममित वितरण की परिभाषा क्या है? किसी ने मुझसे कहा था कि एक यादृच्छिक चर XXX एक सममित वितरण से आया है यदि और केवल यदि XXX और −X−X-X एक ही वितरण किया है। लेकिन मुझे लगता है कि यह परिभाषा आंशिक रूप से सच है। क्योंकि मैं एक …

2
अनुभवजन्य एन्ट्रॉपी क्या है?
संयुक्त रूप से विशिष्ट सेटों की परिभाषा में ("सूचना सिद्धांत के तत्व", ch। 7.6, पृष्ठ 195) में, हम उपयोग करते हैं एनपी(एक्सएन)=Π n मैं = 1 पी(एक्समैं)−1nlogp(xn)−1nlog⁡p(xn)-\frac{1}{n} \log{p(x^n)} रूप में साथ परिणाम का अनुभवजन्य एन्ट्रापी । मैं इस शब्दावली से पहले कभी नहीं आया था। यह पुस्तक के सूचकांक के …

2
क्या लॉग-रूपांतरण गैर-सामान्य डेटा के परीक्षण के लिए एक मान्य तकनीक है?
एक पेपर की समीक्षा करते हुए, लेखक कहते हैं, "सामान्य परिणाम की सामान्य मान्यताओं को संतुष्ट करने के लिए टी परीक्षणों के आयोजित होने से पहले, एक विषम वितरण को प्रदर्शित करने वाले निरंतर परिणाम चर को प्राकृतिक लघुगणक का उपयोग करते हुए रूपांतरित किया गया था।" क्या यह गैर-सामान्य …

1
Ggplot2 [बंद] के साथ पहलुओं में अप्रयुक्त स्तरों को छोड़ना
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । पिछले साल बंद हुआ । क्या यह उन स्तरों को गिराना संभव है …

3
जब एक दोहराया उपायों ANOVA एक मिश्रित प्रभाव मॉडल पर पसंद किया जाता है?
इस सवाल के जवाब में , कि क्या मेरा डिजाइन जहां मैंने विभिन्न श्रेणियों के चित्रों के साथ प्रतिभागियों को यादृच्छिक रूप से प्रस्तुत किया था, एक उदाहरण था, जहां मुझे दोहराया उपायों एनोवा का उपयोग करना चाहिए, मुझे जवाब मिला कि मुझे एक के बजाय एक मिश्रित-मॉडल का उपयोग …

4
आर या एसपीएसएस का उपयोग करके संभावित प्रतिक्रियाओं को विज़ुअलाइज़ करना
मेरे पास 2 समूहों में 82 उत्तरदाता हैं (समूह ए में 43 और समूह बी में 39) जिन्होंने 1 से 5 तक प्रत्येक 65 संभावित प्रश्नों का सर्वेक्षण पूरा किया (दृढ़ता से सहमत - दृढ़ता से असहमत)। इसलिए मेरे पास 66 कॉलम (प्रत्येक प्रश्न के लिए 1 + समूह आवंटन …

2
समय के माध्यम से लॉजिस्टिक प्रतिगमन में वर्गीकरण संभावना को अद्यतन करना
मैं एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा हूं जो एक शब्द के अंत में छात्र की सफलता की संभावना का अनुमान लगाता है। मुझे विशेष रूप से दिलचस्पी है कि क्या छात्र सफल होता है या विफल रहता है, जहां सफलता आमतौर पर पाठ्यक्रम को पूरा करने और …

2
पिछली घटनाओं के समय के आधार पर, अगली घटना होने पर कैसे भविष्यवाणी करें?
मैं एक हाई स्कूल का छात्र हूँ और मैं एक कंप्यूटर प्रोग्रामिंग प्रोजेक्ट पर काम कर रहा हूँ, लेकिन मुझे हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के डेटा का बहुत अनुभव नहीं है इसलिए मैं थोड़े उलझन में हूँ। मूल रूप से, मेरे पास एक यथोचित बड़ी …

3
वर्गीकरण के लिए अर्ध-पर्यवेक्षित शिक्षण, सक्रिय शिक्षण और गहन शिक्षा
अपडेट किए गए सभी संसाधनों के साथ अंतिम संपादन: एक परियोजना के लिए, मैं वर्गीकरण के लिए मशीन लर्निंग एल्गोरिदम लागू कर रहा हूं। चुनौती: सीमित लेबल डेटा और बहुत अधिक अनलिस्टेड डेटा। लक्ष्य: अर्ध-पर्यवेक्षित वर्गीकरण लागू करें किसी तरह अर्ध-पर्यवेक्षित लेबलिंग प्रक्रिया लागू करें (सक्रिय शिक्षण के रूप में …

5
मानक विचलन का 2 डी एनालॉग?
निम्नलिखित प्रयोग पर विचार करें: लोगों के एक समूह को शहरों की एक सूची दी गई है, और दुनिया के नक्शे पर (अन्यथा अप्रकाशित) मानचित्र पर संबंधित स्थानों को चिह्नित करने के लिए कहा गया है। प्रत्येक शहर के लिए, आपको संबंधित शहर में लगभग बिंदुओं का एक बिखरना मिलेगा। …

4
साधनों के विश्वास अंतराल की गणना कैसे करें?
कल्पना करें कि आप एक प्रयोग को तीन बार दोहराते हैं। प्रत्येक प्रयोग में, आप तीन प्रतियाँ मापते हैं। तीन प्रायोगिक साधनों के बीच के अंतरों की तुलना में ट्रिपलीकेट्स काफी करीब होते हैं। भव्य माध्य की गणना करना बहुत आसान है। लेकिन कोई भव्य मतलब के लिए एक विश्वास …

1
बोनफर्रोनी या टुकी? तुलनाओं की संख्या कब बड़ी हो जाती है?
SPSS (तृतीय संस्करण) का उपयोग करते हुए फील्ड की खोज के आंकड़े पढ़ना मैं एनोवा में पोस्ट-हॉक परीक्षणों के बारे में थोड़ा चकित था। टाइप I त्रुटि दर को नियंत्रित करने के इच्छुक लोगों के लिए वह बोनफेरोनी या टके का सुझाव देते हैं और कहते हैं (पृष्ठ 374): तुलनाओं …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.