सांख्यिकी और बिग डेटा

1

Auto.arima () में R में xreg तर्क कैसे सेटअप करें? [बन्द है]

बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 6 साल पहले बंद हुआ । मैं एक छोटी सी परियोजना पर एक …

19 time-series arima

1

Lognormal यादृच्छिक चर के लिए बनाए रखने योग्य सहसंबंध

पर विचार करें lognormal यादृच्छिक परिवर्तनीय एक्स1एक्स1X_1 और एक्स2एक्स2X_2 के साथ log(X1)∼N( 0 , 1 )log⁡(X1)~एन(0,1)\log(X_1)\sim \mathcal{N}(0,1) , और लॉग( एक्स)2) ∼ एन( 0 , σ2)लॉग⁡(एक्स2)~एन(0,σ2)\log(X_2)\sim \mathcal{N}(0,\sigma^2) । ρ मिनट ρ ( एक्सρअधिकतमρअधिकतम\rho_{\max}ρमिनटρमिनट\rho_{\min}ρ ( एक्स)1, एक्स2)ρ(एक्स1,एक्स2)\rho (X_1,X_2) ρmax=ρ(exp(Z),exp(σZ))ρmax=ρ(exp⁡(Z),exp⁡(σZ))\rho_{\max}=\rho (\exp(Z),\exp(\sigma Z)) और ρmin=ρ(exp(Z),exp(−σZ))ρmin=ρ(exp⁡(Z),exp⁡(−σZ))\rho_{\min}=\rho (\exp(Z),\exp(-\sigma Z)) , लेकिन उन्होंने comonotonicity और countercomonotonicity …

19 correlation copula

2

विचलन के बारे में प्रतिगमन क्यों है?

मैं यह नोट पढ़ रहा हूं । पृष्ठ 2 पर, यह बताता है: "किसी दिए गए प्रतिगमन मॉडल द्वारा डेटा में कितने विचरण को समझाया गया है?" "प्रतिगमन व्याख्या गुणांक के माध्य के बारे में है; उनका विचलन उनके बारे में है।" मैंने कई बार इस तरह के बयानों के …

19 regression variance interpretation

2

एक सममित वितरण की परिभाषा क्या है?

एक सममित वितरण की परिभाषा क्या है? किसी ने मुझसे कहा था कि एक यादृच्छिक चर XXX एक सममित वितरण से आया है यदि और केवल यदि XXX और −X−X-X एक ही वितरण किया है। लेकिन मुझे लगता है कि यह परिभाषा आंशिक रूप से सच है। क्योंकि मैं एक …

19 distributions definition symmetry

2

अनुभवजन्य एन्ट्रॉपी क्या है?

संयुक्त रूप से विशिष्ट सेटों की परिभाषा में ("सूचना सिद्धांत के तत्व", ch। 7.6, पृष्ठ 195) में, हम उपयोग करते हैं एनपी(एक्सएन)=Π n मैं = 1 पी(एक्समैं)−1nlogp(xn)−1nlog⁡p(xn)-\frac{1}{n} \log{p(x^n)} रूप में साथ परिणाम का अनुभवजन्य एन्ट्रापी । मैं इस शब्दावली से पहले कभी नहीं आया था। यह पुस्तक के सूचकांक के …

19 information-theory entropy

2

क्या लॉग-रूपांतरण गैर-सामान्य डेटा के परीक्षण के लिए एक मान्य तकनीक है?

एक पेपर की समीक्षा करते हुए, लेखक कहते हैं, "सामान्य परिणाम की सामान्य मान्यताओं को संतुष्ट करने के लिए टी परीक्षणों के आयोजित होने से पहले, एक विषम वितरण को प्रदर्शित करने वाले निरंतर परिणाम चर को प्राकृतिक लघुगणक का उपयोग करते हुए रूपांतरित किया गया था।" क्या यह गैर-सामान्य …

19 normal-distribution data-transformation t-test lognormal

1

Ggplot2 [बंद] के साथ पहलुओं में अप्रयुक्त स्तरों को छोड़ना

बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । पिछले साल बंद हुआ । क्या यह उन स्तरों को गिराना संभव है …

19 r data-visualization ggplot2

3

जब एक दोहराया उपायों ANOVA एक मिश्रित प्रभाव मॉडल पर पसंद किया जाता है?

इस सवाल के जवाब में , कि क्या मेरा डिजाइन जहां मैंने विभिन्न श्रेणियों के चित्रों के साथ प्रतिभागियों को यादृच्छिक रूप से प्रस्तुत किया था, एक उदाहरण था, जहां मुझे दोहराया उपायों एनोवा का उपयोग करना चाहिए, मुझे जवाब मिला कि मुझे एक के बजाय एक मिश्रित-मॉडल का उपयोग …

19 anova mixed-model repeated-measures

4

आर या एसपीएसएस का उपयोग करके संभावित प्रतिक्रियाओं को विज़ुअलाइज़ करना

मेरे पास 2 समूहों में 82 उत्तरदाता हैं (समूह ए में 43 और समूह बी में 39) जिन्होंने 1 से 5 तक प्रत्येक 65 संभावित प्रश्नों का सर्वेक्षण पूरा किया (दृढ़ता से सहमत - दृढ़ता से असहमत)। इसलिए मेरे पास 66 कॉलम (प्रत्येक प्रश्न के लिए 1 + समूह आवंटन …

19 r data-visualization spss likert

2

समय के माध्यम से लॉजिस्टिक प्रतिगमन में वर्गीकरण संभावना को अद्यतन करना

मैं एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा हूं जो एक शब्द के अंत में छात्र की सफलता की संभावना का अनुमान लगाता है। मुझे विशेष रूप से दिलचस्पी है कि क्या छात्र सफल होता है या विफल रहता है, जहां सफलता आमतौर पर पाठ्यक्रम को पूरा करने और …

19 time-series machine-learning logistic

2

पिछली घटनाओं के समय के आधार पर, अगली घटना होने पर कैसे भविष्यवाणी करें?

मैं एक हाई स्कूल का छात्र हूँ और मैं एक कंप्यूटर प्रोग्रामिंग प्रोजेक्ट पर काम कर रहा हूँ, लेकिन मुझे हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के डेटा का बहुत अनुभव नहीं है इसलिए मैं थोड़े उलझन में हूँ। मूल रूप से, मेरे पास एक यथोचित बड़ी …

19 probability modeling data-mining predictive-models

3

वर्गीकरण के लिए अर्ध-पर्यवेक्षित शिक्षण, सक्रिय शिक्षण और गहन शिक्षा

अपडेट किए गए सभी संसाधनों के साथ अंतिम संपादन: एक परियोजना के लिए, मैं वर्गीकरण के लिए मशीन लर्निंग एल्गोरिदम लागू कर रहा हूं। चुनौती: सीमित लेबल डेटा और बहुत अधिक अनलिस्टेड डेटा। लक्ष्य: अर्ध-पर्यवेक्षित वर्गीकरण लागू करें किसी तरह अर्ध-पर्यवेक्षित लेबलिंग प्रक्रिया लागू करें (सक्रिय शिक्षण के रूप में …

19 machine-learning classification software svm text-mining

5

मानक विचलन का 2 डी एनालॉग?

निम्नलिखित प्रयोग पर विचार करें: लोगों के एक समूह को शहरों की एक सूची दी गई है, और दुनिया के नक्शे पर (अन्यथा अप्रकाशित) मानचित्र पर संबंधित स्थानों को चिह्नित करने के लिए कहा गया है। प्रत्येक शहर के लिए, आपको संबंधित शहर में लगभग बिंदुओं का एक बिखरना मिलेगा। …

19 standard-deviation spatial

4

साधनों के विश्वास अंतराल की गणना कैसे करें?

कल्पना करें कि आप एक प्रयोग को तीन बार दोहराते हैं। प्रत्येक प्रयोग में, आप तीन प्रतियाँ मापते हैं। तीन प्रायोगिक साधनों के बीच के अंतरों की तुलना में ट्रिपलीकेट्स काफी करीब होते हैं। भव्य माध्य की गणना करना बहुत आसान है। लेकिन कोई भव्य मतलब के लिए एक विश्वास …

19 confidence-interval multilevel-analysis

1

बोनफर्रोनी या टुकी? तुलनाओं की संख्या कब बड़ी हो जाती है?

SPSS (तृतीय संस्करण) का उपयोग करते हुए फील्ड की खोज के आंकड़े पढ़ना मैं एनोवा में पोस्ट-हॉक परीक्षणों के बारे में थोड़ा चकित था। टाइप I त्रुटि दर को नियंत्रित करने के इच्छुक लोगों के लिए वह बोनफेरोनी या टके का सुझाव देते हैं और कहते हैं (पृष्ठ 374): तुलनाओं …

19 anova multiple-comparisons post-hoc bonferroni tukey-hsd