सांख्यिकी और बिग डेटा

3

Ggplot2 में स्कैप्लॉट क्षेत्रों के आसपास साफ बहुभुज कैसे आकर्षित करें [बंद]

मैं स्कैटरप्लॉट पर बिंदुओं के समूह के चारों ओर एक साफ बहुभुज कैसे जोड़ सकता हूं? मैं ggplot2 का उपयोग कर रहा हूं, लेकिन के परिणामों से निराश हूं geom_polygon। टैब-सीमांकित पाठ फ़ाइल के रूप में डेटासेट वहाँ पर है । नीचे दिया गया ग्राफ देशों के एक समूह में …

32 ggplot2 scatterplot

1

एक समय पर मिश्रित प्रभाव मॉडल से अनुमानित मूल्यों के योग पर भिन्नता

मेरे पास एक मिश्रित प्रभाव वाला मॉडल है (वास्तव में एक सामान्यीकृत मिश्रित मॉडल है) जो मुझे समय के लिए भविष्यवाणियां देता है। ऑटोकरेलेशन को काउंटर करने के लिए, मैं एक corCAR1 मॉडल का उपयोग करता हूं, इस तथ्य को देखते हुए कि मेरे पास लापता डेटा है। डेटा मुझे …

32 mixed-model variance random-variable

1

R, NA को एक lm () गुणांक के रूप में क्यों लौटाएगा?

मैं एक lm()मॉडल को एक डेटा सेट में फिट कर रहा हूं जिसमें वित्तीय तिमाही (Q1, Q2, Q3) के लिए संकेतक शामिल हैं, जो Q4 को डिफ़ॉल्ट बनाते हैं)। का उपयोग करते हुए lm(Y~., data = data) मुझे NAQ3 के लिए गुणांक के रूप में मिलता है , और एक …

32 r regression

6

लॉजिस्टिक रिग्रेशन और न्यूरल नेटवर्क में क्या अंतर है?

हम दर्शकों को लॉजिस्टिक रिग्रेशन और न्यूरल नेटवर्क के बीच अंतर कैसे समझाते हैं जिनकी सांख्यिकी में कोई पृष्ठभूमि नहीं है?

32 logistic neural-networks

5

R में चौड़े और लंबे प्रारूप के बीच डेटा कैसे बदलें? [बन्द है]

आपके पास विस्तृत प्रारूप या लंबे प्रारूप में डेटा हो सकता है। यह काफी महत्वपूर्ण बात है, क्योंकि प्रयोग करने योग्य विधियां प्रारूप के आधार पर भिन्न होती हैं। मुझे पता है कि आपको रिशेप पैकेज से melt()और साथ काम करना cast()होगा, लेकिन कुछ चीजें हैं जो मुझे नहीं मिलती …

32 data-transformation r

2

क्या एक तरफा चेबीशेव असमानता का एक नमूना संस्करण मौजूद है?

मुझे चेबीशेव असमानता के निम्नलिखित एक तरफा कैंटेली के संस्करण में दिलचस्पी है : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. मूल रूप से, यदि आप जनसंख्या के माध्य और विचरण को जानते हैं, तो आप एक निश्चित मान को देखने की संभावना …

32 probability mathematical-statistics probability-inequalities mean

2

रेटिंग के लिए आत्मविश्वास अंतराल कैसे खोजें?

इवान मिलर की " औसत रेटिंग के आधार पर छाँटने का तरीका नहीं " रेटेड वस्तुओं के लिए एक समझदार कुल "स्कोर" प्राप्त करने के लिए आत्मविश्वास अंतराल के निचले हिस्से का उपयोग करने का प्रस्ताव है। हालाँकि, यह एक बर्नौली मॉडल के साथ काम कर रहा है: रेटिंग्स या …

32 confidence-interval estimation

6

मोटे तौर पर सामान्य वितरण के पैमाने का अनुमान लगाने के लिए एक मजबूत बायेसियन मॉडल क्या होगा?

पैमाने के कई मजबूत अनुमानक मौजूद हैं । एक उल्लेखनीय उदाहरण मंझला निरपेक्ष विचलन जो मानक विचलन से संबंधित है के रूप में है σ=MAD⋅1.4826σ=MAD⋅1.4826\sigma = \mathrm{MAD}\cdot1.4826 । एक बायेसियन ढांचे में, मोटे तौर पर सामान्य वितरण के स्थान का अनुमान लगाने के लिए कई तरीके मौजूद हैं (जैसे कि …

32 r bayesian estimation standard-deviation robust

3

SVM से परिवर्तनीय महत्व

एसवीएम का उपयोग करके एक चर (विशेषता) महत्व कैसे प्राप्त करें?

32 machine-learning feature-selection svm

7

क्या कंप्यूटिंग के लिए एल्गोरिदम "रनिंग" लीनियर या लॉजिस्टिक रिग्रेशन पैरामीटर हैं?

Http://www.johndcook.com/standard_deviation.html पर एक पेपर "सटीक रूप से चल रहे विचरण" को दर्शाता है कि रनिंग माध्य, विचरण और मानक विचलन की गणना कैसे करें। क्या ऐसे एल्गोरिदम हैं जहां एक रेखीय या लॉजिस्टिक रिग्रेशन मॉडल के मापदंडों को उसी तरह "गतिशील रूप से" अपडेट किया जा सकता है, जैसा कि …

32 regression logistic online

2

सामान्य के अलावा अन्य वितरण जहां माध्य और विचरण स्वतंत्र हैं

मैं सोच रहा था कि क्या कोई वितरण सामान्य के अलावा जहां माध्य और विचरण एक दूसरे से स्वतंत्र हैं (या दूसरे शब्दों में, जहाँ विचरण माध्य का कार्य नहीं है)।

32 distributions

4

द्विपद डेटा पर एनोवा

मैं एक प्रयोगात्मक डेटा सेट का विश्लेषण कर रहा हूं। डेटा में उपचार प्रकार और द्विपद परिणाम के युग्मित वेक्टर होते हैं: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... परिणाम कॉलम में, 1 सफलता को दर्शाता है और 0 विफलता को दर्शाता है। मैं …

32 logistic anova binomial experiment-design

12

समझ के लिए सबसे कठिन सांख्यिकीय अवधारणा क्या है?

यह यहाँ के लिए एक समान प्रश्न है , लेकिन अलग अलग मुझे लगता है कि सार्थक पूछना है। मैंने सोचा था कि मैं एक स्टार्टर के रूप में काम करूंगा, जो मुझे लगता है कि सबसे मुश्किल में से एक है। मेरा संभाव्यता और आवृत्ति के बीच का अंतर …

32 teaching

5

मॉडलिंग अनुदैर्ध्य डेटा जहां समय का प्रभाव व्यक्तियों के बीच कार्यात्मक रूप में भिन्न होता है

प्रसंग : कल्पना कीजिए कि आपके पास एक अनुदैर्ध्य अध्ययन था जिसने 200 प्रतिभागियों पर 20 सप्ताह के लिए सप्ताह में एक बार एक आश्रित चर (डीवी) को मापा। हालांकि मुझे सामान्य, विशिष्ट DV में दिलचस्पी है कि मैं नौकरी के प्रदर्शन को भाड़े पर या नैदानिक मनोविज्ञान के हस्तक्षेप …

32 repeated-measures random-effects-model latent-class

6

पाठ का सांख्यिकीय वर्गीकरण

मैं सांख्यिकीय पृष्ठभूमि के बिना एक प्रोग्रामर हूं, और मैं वर्तमान में बड़ी संख्या में विभिन्न दस्तावेजों के लिए विभिन्न वर्गीकरण विधियों को देख रहा हूं जिन्हें मैं पूर्व-परिभाषित श्रेणियों में वर्गीकृत करना चाहता हूं। मैं केएनएन, एसवीएम और एनएन के बारे में पढ़ रहा हूं। हालाँकि, मुझे कुछ परेशानी …

32 classification information-retrieval text-mining