सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
Ggplot2 में स्कैप्लॉट क्षेत्रों के आसपास साफ बहुभुज कैसे आकर्षित करें [बंद]
मैं स्कैटरप्लॉट पर बिंदुओं के समूह के चारों ओर एक साफ बहुभुज कैसे जोड़ सकता हूं? मैं ggplot2 का उपयोग कर रहा हूं, लेकिन के परिणामों से निराश हूं geom_polygon। टैब-सीमांकित पाठ फ़ाइल के रूप में डेटासेट वहाँ पर है । नीचे दिया गया ग्राफ देशों के एक समूह में …

1
एक समय पर मिश्रित प्रभाव मॉडल से अनुमानित मूल्यों के योग पर भिन्नता
मेरे पास एक मिश्रित प्रभाव वाला मॉडल है (वास्तव में एक सामान्यीकृत मिश्रित मॉडल है) जो मुझे समय के लिए भविष्यवाणियां देता है। ऑटोकरेलेशन को काउंटर करने के लिए, मैं एक corCAR1 मॉडल का उपयोग करता हूं, इस तथ्य को देखते हुए कि मेरे पास लापता डेटा है। डेटा मुझे …

1
R, NA को एक lm () गुणांक के रूप में क्यों लौटाएगा?
मैं एक lm()मॉडल को एक डेटा सेट में फिट कर रहा हूं जिसमें वित्तीय तिमाही (Q1, Q2, Q3) के लिए संकेतक शामिल हैं, जो Q4 को डिफ़ॉल्ट बनाते हैं)। का उपयोग करते हुए lm(Y~., data = data) मुझे NAQ3 के लिए गुणांक के रूप में मिलता है , और एक …
32 r  regression 

6
लॉजिस्टिक रिग्रेशन और न्यूरल नेटवर्क में क्या अंतर है?
हम दर्शकों को लॉजिस्टिक रिग्रेशन और न्यूरल नेटवर्क के बीच अंतर कैसे समझाते हैं जिनकी सांख्यिकी में कोई पृष्ठभूमि नहीं है?

5
R में चौड़े और लंबे प्रारूप के बीच डेटा कैसे बदलें? [बन्द है]
आपके पास विस्तृत प्रारूप या लंबे प्रारूप में डेटा हो सकता है। यह काफी महत्वपूर्ण बात है, क्योंकि प्रयोग करने योग्य विधियां प्रारूप के आधार पर भिन्न होती हैं। मुझे पता है कि आपको रिशेप पैकेज से melt()और साथ काम करना cast()होगा, लेकिन कुछ चीजें हैं जो मुझे नहीं मिलती …

2
क्या एक तरफा चेबीशेव असमानता का एक नमूना संस्करण मौजूद है?
मुझे चेबीशेव असमानता के निम्नलिखित एक तरफा कैंटेली के संस्करण में दिलचस्पी है : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. मूल रूप से, यदि आप जनसंख्या के माध्य और विचरण को जानते हैं, तो आप एक निश्चित मान को देखने की संभावना …

2
रेटिंग के लिए आत्मविश्वास अंतराल कैसे खोजें?
इवान मिलर की " औसत रेटिंग के आधार पर छाँटने का तरीका नहीं " रेटेड वस्तुओं के लिए एक समझदार कुल "स्कोर" प्राप्त करने के लिए आत्मविश्वास अंतराल के निचले हिस्से का उपयोग करने का प्रस्ताव है। हालाँकि, यह एक बर्नौली मॉडल के साथ काम कर रहा है: रेटिंग्स या …

6
मोटे तौर पर सामान्य वितरण के पैमाने का अनुमान लगाने के लिए एक मजबूत बायेसियन मॉडल क्या होगा?
पैमाने के कई मजबूत अनुमानक मौजूद हैं । एक उल्लेखनीय उदाहरण मंझला निरपेक्ष विचलन जो मानक विचलन से संबंधित है के रूप में है σ=MAD⋅1.4826σ=MAD⋅1.4826\sigma = \mathrm{MAD}\cdot1.4826 । एक बायेसियन ढांचे में, मोटे तौर पर सामान्य वितरण के स्थान का अनुमान लगाने के लिए कई तरीके मौजूद हैं (जैसे कि …


7
क्या कंप्यूटिंग के लिए एल्गोरिदम "रनिंग" लीनियर या लॉजिस्टिक रिग्रेशन पैरामीटर हैं?
Http://www.johndcook.com/standard_deviation.html पर एक पेपर "सटीक रूप से चल रहे विचरण" को दर्शाता है कि रनिंग माध्य, विचरण और मानक विचलन की गणना कैसे करें। क्या ऐसे एल्गोरिदम हैं जहां एक रेखीय या लॉजिस्टिक रिग्रेशन मॉडल के मापदंडों को उसी तरह "गतिशील रूप से" अपडेट किया जा सकता है, जैसा कि …

2
सामान्य के अलावा अन्य वितरण जहां माध्य और विचरण स्वतंत्र हैं
मैं सोच रहा था कि क्या कोई वितरण सामान्य के अलावा जहां माध्य और विचरण एक दूसरे से स्वतंत्र हैं (या दूसरे शब्दों में, जहाँ विचरण माध्य का कार्य नहीं है)।

4
द्विपद डेटा पर एनोवा
मैं एक प्रयोगात्मक डेटा सेट का विश्लेषण कर रहा हूं। डेटा में उपचार प्रकार और द्विपद परिणाम के युग्मित वेक्टर होते हैं: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... परिणाम कॉलम में, 1 सफलता को दर्शाता है और 0 विफलता को दर्शाता है। मैं …

12
समझ के लिए सबसे कठिन सांख्यिकीय अवधारणा क्या है?
यह यहाँ के लिए एक समान प्रश्न है , लेकिन अलग अलग मुझे लगता है कि सार्थक पूछना है। मैंने सोचा था कि मैं एक स्टार्टर के रूप में काम करूंगा, जो मुझे लगता है कि सबसे मुश्किल में से एक है। मेरा संभाव्यता और आवृत्ति के बीच का अंतर …
32 teaching 

5
मॉडलिंग अनुदैर्ध्य डेटा जहां समय का प्रभाव व्यक्तियों के बीच कार्यात्मक रूप में भिन्न होता है
प्रसंग : कल्पना कीजिए कि आपके पास एक अनुदैर्ध्य अध्ययन था जिसने 200 प्रतिभागियों पर 20 सप्ताह के लिए सप्ताह में एक बार एक आश्रित चर (डीवी) को मापा। हालांकि मुझे सामान्य, विशिष्ट DV में दिलचस्पी है कि मैं नौकरी के प्रदर्शन को भाड़े पर या नैदानिक ​​मनोविज्ञान के हस्तक्षेप …

6
पाठ का सांख्यिकीय वर्गीकरण
मैं सांख्यिकीय पृष्ठभूमि के बिना एक प्रोग्रामर हूं, और मैं वर्तमान में बड़ी संख्या में विभिन्न दस्तावेजों के लिए विभिन्न वर्गीकरण विधियों को देख रहा हूं जिन्हें मैं पूर्व-परिभाषित श्रेणियों में वर्गीकृत करना चाहता हूं। मैं केएनएन, एसवीएम और एनएन के बारे में पढ़ रहा हूं। हालाँकि, मुझे कुछ परेशानी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.