सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

7
यादृच्छिक प्रभाव कारक के लिए समूहों की न्यूनतम अनुशंसित संख्या क्या है?
मैं कुछ दोहराया उपायों डेटा का विश्लेषण करने के लिए R( lme4) में एक मिश्रित मॉडल का उपयोग कर रहा हूं । मेरे पास एक प्रतिक्रिया चर (मल की फाइबर सामग्री) और 3 निश्चित प्रभाव (शरीर द्रव्यमान, आदि) हैं। मेरे अध्ययन में केवल 6 प्रतिभागी हैं, प्रत्येक के लिए 16 …


2
सिंथेटिक डेटा सेट बनाने के लिए कुछ मानक अभ्यास क्या हैं?
संदर्भ के रूप में: जब एक बहुत बड़े डेटा सेट के साथ काम करते हैं, तो मुझे कभी-कभी पूछा जाता है कि क्या हम एक सिंथेटिक डेटा सेट बना सकते हैं, जहां हम भविष्यवक्ताओं और प्रतिक्रिया चर के बीच संबंध या भविष्यवक्ताओं के बीच संबंधों को "जानते" हैं। इन वर्षों …

4
क्या ग्रिडलाइन्स और ग्रे बैकग्राउंड चार्टजंक हैं और क्या उन्हें केवल एक अपवाद के आधार पर उपयोग किया जाना चाहिए?
ऐसा लगता है कि अधिकांश अधिकारी इस बात से सहमत हैं कि भूखंडों में अंधेरे या अन्यथा प्रमुख ग्रिडलाइन्स किसी भी उचित परिभाषा द्वारा "चार्टजंक" हैं और चार्ट के मुख्य शरीर में संदेश से दर्शक को विचलित करते हैं। इसलिए मैं उस बिंदु पर संदर्भ देने की जहमत नहीं उठाऊंगा। …

9
लॉजिस्टिक रिग्रेशन-आधारित मॉडल की सटीकता को मापना
मेरे पास एक प्रशिक्षित लॉजिस्टिक रिग्रेशन मॉडल है जिसे मैं एक परीक्षण डेटा सेट पर लागू कर रहा हूं। आश्रित चर द्विआधारी (बूलियन) है। परीक्षण डेटा सेट में प्रत्येक नमूने के लिए, मैं एक% संभावना उत्पन्न करने के लिए लॉजिस्टिक रिग्रेशन मॉडल लागू करता हूं जो निर्भर चर सत्य होगा। …

3
MANOVA और बार-बार मापा जाने वाला अंतर ANOVA?
कुछ कारक (प्रायोगिक स्थिति कहते हैं) और एक MANOVA पर दोहराया उपायों एनोवा के बीच क्या अंतर है? विशेष रूप से एक वेबसाइट पर मैंने सुझाव दिया है कि MANOVA गोलाकार की समान धारणा नहीं बनाता है जो बार-बार ANOVA करता है, क्या यह सच है? यदि ऐसा है, तो …

6
वर्ष 1300 में जन्मे किसी व्यक्ति विशेष से मेरा अवतरण होने की कितनी संभावना है?
दूसरे शब्दों में, निम्नलिखित पर आधारित है, पी क्या है? मानवविज्ञान या सामाजिक विज्ञान के बजाय इसे गणित की समस्या बनाने के लिए और समस्या को सरल बनाने के लिए, यह मान लें कि साथियों को आबादी में समान संभावना के साथ चुना जाता है, सिवाय इसके कि भाई-बहन और …

3
क्या यह बहुत छोटे नमूने के आकार (जैसे, n = 6) के साथ सामान्यता के लिए परीक्षण करने के लिए सार्थक है?
मेरे पास एक नमूना का आकार है 6. ऐसे मामले में, क्या कोलमोगोरोव-स्मिरनोव परीक्षण का उपयोग करके सामान्यता के लिए परीक्षण करना समझ में आता है? मैंने SPSS का उपयोग किया। मेरे पास बहुत छोटा नमूना आकार है क्योंकि प्रत्येक को प्राप्त करने में समय लगता है। यदि यह समझ …

4
याहू वित्त से आर में स्टॉक मूल्य आयात करें?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मैं याहू फाइनेंस से "लास्ट ट्रेड" स्टॉक मूल्य को आर में आयात करना चाहूंगा। इरादा लगभग …
26 r 

3
आर के साथ लगे एक नकारात्मक द्विपद प्रतिगमन में थीटा क्या है?
मुझे एक नकारात्मक द्विपद प्रतिगमन के विषय में एक प्रश्न मिला है: मान लीजिए कि आपके पास निम्नलिखित आदेश हैं: require(MASS) attach(cars) mod.NB<-glm.nb(dist~speed) summary(mod.NB) detach(cars) (ध्यान दें कि कारें एक डेटासेट है जो R में उपलब्ध है, और मुझे वास्तव में कोई परवाह नहीं है अगर यह मॉडल समझ में …

2
वितरण करता है
मैं दूसरे दिन इस घनत्व में भाग गया। क्या किसी ने इसे नाम दिया है? f(x)=log(1+x−2)/2πf(x)=log⁡(1+x−2)/2πf(x) = \log(1 + x^{-2}) / 2\pi घनत्व मूल में अनंत है और इसमें वसा की पूंछ भी है। मैंने देखा कि इसे एक संदर्भ में एक पूर्व वितरण के रूप में इस्तेमाल किया गया …

1
R में कोई व्यक्ति अनुभवजन्य रूप से कैसे प्रदर्शित कर सकता है कि A-BIC में कौन-सी क्रॉस-मान्यता विधियाँ समतुल्य हैं?
इस साइट पर कहीं और एक सवाल में , कई जवाबों में उल्लेख किया गया है कि एआईसी छुट्टी-एक-आउट (एलओयू) क्रॉस-मान्यता के बराबर है और बीआईसी के-फोल्ड क्रॉस सत्यापन के बराबर है। क्या R में इसे अनुभवजन्य रूप से प्रदर्शित करने का एक तरीका है कि LOO और K-fold में …
26 r  aic  cross-validation  bic 

7
मैट्रिक्स के स्तंभों के बीच रैखिक निर्भरता के लिए परीक्षण
मेरे पास सुरक्षा रिटर्न का सहसंबंध मैट्रिक्स है जिसका निर्धारक शून्य है। (नमूना सहसंबंध मैट्रिक्स के बाद से यह थोड़ा आश्चर्यजनक है और संबंधित सहसंयोजक मैट्रिक्स सैद्धांतिक रूप से सकारात्मक होना चाहिए।) मेरी परिकल्पना यह है कि कम से कम एक सुरक्षा अन्य प्रतिभूतियों पर रैखिक रूप से निर्भर है। …

4
RANSAC को सबसे अधिक व्यापक रूप से आंकड़ों में उपयोग क्यों नहीं किया जाता है?
कंप्यूटर विज़न के क्षेत्र से आने वाले, मैंने अक्सर मॉडल के फिटिंग के लिए RANSAC (रैंडम सैंपल कंसैन्स ) विधि का इस्तेमाल किया है जिसमें बहुत सारे आउटलेयर के साथ डेटा हो। हालाँकि, मैंने कभी इसे सांख्यिकीविदों द्वारा उपयोग नहीं किया है, और मैं हमेशा इस धारणा के तहत रहा …

3
आर के पोल फ़ंक्शन (लॉजिस्टिक रिग्रेशन का आदेश दिया गया) से आउटपुट कैसे समझें?
मैं आर के लिए नया हूं, लॉजिस्टिक रिग्रेशन का आदेश दिया है, और polr। पोल के लिए मदद पृष्ठ के नीचे "उदाहरण" खंड (जो एक आदेशित कारक प्रतिक्रिया के लिए लॉजिस्टिक या प्रोबिट रिग्रेशन मॉडल को फिट करता है) दिखाता है options(contrasts = c("contr.treatment", "contr.poly")) house.plr <- polr(Sat ~ Infl …
26 r  logistic 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.