सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
एलएसए बनाम पीसीए (दस्तावेज़ क्लस्टरिंग)
मैं दस्तावेज़ क्लस्टरिंग में उपयोग की जाने वाली विभिन्न तकनीकों की जांच कर रहा हूं और मैं पीसीए (प्रमुख घटक विश्लेषण) और एलएसए (अव्यक्त अर्थ विश्लेषण) से संबंधित कुछ संदेह दूर करना चाहूंगा। पहली बात - उनके बीच क्या अंतर हैं? मुझे पता है कि पीसीए में, एसवीडी अपघटन टर्म-कोवरियन …

2
Bayesian फिट परीक्षण की एक सामान्य अच्छाई के बराबर क्या है?
मेरे पास दो डेटा सेट हैं, एक भौतिक प्रेक्षणों (तापमान) के सेट से, और एक संख्यात्मक मॉडल के एक समूह से। मैं एक आदर्श-मॉडल विश्लेषण कर रहा हूं, मान लें कि मॉडल पहनावा एक सच्चे, स्वतंत्र नमूने का प्रतिनिधित्व करता है, और यह देखने के लिए कि क्या वितरण उस …

1
Calinski & Harabasz (CH) मानदंड का एक स्वीकार्य मूल्य क्या है?
मैंने एक डेटा विश्लेषण किया है जो आर और किमील पैकेज का उपयोग करके अनुदैर्ध्य डेटा को क्लस्टर करने की कोशिश कर रहा है । मेरे डेटा में लगभग 400 व्यक्तिगत प्रक्षेपवक्र शामिल हैं (जैसा कि इसे पेपर में कहा जाता है)। आप निम्न चित्र में मेरे परिणाम देख सकते …

1
आरएल में एक जीएलएम के बाद कारकों के स्तर की तुलना करना
यहाँ मेरी स्थिति के बारे में एक छोटी पृष्ठभूमि है: मेरा डेटा एक शिकारी द्वारा सफलतापूर्वक खाए गए शिकार की संख्या को संदर्भित करता है। जैसा कि प्रत्येक परीक्षण में शिकार की संख्या सीमित (25 उपलब्ध) होती है, मेरे पास एक कॉलम "नमूना" उपलब्ध शिकार की संख्या का प्रतिनिधित्व करता …

3
आर उत्पादन (तैनात) कोड के लिए व्यवहार्य है
मैंने कई लेख पढ़े हैं जो अनुसंधान के लिए R का उपयोग करके Google, Facebook और कई अन्य कंपनियों के बारे में बात करते हैं। मैंने जिस दूसरे परिदृश्य के बारे में पढ़ा है, वह है एक एनालिटिक्स सॉल्यूशन का प्रोटोटाइप तैयार करने के लिए आर का इस्तेमाल करने वाली …
25 r  references 

6
सांख्यिकीय ग्राफिक्स के लिए एक "हैलो, दुनिया" है?
कंप्यूटर प्रोग्रामिंग में, एक नई भाषा या प्रणाली सीखने / सिखाने के लिए एक क्लासिक पहला कार्यक्रम है, जिसे "हैलो, वर्ल्ड" कहा जाता है। http://en.wikipedia.org/wiki/Hello_world_program क्या रेखांकन पैकेज का उपयोग करने के लिए एक क्लासिक पहला डेटा दृश्य है? यदि ऐसा है, तो ये क्या है? और यदि नहीं, तो …

2
जोएल स्पोल्स्की का "हंट ऑफ़ द स्नार्क" पोस्ट वैध सांख्यिकीय सामग्री विश्लेषण है?
यदि आप हाल ही में सामुदायिक बुलेटिन पढ़ रहे हैं, तो आपने संभवतः द हंटिंग ऑफ द स्नार्क को देखा है, जो स्टैकएक्सचेंज नेटवर्क के सीईओ जोएल स्पोल्स्की द्वारा आधिकारिक स्टैकएक्सचेंज ब्लॉग पर एक पोस्ट है । वह बाहरी उपयोगकर्ता के दृष्टिकोण से उनकी "मित्रता" का मूल्यांकन करने के लिए …

5
कॉपुलस पर परिचयात्मक पठन
पिछले कुछ समय से, मैं अपने सेमिनार के लिए कोपल्स पर एक अच्छी परिचयात्मक पढ़ने की तलाश में हूँ। मुझे बहुत सारी सामग्री मिल रही है जो सैद्धांतिक पहलुओं के बारे में बात करती है, जो अच्छा है, लेकिन इससे पहले कि मैं उन पर आगे बढ़ूं मैं विषय पर …

2
सट्टेबाजी के घर कैसे खेलों के लिए सट्टेबाजी की बाधाओं को निर्धारित करते हैं?
उदाहरण के लिए फुटबॉल (सॉकर) लें। 3 संभावित परिणाम हैं, घरेलू जीत, ड्रा, दूर जीत। मैंने bet365 से एक यादृच्छिक गेम लिया Turkey vs Ukraine hwin, draw, awin 2.20 3.40 3.20 तो दिए गए परिणाम पर 100 $ के निवेश के लिए , आप या तो 100 $ ढीले होंगे …

6
तंत्रिका नेटवर्क छवियों को कैसे पहचानता है?
इस सवाल को स्टैक ओवरफ्लो से माइग्रेट किया गया क्योंकि इसका जवाब क्रॉस वैलिडेट पर दिया जा सकता है। 7 साल पहले पलायन कर गए । मैं यह जानने की कोशिश कर रहा हूं कि न्यूरल नेटवर्क छवि मान्यता पर कैसे काम करता है। मैंने कुछ उदाहरण देखे हैं और …

3
इस विषम-आकार के वितरण को कैसे मॉडल करें (लगभग एक रिवर्स-जे)
नीचे दिखाया गया मेरा आश्रित चर किसी भी स्टॉक वितरण के लायक नहीं है जिसे मैं जानता हूं। रैखिक प्रतिगमन कुछ गैर-सामान्य, दाएं-तिरछी अवशिष्ट का उत्पादन करता है जो कि एक विषम तरीके (2 भूखंड) में अनुमानित वाई से संबंधित है। परिवर्तनों के लिए कोई सुझाव या अन्य तरीके सबसे …

1
क्वांटाइल प्रतिगमन के लिए कौन से नैदानिक ​​भूखंड मौजूद हैं?
ओएलएस के लिए मेरे सवाल के बाद , मुझे आश्चर्य है: क्वांटाइल प्रतिगमन के लिए कौन से नैदानिक ​​भूखंड मौजूद हैं? (और क्या उनके आर कार्यान्वयन हैं?) एक त्वरित Google खोज पहले से ही कृमि साजिश के साथ आया था (जिसके बारे में मैंने पहले कभी नहीं सुना है), और …

3
आर में एक समय श्रृंखला की चिकनाई कैसे मापें?
आर में एक समय श्रृंखला की चिकनाई को मापने का एक अच्छा तरीका है? उदाहरण के लिए, -1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0 की तुलना में बहुत चिकनी है -1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0 हालांकि उनका एक ही मतलब …
25 r  time-series 


3
विचलन के लिए कॉन्फिडेंस इंटरवल ने एक अवलोकन दिया
यह "7 वीं कोलमोगोरोव स्टूडेंट ओलंपियाड इन प्रोबेबिलिटी थ्योरी" से एक समस्या है: एक ओपरेशन को एक डिस्ट्रीब्यूशन के साथ दोनों पैरामीटर्स के अनजाने में दिए जाने से, कम से कम 99% कॉन्फिडेंस लेवल के साथ लिए एक कॉन्फिडेंस इंटरवल देते हैं ।सामान्य ( μ , σ 2 ) σ …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.