सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
संभाव्यता के उत्पाद की संभावना बनाम प्रवेश करें
इस विकिपीडिया लेख के अनुसार , कम्प्यूटेशन को अधिक कम्प्यूटेशनल रूप से इष्टतम बनाने के x⋅yरूप में संभावनाओं के उत्पाद का प्रतिनिधित्व कर सकता है -log(x) - log(y)। लेकिन अगर मैं एक उदाहरण कहने की कोशिश करूँ: p1 = 0.5 p2 = 0.5 p1 * p2 = 0.25 -log(p1) - …

2
डेटा अनुपात और साजिश पृष्ठभूमि के लिए स्याही
मैंने देखा है कि कई "स्टेट ऑफ़ द आर्ट" प्लॉटिंग पैकेज और थीम और कई प्रतिष्ठित डेटा लोग अपने प्लॉट के लिए ग्रे बैकग्राउंड का उपयोग करते हैं। यहाँ कई उदाहरण हैं: ggplot2: नैट सिल्वर की पांचवीं कद: ऊपर के पहले उदाहरण (ggplot2) में, कोई यह तर्क दे सकता है …

3
संरचनात्मक अर्थमिति पर परिचयात्मक ग्रंथ
हाल के वर्षों में अर्थमिति के मुकाबले संरचनात्मक दृष्टिकोण अर्थमिति की तुलना में कम लोकप्रिय हुआ है। इसमें ब्याज के मापदंडों का अनुमान लगाने के लिए सैद्धांतिक आर्थिक मॉडल और आंकड़ों का तंग संयोजन शामिल है। जिस तरह से हम डेटा और सांख्यिकीय विधियों का उपयोग करते हैं, उसमें अधिक …

1
क्या हम आउटलेर्स को प्रकट करने के लिए एक बाहर का मतलब और मानक विचलन का उपयोग कर सकते हैं?
मान लीजिए कि मैंने सामान्य रूप से डेटा वितरित किया है। डेटा के प्रत्येक तत्व के लिए मैं यह जांचना चाहता हूं कि यह कितने एसडी से मतलब से दूर है। डेटा में एक बहिर्वाह हो सकता है (केवल एक ही हो सकता है, लेकिन यह भी दो या तीन …

1
क्या गिब्स सैम्पलिंग एल्गोरिथ्म विस्तृत संतुलन की गारंटी देता है?
मेरे पास सर्वोच्च अधिकार 1 पर है कि गिब्स सैंपलिंग मार्कोव चेन मोंटे कार्लो नमूना के लिए मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम का एक विशेष मामला है। एमएच एल्गोरिदम हमेशा विस्तृत शेष संपत्ति के साथ एक संक्रमण संभावना देता है; मुझे उम्मीद है कि गिब्स को भी चाहिए। तो निम्नलिखित सरल मामले में …
17 mcmc  gibbs 

3
मॉडल निर्माण और होस्मेर एट अल का उपयोग करके चयन। 2013. एप्लाइड लॉजिस्टिक रिग्रेशन आर में
यह StackExchange पर मेरी पहली पोस्ट है, लेकिन मैं इसे काफी समय से संसाधन के रूप में उपयोग कर रहा हूं, मैं उचित प्रारूप का उपयोग करने और उचित संपादन करने के लिए अपनी पूरी कोशिश करूंगा। साथ ही, यह एक बहु-भाग प्रश्न है। मुझे यकीन नहीं था कि मुझे …

1
एआर की स्थिरता के लिए एक प्रमाण (2)
एक मतलब केंद्रित एआर (2) प्रक्रिया पर विचार Xt=ϕ1Xt−1+ϕ2Xt−2+ϵtXt=ϕ1Xt−1+ϕ2Xt−2+ϵtX_t=\phi_1X_{t-1}+\phi_2X_{t-2}+\epsilon_t जहां ϵtϵt\epsilon_t मानक सफेद शोर प्रक्रिया है। बस सादगी की खातिर मुझे फोन करते हैं ϕ1=bϕ1=b\phi_1=b और ϕ2=aϕ2=a\phi_{2}=a । विशेषताओं की जड़ों पर ध्यान केंद्रित समीकरण मुझे मिल गया z1,2=−b±b2+4a−−−−−−√2az1,2=−b±b2+4a2az_{1,2}=\frac{-b\pm\sqrt{b^2+4a}}{2a} पाठ्यपुस्तकों में शास्त्रीय स्थिति निम्नलिखित हैं:{|a|&lt;1a±b&lt;1{|a|&lt;1a±b&lt;1\begin{cases}|a|<1 \\ a\pm b<1 \end{cases} मैं …

1
लॉजिस्टिक रिग्रेशन: एक संतृप्त मॉडल कैसे प्राप्त करें
मैं सिर्फ लॉजिस्टिक रिग्रेशन के लिए डिवोर्स उपाय के बारे में पढ़ता हूं। हालाँकि, वह भाग जिसे संतृप्त मॉडल कहा जाता है, मेरे लिए स्पष्ट नहीं है। मैंने एक व्यापक Google खोज की, लेकिन किसी भी परिणाम ने मेरे प्रश्न का उत्तर नहीं दिया। अब तक मुझे पता चला है …

1
लॉजिस्टिक रिग्रेशन बनाम ऑग्मेंटेड वैरिएबल पूर्वाग्रह बनाम साधारण से कम वर्ग के प्रतिगमन में वैरिएबल वैरिएबल बायस
मेरे पास लॉजिस्टिक और लीनियर रिग्रेशन में छोड़े गए वैरिएबल पूर्वाग्रह के बारे में एक सवाल है। कहो कि मैं एक रैखिक प्रतिगमन मॉडल से कुछ चर को छोड़ देता हूं। यह बताएं कि जो छोड़े गए चर मेरे मॉडल में शामिल चर के साथ असंबंधित हैं। उन छोड़े गए …

2
भारित प्रमुख घटक विश्लेषण
कुछ खोज के बाद, मुझे मुख्य घटकों के विश्लेषण में अवलोकन भार / माप त्रुटियों के समावेश पर बहुत कम लगता है। वेटिंग (उदाहरण के लिए, यहाँ ) को शामिल करने के लिए मुझे क्या करना चाहिए । मेरा प्रश्न यह है कि यह दृष्टिकोण क्यों आवश्यक है? हम भारित …

3
क्या गैर-शून्य सहसंबंध का अर्थ निर्भरता है?
हम इस तथ्य को जानते हैं कि शून्य सहसंबंध स्वतंत्रता का अर्थ नहीं है। मैं एक गैर शून्य सहसंबंध निर्भरता का अर्थ है कि क्या में दिलचस्पी है - यानी अगर Corr(X,Y)≠0Corr(X,Y)≠0\text{Corr}(X,Y)\ne0 कुछ यादृच्छिक चर के लिए XXX और YYY , हम सामान्य रूप में कह सकते हैं कि fX,Y(x,y)≠fX(x)fY(y)fX,Y(x,y)≠fX(x)fY(y)f_{X,Y}(x,y) …

3
चरम बहिर्वाह के साथ बॉक्स प्लॉट कैसे प्रस्तुत करें?
मैं कुछ डेटा प्रस्तुत करने के बारे में कुछ मार्गदर्शन का उपयोग कर सकता हूं। यह पहला कथानक साइटोकाइन IL-10 के लिए केस-कंट्रोल तुलना है। मैंने डेटा का 99% शामिल करने के लिए मैन्युअल रूप से y अक्ष निर्धारित किया है। मैंने इसे मैन्युअल रूप से सेट करने का कारण …

3
एक अंतराल के भीतर एक वितरण के बाद यादृच्छिक संख्या उत्पन्न करें
मुझे अंतराल भीतर सामान्य वितरण के बाद यादृच्छिक संख्या उत्पन्न करने की आवश्यकता है । (मैं आर। में काम कर रहा हूं)(a,b)(a,b)(a,b) मुझे पता है कि फ़ंक्शन rnorm(n,mean,sd)सामान्य वितरण के बाद यादृच्छिक संख्या उत्पन्न करेगा, लेकिन उसके भीतर अंतराल की सीमा कैसे निर्धारित करें? क्या उसके लिए कोई विशेष आर …

3
नमूना बड़ा होने पर माध्य का अनुमान लगाने के लिए टी-वितरण का उपयोग क्यों नहीं किया जाता है?
बेसिक स्टैटिस्टिक्स कोर्स अक्सर एक सामान्य डिस्ट्रीब्यूशन का उपयोग करके जनसंख्या पैरामीटर के माध्य का अनुमान लगाने के लिए सुझाव देते हैं जब नमूना आकार n बड़ा होता है (आमतौर पर 30 या 50 से अधिक)। छात्र के टी-वितरण का उपयोग नमूना के मानक विचलन में अनिश्चितता के लिए छोटे …

3
सहसंबंध के साथ जुड़े सहसंबंध के वास्तविक उदाहरण
मैं विशिष्ट, वास्तविक मामलों की तलाश कर रहा हूं जिनमें एक कारण संबंध अनुचित रूप से एक सहसंबंध के सबूत से प्रभावित था। विशेष रूप से, मैं निम्नलिखित मानदंडों को पूरा करने वाले उदाहरणों में दिलचस्पी लेता हूं: कारण संबंध के अस्तित्व को व्यापक रूप से पर्याप्त रूप से स्वीकार्य …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.