सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

10
मतलब बनाम जुआरी के पतन का प्रतिगमन
एक ओर, मेरे पास माध्य के लिए प्रतिगमन है और दूसरी तरफ मेरे पास जुआरी की पतनशीलता है । जुआरी की पतनशीलता को मिलर और संजुर्जो (2019) ने "गलत धारणा के रूप में परिभाषित किया है कि बेतरतीब दृश्यों में उलटफेर की दिशा में एक व्यवस्थित प्रवृत्ति है, यानी कि …

2
भोले बे और बहुपद भोले बे के बीच अंतर
मैंने पहले Naive Bayes क्लासिफायर से निपटा है। मैं हाल ही में मल्टीनोमियल नाइव बेज़ के बारे में पढ़ रहा हूं । इसके अलावा पश्च संभावना = (पूर्व * संभावना) / (साक्ष्य) । केवल मुख्य अंतर (इन क्लासिफ़ायर प्रोग्रामिंग करते समय) मुझे Naive Bayes & Multinomial Naive Bayes के बीच …

1
कारक विश्लेषण में सर्वोत्तम कारक निष्कर्षण विधियाँ
SPSS कारक निष्कर्षण के कई तरीके प्रदान करता है: प्रमुख घटक (जो कारक विश्लेषण बिल्कुल नहीं है) कम से कम वर्ग सामान्यीकृत कम से कम वर्ग अधिकतम संभाव्यता मुख्य धुरी अल्फा फैक्टरिंग छवि फैक्टरिंग पहला तरीका अनदेखा करना, जो कि कारक विश्लेषण नहीं है (लेकिन प्रमुख घटक विश्लेषण, पीसीए), इनमें …

4
एल्गोरिदम को रिकॉर्ड की गई त्रुटियों में स्पाइक की पहचान करने का सरल तरीका
हमें एक प्रारंभिक चेतावनी प्रणाली की आवश्यकता है। मैं एक सर्वर के साथ काम कर रहा हूं जिसे लोड के तहत प्रदर्शन के मुद्दों के लिए जाना जाता है। एक डेटाबेस में टाइमस्टैम्प के साथ त्रुटियां दर्ज की जाती हैं। कुछ मैनुअल हस्तक्षेप कदम हैं जो सर्वर लोड को कम …

1
एक सांख्यिकीय मॉडल और एक संभावना मॉडल के बीच अंतर?
अनुप्रयुक्त संभाव्यता संगणनीय संभाव्यता सहित संभाव्यता में एक महत्वपूर्ण शाखा है। चूंकि आंकड़े डेटा से निपटने के लिए मॉडल के निर्माण के लिए संभाव्यता सिद्धांत का उपयोग कर रहे हैं, मेरी समझ के रूप में, मैं सोच रहा हूं कि सांख्यिकीय मॉडल और संभावना मॉडल के बीच आवश्यक अंतर क्या …

3
पॉइज़न वितरण सामान्य वितरण के लिए अलग कैसे है?
मैंने एक वेक्टर तैयार किया है जिसमें एक पॉइसन वितरण है, जो निम्नानुसार है: x = rpois(1000,10) यदि मैं एक हिस्टोग्राम का उपयोग करता हूं hist(x), तो वितरण एक परिचित घंटी के आकार के सामान्य वितरण जैसा दिखता है। हालांकि, कोलमोगोरोव-स्मरनॉफ परीक्षण का उपयोग करके ks.test(x, 'pnorm',10,3)कहा गया है कि …

1
सहसंबंधित मैट्रिक्स का SVD एडिटिव होना चाहिए लेकिन ऐसा प्रतीत नहीं होता है
मैं सिर्फ निम्नलिखित पेपर में किए गए दावे को दोहराने की कोशिश कर रहा हूं , जो जीन एक्सप्रेशन डेटा से संबंधित सहसंबंधी बिकलस्टर्स ढूंढ रहा है , जो है: प्रस्ताव 4. अगर । तो हमारे पास हैं:एक्समैंजम्मू= आरमैंसीटीजम्मूएक्समैंजम्मू=आरमैंसीजम्मूटीX_{IJ}=R_{I}C^{T}_{J} मैं। यदि एडिटिव मॉडल के साथ एक सही बाइक्लेस्टर है, तो …

2
आर में संक्रमण मैट्रिक्स (मार्कोव) की गणना करें
क्या आर (एक अंतर्निहित फ़ंक्शन) में एक तरीका है जो टिप्पणियों के एक सेट से मार्कोव श्रृंखला के लिए संक्रमण मैट्रिक्स की गणना करने के लिए है? उदाहरण के लिए, निम्नलिखित की तरह एक डेटा सेट लेना और पहले ऑर्डर ट्रांजिशन मैट्रिक्स की गणना करना? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = …
29 r  markov-process 

3
दो या अधिक प्रतिगमन मॉडल से ढलानों की तुलना करने के लिए मैं किस परीक्षण का उपयोग कर सकता हूं?
मैं एक भविष्यवक्ता को दो चर की प्रतिक्रिया में अंतर का परीक्षण करना चाहूंगा। यहाँ एक न्यूनतम प्रजनन योग्य उदाहरण है। library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- …

3
एक अच्छा गिब्स नमूना ट्यूटोरियल और संदर्भ
मैं सीखना चाहता हूं कि गिब्स सैंपलिंग कैसे काम करता है और मैं इंटरमीडिएट के पेपर के लिए एक अच्छे बेसिक की तलाश में हूं। मेरे पास एक कंप्यूटर विज्ञान पृष्ठभूमि और बुनियादी सांख्यिकीय ज्ञान है। किसी ने आसपास अच्छी सामग्री पढ़ी है? तुमने इसे कहाँ सीखा? धन्यवाद
29 references  gibbs 

2
नियमितीकरण या दंड के साथ एक ARIMAX मॉडल फिट करना (जैसे कि लासो, लोचदार नेट, या रिज प्रतिगमन के साथ)
मैं विभिन्न कॉवेरेट्स के साथ ARMAX मॉडल फिट करने के लिए पूर्वानुमान पैकेज में auto.arima () फ़ंक्शन का उपयोग करता हूं । हालाँकि, मेरे पास चयन करने के लिए अक्सर बड़ी संख्या में चर होते हैं और आमतौर पर एक अंतिम मॉडल होता है जो उनके सबसेट के साथ काम …

4
विषय मॉडलिंग / LDA के लिए R संकुल: सिर्फ `विषय-निर्माता` और` lda` [बंद]
यह मुझे लगता है कि केवल दो आर संकुल अव्यक्त डिरिचलेट आवंटन करने में सक्षम हैं : एक है lda, जोनाथन चांग द्वारा लिखित; और दूसरा topicmodelsबेट्टीना ग्रुन और कर्ट हॉर्निक द्वारा लिखा गया है। प्रदर्शन, कार्यान्वयन विवरण और एक्स्टेंसिबिलिटी के संदर्भ में इन दोनों पैकेजों के बीच क्या अंतर …

6
शापिरो-विल्क परीक्षण की व्याख्या
मैं आंकड़ों के लिए बहुत नया हूं और मुझे आपकी मदद की जरूरत है। मेरे पास एक छोटा सा नमूना है, इस प्रकार है: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 मैंने R का उपयोग करके शापिरो-विल्क परीक्षण चलाया: shapiro.test(precisionH4U$H4U) और मुझे निम्नलिखित परिणाम मिला: W = …

5
मैं एक भारित मानक विचलन की गणना कैसे करूं? एक्सेल में?
इसलिए, मेरे पास प्रतिशत का डेटा सेट है जैसे: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) मैं प्रतिशत का मानक विचलन खोजना चाहता हूं, लेकिन उनके डेटा वॉल्यूम के लिए भारित हूं। यानी, …

1
द्विआधारी डेटा पर प्रमुख घटक विश्लेषण या कारक विश्लेषण करना
मेरे पास बड़ी संख्या में हां / ना में कोई डेटासेट है। क्या मैं इस प्रकार के डेटा के लिए मुख्य घटकों (पीसीए) या किसी अन्य डेटा कटौती विश्लेषण (जैसे कारक विश्लेषण) का उपयोग कर सकता हूं? कृपया सलाह दें कि मैं SPSS का उपयोग करके ऐसा कैसे कर सकता …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.