सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

5
आइटम प्रतिक्रिया सिद्धांत और क्या सॉफ़्टवेयर का उपयोग करने के साथ आरंभ करने के लिए कैसे?
प्रसंग मैं आइटम प्रतिक्रिया सिद्धांत के बारे में पढ़ रहा हूं, और मुझे यह आकर्षक लगता है। मेरा मानना ​​है कि मैं मूल बातें समझता हूं, लेकिन मैं यह सोचकर बचा हूं कि क्षेत्र से संबंधित सांख्यिकीय तकनीकों को कैसे लागू किया जाए। नीचे दो लेख दिए गए हैं, जो …

1
समय श्रृंखला के लिए तार्किक प्रतिगमन
मैं पिछले डेटा को देखते हुए डेटा के निर्भर चर (यानी पंक्ति) के मूल्य का अनुमान लगाने के लिए स्ट्रीमिंग डेटा (बहुआयामी समय श्रृंखला) के संदर्भ में एक बाइनरी लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करना चाहूंगा। जहां तक ​​मुझे पता है, लॉजिस्टिक रिग्रेशन को पारंपरिक रूप से पोस्टमॉर्टम विश्लेषण के …

3
दैनिक डेटा के साथ Auto.arima: मौसमी / आवधिकता पर कब्जा कैसे करें?
मैं एक ARIMA मॉडल को दैनिक समय श्रृंखला में फिट कर रहा हूं। डेटा को दैनिक रूप से 02-01-2010 से 30-07-2011 तक एकत्र किया जाता है और अखबार की बिक्री के बारे में होता है। चूंकि बिक्री में एक साप्ताहिक पैटर्न पाया जा सकता है (बिकने वाली प्रतियों की दैनिक …

1
डेटा के लिए एक घातीय मॉडल फिटिंग
इस सवाल को स्टैक ओवरफ्लो से माइग्रेट किया गया क्योंकि इसका जवाब क्रॉस वैलिडेट पर दिया जा सकता है। 8 साल पहले पलायन कर गए । मेरे पास 2 चर हैं, दोनों "वर्ग" से: > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 > head(x) [1] 59.32820 68.46436 80.76974 132.90824 …
21 r 

5
उच्च पी मान के साथ मजबूत सहसंबंध गुणांक का उदाहरण
मैं सोच रहा था, क्या उच्च पी मान (जैसे .25 या अधिक) के साथ एक बहुत मजबूत सहसंबंध गुणांक (कहना। 9 या अधिक) होना संभव है? यहाँ उच्च पी मान के साथ कम सहसंबंध गुणांक का एक उदाहरण दिया गया है: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor …

4
Google से प्रासंगिक सहसंबंध और कार्य के बीच अंतर किस सीमा तक है?
प्रसंग इस साइट पर एक लोकप्रिय सवाल " सामान्य सांख्यिकीय पाप क्या हैं? "। उल्लेख किए गए पापों में से एक यह मान रहा है कि "सहसंबंध का अर्थ कार्य ..." लिंक है फिर, 5 अपवोट के साथ टिप्पणियों में यह सुझाव दिया गया है कि: "Google $ 65B को …

3
क्या सहज रूप से "पूर्वाग्रह" है?
मैं रैखिक प्रतिगमन विश्लेषण के संदर्भ में पूर्वाग्रह की अवधारणा को समझने के लिए संघर्ष कर रहा हूं। पूर्वाग्रह की गणितीय परिभाषा क्या है? क्या वास्तव में पक्षपाती है और क्यों / कैसे? उदाहरण?

1
एक उलटा विसारत वितरित मैट्रिक्स के विकर्ण का सीमांत वितरण
मान लीजिए कि । मैं विकर्ण तत्वों के सीमांत वितरण में रुचि रखता हूं । के सबमैट्रिस के वितरण पर कुछ सरल परिणाम हैं (कम से कम कुछ विकिपीडिया पर सूचीबद्ध हैं)। इससे मैं यह पता लगा सकता हूं कि विकर्ण पर किसी एक तत्व का सीमांत वितरण गामा के …

4
क्या निर्णय के पेड़ लगभग हमेशा द्विआधारी पेड़ होते हैं?
लगभग हर निर्णय पेड़ उदाहरण मैं भर में आया है एक द्विआधारी पेड़ होने के लिए होता है। क्या यह बहुत सार्वभौमिक है? क्या अधिकांश मानक एल्गोरिदम (C4.5, CART, आदि) केवल बाइनरी पेड़ों का समर्थन करते हैं? मैं जो इकट्ठा करता हूं, उससे CHAID बाइनरी पेड़ों तक सीमित नहीं है, …

2
आर में फ़ंक्शन एलएम में वजन का उपयोग कैसे करें?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। क्या कोई weightsआर के lmसमारोह में तर्क का उपयोग करने के बारे में कुछ संकेत दे …
21 r  regression 

2
प्रतिगमन में रैखिकता का परीक्षण करने में कठिनाई
में सांख्यिकीय मॉडलिंग: दो संस्कृतियों लिओ ब्रामान लिखते हैं वर्तमान लागू अभ्यास अच्छाई-से-फिट परीक्षण और अवशिष्ट विश्लेषण का उपयोग करके डेटा मॉडल फिट की जांच करना है। एक बिंदु पर, कुछ साल पहले, मैंने सात आयामों में गैर-नियमन की नियंत्रित मात्रा के साथ एक नकली प्रतिगमन समस्या की स्थापना की। …

3
पॉसन प्रतिगमन बनाम लॉग-काउंट कम से कम वर्ग प्रतिगमन?
एक Poisson प्रतिगमन लॉग-लिंक फ़ंक्शन के साथ एक GLM है । गैर-सामान्य रूप से वितरित गणना डेटा को मॉडल करने का एक वैकल्पिक तरीका है लॉग को (या यों कहें, लॉग (1 + गिनती) को 0 को संभालने के लिए पूर्वप्रक्रमित करना)। यदि आप लॉग-काउंट प्रतिक्रियाओं पर कम से कम …

2
एल्गोरिदम सीखने के बीच कैसे चुनें
मुझे एक कार्यक्रम लागू करने की आवश्यकता है जो कुछ प्रशिक्षण डेटा के आधार पर रिकॉर्ड को 2 श्रेणियों (सच्चा / गलत) में वर्गीकृत करेगा, और मैं सोच रहा था कि मुझे किस एल्गोरिदम / कार्यप्रणाली को देखना चाहिए। उनमें से चुनने के लिए बहुत कुछ प्रतीत होता है - …

3
MaxEnt, ML, Bayes और अन्य प्रकार के सांख्यिकीय अनुमान विधियों के बीच तुलना
मैं किसी भी तरह से एक सांख्यिकीविद् नहीं हूँ (मैंने गणितीय आँकड़ों में एक कोर्स किया है, लेकिन इससे अधिक कुछ भी नहीं है), और हाल ही में, सूचना सिद्धांत और सांख्यिकीय यांत्रिकी का अध्ययन करते हुए, मैं "अनिश्चितता माप" / "एन्ट्रॉपी" नामक इस चीज से मिला। मैंने खिनचिन की …

7
टी-टेस्ट में एक नमूना में अंतर के विश्वास अंतराल की व्याख्या कैसे करें?
एसपीएसएस आउटपुट "अंतर अंतर के आत्मविश्वास अंतराल" प्रदान करता है। मैंने कुछ जगहों पर पढ़ा है कि इसका मतलब है "100 में से 95 बार, हमारे नमूने का अंतर इन सीमाओं के बीच होगा" मुझे यह अस्पष्ट लगता है। क्या कोई "अर्थ में अंतर के विश्वास अंतराल" को स्पष्ट करने …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.