सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

10
क्या बायेसियन बनाम अक्सरवादी बहस के लिए कोई * गणितीय * आधार है?
यह विकिपीडिया पर कहता है कि: गणित [संभाव्यता] संभावना की किसी भी व्याख्या से काफी हद तक स्वतंत्र है। प्रश्न: तब यदि हम गणितीय रूप से सही होना चाहते हैं, तो क्या हमें संभाव्यता की किसी भी व्याख्या को अस्वीकार नहीं करना चाहिए ? यानी, बायेसियन और अक्सरवाद दोनों गणितीय …

2
स्वतंत्र घटक विश्लेषण और कारक विश्लेषण के बीच क्या संबंध है?
मैं स्वतंत्र घटक विश्लेषण (आईसीए) के लिए नया हूं और इस पद्धति की सिर्फ एक अल्पविकसित समझ है। यह मुझे लगता है कि आईसीए एक अपवाद के साथ फैक्टर एनालिसिस (एफए) के समान है: आईसीए मानता है कि मनाया यादृच्छिक चर स्वतंत्र घटकों / कारकों का एक रैखिक संयोजन है …

3
समय श्रृंखला विश्लेषण के लिए आवर्तक तंत्रिका नेटवर्क का उपयोग करने का उचित तरीका
आवर्तक तंत्रिका नेटवर्क इस तथ्य से "नियमित" लोगों से भिन्न होते हैं कि उनके पास "मेमोरी" परत है। इस परत के कारण, एन सी आर एनएन समय श्रृंखला मॉडलिंग में उपयोगी माना जाता है। हालांकि, मुझे यकीन नहीं है कि मैं सही तरीके से समझता हूं कि उनका उपयोग कैसे …

6
प्रायिकता बनाम लगभग सुनिश्चित अभिसरण में रूपांतरण
मैंने वास्तव में अभिसरण के इन दो उपायों के बीच के अंतर को कभी नहीं टटोला है। (या, वास्तव में, विभिन्न प्रकार के अभिसरण, लेकिन मैं इन दोनों का उल्लेख विशेष रूप से बड़ी संख्या के कमजोर और मजबूत कानूनों के कारण करता हूं।) ज़रूर, मैं प्रत्येक की परिभाषा को …

8
क्रमिक डेटा के लिए उपयोग करने के लिए अच्छे बुनियादी आँकड़े क्या हैं?
मेरे पास सर्वेक्षण के सवालों से प्राप्त कुछ क्रमिक डेटा हैं । मेरे मामले में वे लिकर शैली की प्रतिक्रियाएँ हैं (दृढ़ता से असहमत-असहमत-तटस्थ-सहमत-मजबूत-सहमत)। मेरे डेटा में उन्हें 1-5 के रूप में कोडित किया गया है। मुझे नहीं लगता कि इसका मतलब यहाँ बहुत होगा, इसलिए बुनियादी सारांश आँकड़े क्या …


1
क्या सहसंबंध एक मैट्रिक्स विलक्षण बनाता है और क्या विलक्षणता या निकट-विलक्षणता के निहितार्थ हैं?
मैं विभिन्न मैट्रिसेस (मुख्य रूप से लॉजिस्टिक रिग्रेशन) पर कुछ गणना कर रहा हूं और मुझे आमतौर पर "मैट्रिक्स एकवचन" में त्रुटि मिलती है, जहां मुझे वापस जाना पड़ता है और सहसंबद्ध चर को हटाना पड़ता है। यहाँ मेरा सवाल यह है कि आप "अति" सहसंबद्ध मैट्रिक्स पर क्या विचार …

5
कैसे वास्तव में सांख्यिकीविदों ने अनुकरण के बिना जनसंख्या विचरण के लिए निष्पक्ष अनुमानक के रूप में (n-1) का उपयोग करने के लिए सहमति व्यक्त की?
भाजक में कंप्यूटिंग संस्करण के लिए सूत्र है:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} मैंने हमेशा सोचा है कि क्यों। हालांकि, "क्यों" के बारे में कुछ अच्छे वीडियो पढ़ना और देखना, ऐसा लगता है, जनसंख्या विचरण का एक अच्छा निष्पक्ष अनुमानक है। जबकि कम आंकलन करता है और जनसंख्या विचरण …

5
पीसीए में लोडिंग बनाम ईजेनवेक्टर: एक या दूसरे का उपयोग कब करें?
प्रमुख घटक विश्लेषण (पीसीए) में, हम eigenvectors (यूनिट वैक्टर) और eigenvalues ​​प्राप्त करते हैं। अब, हम लोडिंग को रूप में परिभाषित करते हैंलोडिंग = eigenvectors ⋅ eigenvalues----------√।Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. मुझे पता है कि eigenvectors सिर्फ दिशाएं और लोडिंग हैं (जैसा कि ऊपर परिभाषित किया गया है) में इन …
67 pca 

4
क्या पीसीए के लिए गॉसियन कर्नेल इतना जादुई बनाता है, और सामान्य तौर पर भी?
मैं गॉसियन और बहुपद गुठली के साथ कर्नेल पीसीए ( 1 , 2 , 3 ) के बारे में पढ़ रहा था । गाऊसी कर्नेल अलग-अलग किसी भी प्रकार के गैर-डेटा डेटा को असाधारण रूप से अच्छी तरह से अलग कैसे करता है? कृपया एक सहज ज्ञान युक्त विश्लेषण दें, …

4
देखो और तुम पाओगे (सहसंबंध)
मेरे पास कई सौ माप हैं। अब, मैं हर उपाय के साथ हर उपाय को सहसंबद्ध करने के लिए कुछ प्रकार के सॉफ्टवेयर का उपयोग करने पर विचार कर रहा हूं। इसका मतलब है कि हजारों सहसंबंध हैं। इनमें (सांख्यिकीय रूप से) एक उच्च सहसंबंध होना चाहिए, भले ही डेटा …

7
कितना भुगतान करना है? एक व्यावहारिक समस्या
यह एक होम वर्क का सवाल नहीं है, बल्कि हमारी कंपनी के सामने आने वाली वास्तविक समस्या है। बहुत हाल ही में (2 दिन पहले) हमने एक डीलर को 10000 उत्पाद लेबल के निर्माण का आदेश दिया। डीलर स्वतंत्र व्यक्ति है। उसे बाहर से निर्मित लेबल मिलते हैं और कंपनी …

9
क्या यह चार्ट एक आतंकवादी हमले की संभावना को सांख्यिकीय रूप से उपयोगी दिखा रहा है?
मैं देख रहा हूं कि यह छवि बहुत पास से गुजरी है। मुझे इस बात का अहसास है कि इस तरह से दी गई जानकारी किसी तरह अधूरी या गलत भी है, लेकिन मैं जवाब देने के लिए आंकड़ों में पर्याप्त रूप से पारंगत नहीं हूं। यह मुझे इस xkcd …

7
प्रायिकता के बजाय अधिकतम लॉग संभावना का अनुकूलन क्यों करें
सबसे मशीन सीखने कार्यों जहाँ आप कुछ संभावना तैयार कर सकते हैं में ppp जो अधिकतम जाना चाहिए, हम वास्तव में लॉग संभावना का अनुकूलन होगा logplog⁡p\log p कुछ मानकों के लिए संभावना के बजाय θθ\theta । उदाहरण के लिए अधिकतम संभावना प्रशिक्षण में, यह आमतौर पर लॉग-लाइबिलिटी है। कुछ …

4
मल्टीकलेज वर्गीकरण में आरओसी कर्व्स को कैसे प्लॉट करें?
दूसरे शब्दों में, एक दो वर्ग की समस्या होने के बजाय मैं 4 कक्षाओं के साथ काम कर रहा हूं और अभी भी एयूसी का उपयोग करके प्रदर्शन का आकलन करना चाहता हूं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.