सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

28
प्रमुख घटक विश्लेषण, eigenvectors और eigenvalues ​​की समझ बनाना
आज के पैटर्न मान्यता वर्ग में मेरे प्रोफेसर ने PCA, eigenvectors और eigenvalues ​​के बारे में बात की। मुझे इसका गणित समझ में आया। अगर मुझे आइजनवेल्स आदि खोजने के लिए कहा जाए तो मैं इसे मशीन की तरह सही तरीके से करूंगा। लेकिन मुझे यह समझ में नहीं आया ...

11
फीडफॉरवर्ड न्यूरल नेटवर्क में छिपी हुई परतों और नोड्स की संख्या कैसे चुनें?
क्या फीड-फॉरवर्ड न्यूरल नेटवर्क में परतों की संख्या, और प्रत्येक परत में नोड्स की संख्या का चयन करने के लिए एक मानक और स्वीकृत तरीका है? मुझे तंत्रिका नेटवर्क के निर्माण के स्वचालित तरीकों में दिलचस्पी है।

10
"संभावना" और "संभावना" के बीच अंतर क्या है?
विकिपीडिया पृष्ठ का दावा है कि संभावना और संभावना अलग अवधारणाओं रहे हैं। गैर-तकनीकी समानता में, "संभावना" आमतौर पर "संभाव्यता" का एक पर्याय है, लेकिन सांख्यिकीय उपयोग में परिप्रेक्ष्य में एक स्पष्ट अंतर है: संख्या जो कुछ मनाया परिणामों की संभावना है, जिसे पैरामीटर मानों के एक सेट के रूप ...

11
बीटा वितरण के पीछे अंतर्ज्ञान क्या है?
डिस्क्लेमर: मैं कोई सांख्यिकीविद् नहीं, बल्कि एक सॉफ्टवेयर इंजीनियर हूं। आंकड़ों में मेरा अधिकांश ज्ञान स्व-शिक्षा से आता है, इस प्रकार मुझे अभी भी अवधारणाओं को समझने में कई अंतराल हैं जो यहां अन्य लोगों के लिए तुच्छ लग सकते हैं। यदि उत्तर कम विशिष्ट शब्द और अधिक स्पष्टीकरण शामिल ...

11
परीक्षण सेट और सत्यापन सेट के बीच अंतर क्या है?
मुझे यह भ्रामक लगा जब मैं Matlab में तंत्रिका नेटवर्क टूलबॉक्स का उपयोग करता हूं। इसने कच्चे डेटा को तीन भागों में विभाजित किया: प्रशिक्षण सेट सत्यापन सेट टेस्ट सेट मैं कई प्रशिक्षण या लर्निंग एल्गोरिदम में देखता हूं, डेटा को अक्सर 2 भागों में विभाजित किया जाता है, प्रशिक्षण ...

20
द टू कल्चर: स्टैटिस्टिक्स बनाम मशीन लर्निंग?
पिछले साल, मैंने ब्रेंडन ओ'कॉनर का एक ब्लॉग पोस्ट पढ़ा जिसका शीर्षक था "सांख्यिकी बनाम मशीन लर्निंग, लड़ाई!" दोनों क्षेत्रों के बीच कुछ अंतरों पर चर्चा की। एंड्रयू जेलमैन ने इस पर अनुकूल प्रतिक्रिया दी : साइमन ब्लोमबर्ग: R के फॉर्च्यून्स पैकेज से: उत्तेजक रूप से परफेक्शन के लिए, 'मशीन ...

22
मानक विचलन में निरपेक्ष मान लेने के बजाय अंतर को वर्ग क्यों करें?
मानक विचलन की परिभाषा में, हमें माध्य (E) प्राप्त करने के लिए माध्य से अंतर को वर्ग क्यों करना है और अंत में वर्गमूल को वापस लेना है ? क्या हम केवल इसके बजाय अंतर का पूर्ण मूल्य नहीं ले सकते हैं और उन लोगों के अपेक्षित मूल्य (मतलब) प्राप्त ...

5
K- साधनों की कमियों को कैसे समझें
K- साधन क्लस्टर विश्लेषण में एक व्यापक रूप से इस्तेमाल की जाने वाली विधि है। मेरी समझ में, इस विधि को किसी भी धारणा की आवश्यकता नहीं है, अर्थात, मुझे एक डेटासेट और पूर्व-निर्दिष्ट संख्या के क्लस्टर, k, और मैं अभी इस एल्गोरिथ्म को लागू करता हूं जो कि चुकता ...

25
पायथन एक सांख्यिकी कार्यक्षेत्र के रूप में
बहुत से लोग अपनी मुख्य जरूरतों के लिए एक्सेल या किसी अन्य स्प्रेडशीट, एसपीएसएस, स्टाटा या आर जैसे मुख्य उपकरण का उपयोग करते हैं। वे कुछ विशेष आवश्यकताओं के लिए कुछ विशिष्ट पैकेज की ओर रुख कर सकते हैं, लेकिन बहुत सी चीजें एक साधारण स्प्रेडशीट या एक सामान्य आँकड़े ...
355 r  spss  stata  python 

3
एसवीडी और पीसीए के बीच संबंध। PCA करने के लिए SVD का उपयोग कैसे करें?
प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) को आमतौर पर कोवरियन मैट्रिक्स के एक ईजन-अपघटन के माध्यम से समझाया जाता है। हालाँकि, यह डेटा मैट्रिक्स एकवचन मान अपघटन (SVD) के माध्यम से भी किया जा सकता है । यह कैसे काम करता है? इन दोनों दृष्टिकोणों के बीच क्या संबंध है? एसवीडी और ...

30
आपका पसंदीदा "डेटा विश्लेषण" कार्टून क्या है?
यह मेरे पसंदीदा में से एक है: प्रति उत्तर एक प्रविष्टि। (यह स्टैक ओवरफ्लो प्रश्न की नस में है आपका पसंदीदा "प्रोग्रामर" कार्टून क्या है? ) PS साइट की अनुमति के बिना कार्टून को हॉटलिंक न करें।
343 humor 


11
छंटनी करने वालों को समझाते हुए कि बूटस्ट्रैपिंग क्यों काम करती है
मैंने हाल ही में एक परियोजना के लिए विश्वास अंतराल का अनुमान लगाने के लिए बूटस्ट्रैपिंग का इस्तेमाल किया। कोई व्यक्ति जो हाल ही में आँकड़ों के बारे में ज्यादा नहीं जानता है, उसने मुझे बताया है कि मैं क्यों समझाऊँ बूटस्ट्रैपिंग काम करता है, अर्थात, ऐसा क्यों है कि ...

18
यदि प्रतिगमन से पहले व्याख्यात्मक और प्रतिक्रिया चर स्वतंत्र रूप से हल किए जाते हैं तो क्या होता है?
मान लीजिए कि हमारे पास अंक के साथ डेटा सेट । हम एक रेखीय प्रतिगमन करना चाहते हैं, लेकिन पहले हम डेटा सेट (X_i, Y_j) बनाते हुए X_i मान और एक दूसरे के स्वतंत्र रूप से Y_i मानों को सॉर्ट करते हैं । क्या नए डेटा सेट पर प्रतिगमन की ...

10
लॉगिट और प्रोबेट मॉडल के बीच अंतर
Logit और Probit मॉडल में क्या अंतर है ? मुझे यह जानने में अधिक दिलचस्पी है कि लॉजिस्टिक रिग्रेशन का उपयोग कब करना है, और कब प्रोबेट का उपयोग करना है। यदि कोई साहित्य है जो R का उपयोग करके इसे परिभाषित करता है , तो यह सहायक होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.