सांख्यिकी और बिग डेटा

28

प्रमुख घटक विश्लेषण, eigenvectors और eigenvalues की समझ बनाना

आज के पैटर्न मान्यता वर्ग में मेरे प्रोफेसर ने PCA, eigenvectors और eigenvalues के बारे में बात की। मुझे इसका गणित समझ में आया। अगर मुझे आइजनवेल्स आदि खोजने के लिए कहा जाए तो मैं इसे मशीन की तरह सही तरीके से करूंगा। लेकिन मुझे यह समझ में नहीं आया …

975 pca intuition eigenvalues canonical-question

11

फीडफॉरवर्ड न्यूरल नेटवर्क में छिपी हुई परतों और नोड्स की संख्या कैसे चुनें?

क्या फीड-फॉरवर्ड न्यूरल नेटवर्क में परतों की संख्या, और प्रत्येक परत में नोड्स की संख्या का चयन करने के लिए एक मानक और स्वीकृत तरीका है? मुझे तंत्रिका नेटवर्क के निर्माण के स्वचालित तरीकों में दिलचस्पी है।

540 model-selection neural-networks

10

"संभावना" और "संभावना" के बीच अंतर क्या है?

विकिपीडिया पृष्ठ का दावा है कि संभावना और संभावना अलग अवधारणाओं रहे हैं। गैर-तकनीकी समानता में, "संभावना" आमतौर पर "संभाव्यता" का एक पर्याय है, लेकिन सांख्यिकीय उपयोग में परिप्रेक्ष्य में एक स्पष्ट अंतर है: संख्या जो कुछ मनाया परिणामों की संभावना है, जिसे पैरामीटर मानों के एक सेट के रूप …

474 probability likelihood

11

बीटा वितरण के पीछे अंतर्ज्ञान क्या है?

डिस्क्लेमर: मैं कोई सांख्यिकीविद् नहीं, बल्कि एक सॉफ्टवेयर इंजीनियर हूं। आंकड़ों में मेरा अधिकांश ज्ञान स्व-शिक्षा से आता है, इस प्रकार मुझे अभी भी अवधारणाओं को समझने में कई अंतराल हैं जो यहां अन्य लोगों के लिए तुच्छ लग सकते हैं। यदि उत्तर कम विशिष्ट शब्द और अधिक स्पष्टीकरण शामिल …

438 distributions beta-distribution intuition beta-binomial

11

परीक्षण सेट और सत्यापन सेट के बीच अंतर क्या है?

मुझे यह भ्रामक लगा जब मैं Matlab में तंत्रिका नेटवर्क टूलबॉक्स का उपयोग करता हूं। इसने कच्चे डेटा को तीन भागों में विभाजित किया: प्रशिक्षण सेट सत्यापन सेट टेस्ट सेट मैं कई प्रशिक्षण या लर्निंग एल्गोरिदम में देखता हूं, डेटा को अक्सर 2 भागों में विभाजित किया जाता है, प्रशिक्षण …

431 machine-learning validation

20

द टू कल्चर: स्टैटिस्टिक्स बनाम मशीन लर्निंग?

पिछले साल, मैंने ब्रेंडन ओ'कॉनर का एक ब्लॉग पोस्ट पढ़ा जिसका शीर्षक था "सांख्यिकी बनाम मशीन लर्निंग, लड़ाई!" दोनों क्षेत्रों के बीच कुछ अंतरों पर चर्चा की। एंड्रयू जेलमैन ने इस पर अनुकूल प्रतिक्रिया दी : साइमन ब्लोमबर्ग: R के फॉर्च्यून्स पैकेज से: उत्तेजक रूप से परफेक्शन के लिए, 'मशीन …

420 machine-learning pac-learning

22

मानक विचलन में निरपेक्ष मान लेने के बजाय अंतर को वर्ग क्यों करें?

मानक विचलन की परिभाषा में, हमें माध्य (E) प्राप्त करने के लिए माध्य से अंतर को वर्ग क्यों करना है और अंत में वर्गमूल को वापस लेना है ? क्या हम केवल इसके बजाय अंतर का पूर्ण मूल्य नहीं ले सकते हैं और उन लोगों के अपेक्षित मूल्य (मतलब) प्राप्त …

408 standard-deviation definition

5

K- साधनों की कमियों को कैसे समझें

K- साधन क्लस्टर विश्लेषण में एक व्यापक रूप से इस्तेमाल की जाने वाली विधि है। मेरी समझ में, इस विधि को किसी भी धारणा की आवश्यकता नहीं है, अर्थात, मुझे एक डेटासेट और पूर्व-निर्दिष्ट संख्या के क्लस्टर, k, और मैं अभी इस एल्गोरिथ्म को लागू करता हूं जो कि चुकता …

365 machine-learning clustering data-mining k-means

25

पायथन एक सांख्यिकी कार्यक्षेत्र के रूप में

बहुत से लोग अपनी मुख्य जरूरतों के लिए एक्सेल या किसी अन्य स्प्रेडशीट, एसपीएसएस, स्टाटा या आर जैसे मुख्य उपकरण का उपयोग करते हैं। वे कुछ विशेष आवश्यकताओं के लिए कुछ विशिष्ट पैकेज की ओर रुख कर सकते हैं, लेकिन बहुत सी चीजें एक साधारण स्प्रेडशीट या एक सामान्य आँकड़े …

355 r spss stata python

3

एसवीडी और पीसीए के बीच संबंध। PCA करने के लिए SVD का उपयोग कैसे करें?

प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) को आमतौर पर कोवरियन मैट्रिक्स के एक ईजन-अपघटन के माध्यम से समझाया जाता है। हालाँकि, यह डेटा मैट्रिक्स एकवचन मान अपघटन (SVD) के माध्यम से भी किया जा सकता है । यह कैसे काम करता है? इन दोनों दृष्टिकोणों के बीच क्या संबंध है? एसवीडी और …

351 pca dimensionality-reduction matrix svd

30

आपका पसंदीदा "डेटा विश्लेषण" कार्टून क्या है?

यह मेरे पसंदीदा में से एक है: प्रति उत्तर एक प्रविष्टि। (यह स्टैक ओवरफ्लो प्रश्न की नस में है आपका पसंदीदा "प्रोग्रामर" कार्टून क्या है? ) PS साइट की अनुमति के बिना कार्टून को हॉटलिंक न करें।

343 humor

15

सादे अंग्रेजी में बायेसियन और लगातार तर्क

आप सादे अंग्रेजी में उन विशेषताओं का वर्णन कैसे करेंगे जो बेयसियन को फ़्रीक्वेंटिस्ट तर्क से अलग करते हैं?

339 bayesian frequentist

11

छंटनी करने वालों को समझाते हुए कि बूटस्ट्रैपिंग क्यों काम करती है

मैंने हाल ही में एक परियोजना के लिए विश्वास अंतराल का अनुमान लगाने के लिए बूटस्ट्रैपिंग का इस्तेमाल किया। कोई व्यक्ति जो हाल ही में आँकड़ों के बारे में ज्यादा नहीं जानता है, उसने मुझे बताया है कि मैं क्यों समझाऊँ बूटस्ट्रैपिंग काम करता है, अर्थात, ऐसा क्यों है कि …

326 bootstrap communication

18

यदि प्रतिगमन से पहले व्याख्यात्मक और प्रतिक्रिया चर स्वतंत्र रूप से हल किए जाते हैं तो क्या होता है?

मान लीजिए कि हमारे पास अंक के साथ डेटा सेट । हम एक रेखीय प्रतिगमन करना चाहते हैं, लेकिन पहले हम डेटा सेट (X_i, Y_j) बनाते हुए X_i मान और एक दूसरे के स्वतंत्र रूप से Y_i मानों को सॉर्ट करते हैं । क्या नए डेटा सेट पर प्रतिगमन की …

302 regression correlation

10

लॉगिट और प्रोबेट मॉडल के बीच अंतर

Logit और Probit मॉडल में क्या अंतर है ? मुझे यह जानने में अधिक दिलचस्पी है कि लॉजिस्टिक रिग्रेशन का उपयोग कब करना है, और कब प्रोबेट का उपयोग करना है। यदि कोई साहित्य है जो R का उपयोग करके इसे परिभाषित करता है , तो यह सहायक होगा।

299 r generalized-linear-model logistic probit link-function