सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

11
एक बच्चे को "आयामीता का अभिशाप" समझाएं
मैंने कई बार आयामीता के अभिशाप के बारे में सुना, लेकिन किसी तरह मैं अभी भी इस विचार को समझ नहीं पा रहा हूं, यह सब धूमिल है। क्या कोई इसे सबसे सहज तरीके से समझा सकता है, जैसा कि आप इसे एक बच्चे को समझाएंगे, ताकि मैं (और मैं …

11
आम शब्दों में अधिकतम संभावना अनुमान (MLE)
आम आदमी की शर्तों में अधिकतम संभावना अनुमान (MLE) के बारे में क्या कोई मुझे विस्तार से बता सकता है? मैं गणितीय व्युत्पत्ति या समीकरण में जाने से पहले अंतर्निहित अवधारणा को जानना चाहूंगा।

5
ANOVA को रेखीय प्रतिगमन की तुलना में एक अलग शोध पद्धति के रूप में क्यों पढ़ाया / प्रयोग किया जाता है?
एनोवा उपयुक्त डमी चर के उपयोग के साथ रैखिक प्रतिगमन के बराबर है। निष्कर्ष चाहे आप ANOVA का उपयोग करें या रैखिक प्रतिगमन के समान ही रहते हैं। उनकी समानता के प्रकाश में, क्या कोई कारण है कि रैखिक प्रतिगमन के बजाय एनोवा का उपयोग किया जाता है? नोट: मैं …
91 regression  anova 

3
क्या गॉसियन यादृच्छिक चर की एक जोड़ी होना संभव है जिसके लिए संयुक्त वितरण गॉसियन नहीं है?
एक नौकरी के साक्षात्कार में किसी ने मुझसे यह सवाल पूछा और मैंने जवाब दिया कि उनका संयुक्त वितरण हमेशा गौसियन है। मैंने सोचा था कि मैं हमेशा अपने माध्यमों और विचरण और सहसंयोजी के साथ एक बीवरिएट गौसियन लिख सकता हूं। मैं सोच रहा हूं कि क्या ऐसा कोई …

2
तंत्रिका नेटवर्क में एक एम्बेडिंग परत क्या है?
कई तंत्रिका नेटवर्क पुस्तकालयों में, 'एम्बेडिंग लेयर्स' होते हैं, जैसे कि केर या लासगैन में । मुझे यकीन नहीं है कि मैं प्रलेखन पढ़ने के बावजूद, इसके कार्य को समझता हूं। उदाहरण के लिए, केरस प्रलेखन में यह कहा गया है: धनात्मक पूर्णांक (इंडेक्स) को निश्चित आकार के denses vectors …

11
लीनियर रिग्रेशन को "मशीन लर्निंग" कब कहा जाना चाहिए?
हाल ही में एक बोलचाल में, स्पीकर के सार ने दावा किया कि वे मशीन लर्निंग का उपयोग कर रहे थे। बातचीत के दौरान, मशीन लर्निंग से जुड़ी एकमात्र बात यह थी कि वे अपने डेटा पर रैखिक प्रतिगमन करते हैं। 5 डी पैरामीटर स्पेस में सर्वश्रेष्ठ-फिट गुणांक की गणना …

6
अगर मेरे पास एक बिंदु जीतने का 58% मौका है, तो मेरे लिए 21 में से एक पिंग पांग गेम जीतने का क्या मौका है?
मेरे पास एक सहकर्मी के साथ शर्त है कि 50 पिंग पोंग गेम में से (पहले 21 अंक जीतने के लिए, 2 से जीतना), मैं सभी 50 जीतूंगा। अब तक हमने 15 गेम खेले हैं और औसतन मैं 58% जीतता हूं अंक, प्लस मैं अब तक सभी खेल जीता है। …

4
पीसीए और अनुपात के विचरण को समझाया
सामान्य तौर पर, यह कहने का क्या मतलब है कि पीसीए जैसे विश्लेषण में भिन्नता का अंश पहले प्रमुख घटक द्वारा समझाया गया है? क्या कोई इसे सहज रूप से समझा सकता है, लेकिन प्रमुख घटक विश्लेषण (पीसीए) के संदर्भ में "विचरण समझाया" का एक सटीक गणितीय परिभाषा दे सकता …

11
“प्रकाशन-गुणवत्ता वाले भूखंडों में विभेदक श्रृंखला के लिए रंगों की सर्वश्रेष्ठ श्रृंखला का उपयोग करना
क्या कोई अध्ययन किया गया है कि एक ही भूखंड पर कई श्रृंखला दिखाने के लिए रंगों का सबसे अच्छा सेट क्या है? मैं सिर्फ चूक का उपयोग कर रहा हूं matplotlib, और वे थोड़े बचकाने लग रहे हैं क्योंकि वे सभी उज्ज्वल, प्राथमिक रंग हैं।

7
किसी सांख्यिकीय विश्लेषण परियोजना का कुशलतापूर्वक प्रबंधन कैसे करें?
हम अक्सर कंप्यूटर विज्ञान में परियोजना प्रबंधन और डिजाइन पैटर्न के बारे में सुनते हैं, लेकिन सांख्यिकीय विश्लेषण में कम बार। हालांकि, ऐसा लगता है कि एक प्रभावी और टिकाऊ सांख्यिकीय परियोजना को डिजाइन करने की दिशा में एक निर्णायक कदम चीजों को व्यवस्थित रखना है। मैं अक्सर आर के …

1
व्याख्या करना। प्लाट ()
आर में प्लॉट (lm) द्वारा उत्पन्न ग्राफ की व्याख्या करने के बारे में मेरा एक सवाल था। मैं सोच रहा था कि क्या आप लोग मुझे बता सकते हैं कि स्केल-लोकेशन और लीवरेज-अवशिष्ट भूखंडों की व्याख्या कैसे करें? किसी भी टिप्पणी की सराहना की जाएगी। सांख्यिकी, प्रतिगमन और अर्थमिति का …

4
क्यों गहरी छवि सीखने में वर्तमान छवि के बजाय डेटासेट की छवि को घटाकर छवियों को सामान्य किया जाता है?
छवियों को सामान्य करने के कुछ तरीके हैं, लेकिन अधिकांश इन दो तरीकों का उपयोग करते हैं: सभी छवियों पर गणना किए गए चैनल प्रति माध्य घटाएं (जैसे VGG_ILSVRC_16_layers ) सभी छवियों पर गणना की गई पिक्सेल / चैनल द्वारा घटाव (जैसे CNN_S , कैफ का संदर्भ नेटवर्क भी देखें …

1
क्रॉस्ड बनाम नेस्टेड रैंडम इफेक्ट्स: वे कैसे भिन्न होते हैं और कैसे उन्हें lme4 में सही ढंग से निर्दिष्ट किया जाता है?
यहां बताया गया है कि मैंने कैसे नेस्टेड बनाम पार किए गए यादृच्छिक प्रभावों को समझा है: नेस्टेड यादृच्छिक प्रभाव तब होता है जब एक निचले स्तर का कारक केवल ऊपरी स्तर के एक विशेष स्तर के भीतर दिखाई देता है। उदाहरण के लिए, समय में एक निश्चित बिंदु पर …

4
गिनती प्रतिगमन के लिए नैदानिक ​​भूखंड
डायग्नोस्टिक प्लॉट (और शायद औपचारिक परीक्षण) क्या आप उन प्रतिगमन के लिए सबसे अधिक जानकारीपूर्ण पाते हैं जहां परिणाम एक गिनती चर है? मैं विशेष रूप से पॉइसन और नकारात्मक द्विपद मॉडल, साथ ही प्रत्येक के शून्य-फुलाया और बाधा समकक्षों में दिलचस्पी रखता हूं। अधिकांश स्रोतों को मैंने पाया है …

4
गामा GLMs का उपयोग कब करें?
गामा वितरण आकार की एक विस्तृत श्रृंखला पर ले जा सकता है, और अपने दो मापदंडों के माध्यम से माध्य और विचरण के बीच की कड़ी को देखते हुए, यह गैर-नकारात्मक डेटा में विषम-विषमता से निपटने के लिए अनुकूल है, एक तरह से लॉग-ट्रांसफॉर्मिंग ओएलएस हो सकता है। डब्लूएलएस या …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.