सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
आंशिक कम से कम वर्गों प्रतिगमन के पीछे सिद्धांत
क्या कोई व्यक्ति SVD और PCA को समझने वाले किसी व्यक्ति के लिए आंशिक रूप से कम से कम वर्ग प्रतिगमन (ऑनलाइन उपलब्ध) के पीछे सिद्धांत के एक अच्छे प्रदर्शन की सिफारिश कर सकता है? मैंने कई स्रोतों को ऑनलाइन देखा है और ऐसा कुछ भी नहीं पाया है जिसमें …

2
आप समय श्रृंखला डेटा के साथ बूटस्ट्रैपिंग कैसे करते हैं?
मैंने हाल ही में मानक त्रुटियों और आकलनकर्ताओं के लिए विश्वास अंतराल की गणना करने के लिए बूटस्ट्रैपिंग तकनीकों का उपयोग करने के बारे में सीखा। मैंने जो सीखा वह यह था कि यदि डेटा IID है, तो आप नमूना डेटा को आबादी के रूप में मान सकते हैं, और …

10
दो यादृच्छिक चर का योग एक आक्षेप क्यों है?
लंबे समय तक मुझे समझ में नहीं आया कि दो यादृच्छिक चर का "योग" उनका दोष क्यों है , जबकि और का मिश्रण घनत्व फ़ंक्शन योगf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); अंकगणित का योग और उनका संकल्प नहीं। सटीक वाक्यांश "दो यादृच्छिक चर का योग" 146,000 बार Google में दिखाई देता है, और निम्नानुसार अण्डाकार …


7
भिन्नता के गुणांक की व्याख्या कैसे करें?
मैं भिन्नता के गुणांक को समझने की कोशिश कर रहा हूं । जब मैं इसे डेटा के निम्नलिखित दो नमूनों पर लागू करने का प्रयास करता हूं तो मैं यह समझने में असमर्थ हूं कि परिणामों की व्याख्या कैसे करें। मान लीजिए कि नमूना 1 और नमूना 2 । यहाँ …

1
अगर मैं एक यादृच्छिक सममित मैट्रिक्स उत्पन्न करता हूं, तो यह सकारात्मक निश्चित मौका क्या है?
मुझे एक अजीब सवाल मिला जब मैं कुछ उत्तल अनुकूलन का प्रयोग कर रहा था। प्रश्न है: मान लें कि मैं अनियमित रूप से (मानक सामान्य वितरण कहता हूं) एक सममित मैट्रिक्स उत्पन्न करता है, (उदाहरण के लिए, मैं ऊपरी त्रिकोणीय मैट्रिक्स उत्पन्न करता हूं, और यह सुनिश्चित करने के …

6
क्या कोई उदाहरण है जहां केंद्रीय सीमा प्रमेय नहीं है?
विकिपीडिया कहता है - प्रायिकता सिद्धांत में, केंद्रीय सीमा प्रमेय (सीएलटी) स्थापित करता है, ज्यादातर स्थितियों में , जब स्वतंत्र यादृच्छिक चर जोड़े जाते हैं, तो उनकी ठीक से सामान्यीकृत राशि एक सामान्य वितरण (अनौपचारिक रूप से एक "घंटी वक्र") की ओर झुकती है, भले ही मूल चर खुद न …

3
मूल परिकल्पना परीक्षण क्यों माध्य पर केंद्रित है और मध्यिका पर नहीं?
बुनियादी अंडर-ग्रेड आँकड़ों के पाठ्यक्रमों में, छात्रों को (आमतौर पर?) आबादी के मतलब के लिए परिकल्पना परीक्षण सिखाया जाता है। ऐसा क्यों है कि ध्यान माध्य पर है न कि माध्यिका पर? मेरा अनुमान है कि केंद्रीय सीमा प्रमेय के कारण माध्य का परीक्षण करना आसान है, लेकिन मैं कुछ …

2
Jürgen Schmidhuber द्वारा शुरू किए गए पीढ़ी के प्रतिकूल नेटवर्क थे?
मैंने https://en.wikipedia.org/wiki/Generative_adversarial_networks पर पढ़ा है : [जनक प्रतिकूल नेटवर्क] 2014 में इयान गुडफेलो एट अल द्वारा पेश किए गए थे। लेकिन Jurgen Schmidhuber ने उस दिशा में पहले भी इसी तरह का काम करने का दावा किया है (उदाहरण के लिए, जनरेटरों के प्रतिकूल नेटवर्क ट्यूटोरियल के दौरान NIPS 2016 …

3
बड़े अध्ययनों में छोटे प्रभाव का पता लगाना प्रकाशन पूर्वाग्रह को क्यों दर्शाता है?
कई कार्यप्रणाली संबंधी कागजात (जैसे ईगर एट अल 1997 ए, 1997 बी) मेटा-एनालिसिस द्वारा बताए गए प्रकाशन पूर्वाग्रह की चर्चा करते हैं, जैसे नीचे दिए गए फ़नल प्लॉट का उपयोग करते हुए। 1997 बी पेपर यह कहता है कि "यदि प्रकाशन पूर्वाग्रह मौजूद है, तो यह उम्मीद है कि प्रकाशित …

8
क्या मुझे पहले बायेसियन या लगातार आंकड़ों को पढ़ाना चाहिए?
मैं अपने लड़कों की मदद कर रहा हूं, वर्तमान में हाई स्कूल में है, आंकड़ों को समझ रहा हूं, और मैं कुछ सरल उदाहरणों के साथ शुरुआत कर रहा हूं, जो कुछ झलकियों को सिद्धांत की उपेक्षा किए बिना। मेरा लक्ष्य उन्हें खरोंच से आंकड़े सीखने के लिए सबसे सहज …

4
डिग्री कम करने के बजाय बहुपद प्रतिगमन में नियमितीकरण का उपयोग क्यों करें?
प्रतिगमन करते समय, उदाहरण के लिए, चुनने के लिए दो हाइपर पैरामीटर अक्सर फ़ंक्शन की क्षमता (उदाहरण के लिए, एक बहुपद का सबसे बड़ा प्रतिपादक), और नियमितीकरण की मात्रा है। मैं जिस उलझन में हूं, वह यह है कि क्यों न केवल कम क्षमता वाले फंक्शन का चयन किया जाए …

7
एक अल्पविराम CSV फ़ाइलों में अल्पविराम विभाजक / सीमांकक क्यों है?
मैं इस लेख को पढ़ रहा था और इस प्रश्न के उचित उत्तर के लिए उत्सुक हूं। केवल एक चीज जो मेरे दिमाग में आती है, वह शायद यह है कि कुछ देशों में दशमलव विभाजक एक अल्पविराम है, और सीएसवी में डेटा साझा करते समय यह समस्याएं हो सकती …

5
कुछ लोग लापता मूल्यों को बदलने के लिए -999 या -9999 का उपयोग क्यों करते हैं?
मेरे पास एक डेटासेट है। बहुत सारे लापता मूल्य हैं। कुछ स्तंभों के लिए, अनुपलब्ध मान को -999 के साथ बदल दिया गया था, लेकिन अन्य स्तंभों के लिए, अनुपलब्ध मान को 'NA' के रूप में चिह्नित किया गया था। लापता मूल्य को बदलने के लिए हम -999 का उपयोग …

2
एन्ट्रापी हमें क्या बताती है?
मैं एन्ट्रॉपी के बारे में पढ़ रहा हूं और निरंतर मामले में इसका क्या अर्थ है, इस पर विचार करते हुए एक कठिन समय आ रहा है। विकी पेज निम्नलिखित बताता है: घटनाओं की संभाव्यता वितरण, हर घटना की जानकारी राशि के साथ मिलकर, एक यादृच्छिक चर बनाता है जिसका …
32 entropy 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.