सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

6
पीसीए करने से पहले क्या किसी को अत्यधिक सहसंबद्ध चर को हटा देना चाहिए?
मैं एक पेपर पढ़ रहा हूं जहां पीसीए करने से पहले लेखक अन्य चर के लिए उच्च सहसंबंध के कारण कई चरों को छोड़ देता है। चरों की कुल संख्या लगभग 20 है। क्या इससे कोई लाभ मिलता है? यह मुझे एक ओवरहेड की तरह दिखता है क्योंकि पीसीए को …
111 correlation  pca 

4
हिस्टोग्राम के आधार पर डेटा के अनुमानित वितरण का आकलन करना
मान लीजिए मैं देखना चाहता हूं कि क्या हिस्टोग्राम (यानी दाईं ओर तिरछी) के आधार पर मेरा डेटा घातीय है। मैं डेटा को कैसे समूह या बिन करता हूं, इसके आधार पर, मैं बेतहाशा अलग-अलग हिस्टोग्राम प्राप्त कर सकता हूं। हिस्टोग्राम का एक सेट बना देगा कि डेटा घातीय है। …

2
ग्रेडिएंट बूस्टिंग ट्री बनाम रैंडम फॉरेस्ट
फ्रेडमैन द्वारा प्रस्तावित ग्रेडिएंट ट्री बूस्ट बेस शिक्षार्थियों के रूप में निर्णय पेड़ों का उपयोग करता है। मैं सोच रहा हूं कि क्या हमें आधार निर्णय पेड़ को यथासंभव जटिल (पूरी तरह से विकसित) या सरल बनाना चाहिए? क्या पसंद का कोई स्पष्टीकरण है? बेस फ़ॉरेस्ट के रूप में निर्णय …

8
चेहरे की छवियों के एक डेटाबेस में दिए गए चेहरे का पता लगाना
मैं अपने प्रोफ़ाइल चित्रों के माध्यम से ट्विटर उपयोगकर्ताओं के चेहरे को शामिल करने वाली एक छोटी परियोजना पर काम कर रहा हूं। एक समस्या जिसका मुझे सामना करना पड़ा है, वह यह है कि मैं सभी को फ़िल्टर करने के बाद, जो स्पष्ट चित्र तस्वीरें हैं, ट्विटर उपयोगकर्ताओं का …

3
क्या होगा यदि अवशेषों को सामान्य रूप से वितरित किया जाता है, लेकिन y नहीं है?
मुझे एक अजीब सा सवाल सूझा। मान लें कि आपके पास एक छोटा सा नमूना है, जहां एक साधारण रैखिक मॉडल के साथ विश्लेषण करने के लिए आप जिस पर निर्भर चर का विश्लेषण करने जा रहे हैं, वह अत्यधिक तिरछा है। इस प्रकार आप मानते हैं कि यूयूu को …

6
आप सहसंबंध और सह-अस्तित्व के बीच अंतर कैसे बताएंगे?
इस सवाल के बाद, आप किसी ऐसे व्यक्ति को कैसे समझायेंगे जो केवल मतलब समझता है? , जो एक झूठ बोलने वाले व्यक्ति के लिए सहसंयोजक को समझाने के मुद्दे को संबोधित करता है, मेरे दिमाग में एक ऐसा ही सवाल आया। एक व्यक्ति को कोवरियन और सहसंबंध के बीच …

10
क्यूची वितरण का कोई मतलब क्यों नहीं है?
वितरण घनत्व फ़ंक्शन से हम कॉची वितरण के लिए माध्य (= 0) की पहचान कर सकते हैं जैसे नीचे दिए गए ग्राफ़ से पता चलता है। लेकिन हम क्यों कहते हैं कि काउची वितरण का कोई मतलब नहीं है?

15
अमेरिकी चुनाव परिणाम 2016: भविष्यवाणी मॉडल में क्या गलत हुआ?
पहले यह ब्रेक्सिट था , अब अमेरिकी चुनाव है। कई मॉडल भविष्यवाणियों को एक विस्तृत मार्जिन से बंद कर दिया गया था, और क्या यहां सीखने के लिए सबक हैं? कल देर शाम 4 बजे पीएसटी के रूप में, सट्टेबाजी बाजार अभी भी हिलेरी 4 से 1 के पक्ष में …

5
सपोर्ट वेक्टर मशीन (SVM) कैसे काम करती है?
एक सपोर्ट वेक्टर मशीन (SVM) कैसे काम करती है, और यह रैखिक रेखांकन , रैखिक डिस्क्रिमिनेन्ट एनालिसिस , या लॉजिस्टिक रिग्रेशन जैसे अन्य रैखिक क्लासिफायर से अलग क्या करती है ? * (* मैं एल्गोरिथ्म, अनुकूलन रणनीतियों, सामान्यीकरण क्षमताओं और रन-टाइम जटिलता के लिए अंतर्निहित प्रेरणाओं के संदर्भ में सोच …

4
बूटस्ट्रैपिंग में .632+ नियम क्या है?
यहाँ @gung .632+ नियम का संदर्भ देता है। एक त्वरित Google खोज इस नियम का क्या अर्थ है और किस उद्देश्य से इसका उपयोग किया जाता है, इसका उत्तर समझने में आसान नहीं है। क्या कोई कृपया .632+ नियम को स्पष्ट करेगा?
107 bootstrap 

5
बड़े पैमाने पर सांख्यिकीय विश्लेषण करने के लिए कौन से कौशल की आवश्यकता होती है?
कई सांख्यिकीय नौकरियां बड़े पैमाने पर डेटा के साथ अनुभव के लिए पूछती हैं। सांख्यिकीय और कम्प्यूटेशनल कौशल के प्रकार क्या हैं जिन्हें बड़े डेटा सेट के साथ काम करने की आवश्यकता होगी। उदाहरण के लिए, प्रतिगमन मॉडल के निर्माण के बारे में 10 मिलियन नमूनों के साथ डेटा सेट …

6
क्या डेटा मैट्रिक्स लिए की सहज व्याख्या है ?
किसी दिए गए डेटा मैट्रिक्स (स्तंभों में चर और डेटा बिंदुओं के साथ पंक्तियों में) के लिए, ऐसा लगता है कि ए ^ टीए आंकड़ों में एक महत्वपूर्ण भूमिका निभाता है। उदाहरण के लिए, यह कम से कम वर्गों के विश्लेषणात्मक समाधान का एक महत्वपूर्ण हिस्सा है। या, पीसीए के …

21
"ओवरफिटिंग" का वास्तविक विश्व उदाहरण क्या है?
मैं समझता हूं कि "ओवरफिटिंग" का क्या मतलब है, लेकिन मुझे वास्तविक दुनिया के उदाहरण के साथ आने के लिए मदद की जरूरत है जो ओवरफिटिंग पर लागू होती है।
107 overfitting 

7
वर्गीकरण मॉडल का आकलन करने के लिए सटीकता सबसे अच्छा उपाय क्यों नहीं है?
यह एक सामान्य प्रश्न है जिसे यहां परोक्ष रूप से कई बार पूछा गया था, लेकिन इसमें एक भी आधिकारिक उत्तर का अभाव है। संदर्भ के लिए इसका विस्तृत उत्तर देना बहुत अच्छा होगा। सटीकता , सभी वर्गीकरणों के बीच सही वर्गीकरण का अनुपात बहुत सरल और बहुत "सहज" उपाय …

6
तंत्रिका नेटवर्क में 1x1 दृढ़ संकल्प का क्या अर्थ है?
मैं वर्तमान में Udacity डीप लर्निंग ट्यूटोरियल कर रहा हूं। पाठ 3 में, वे 1x1 दृढ़ संकल्प के बारे में बात करते हैं। Google इंसेप्शन मॉड्यूल में 1x1 कनवल्शन का उपयोग किया जाता है। मुझे यह समझने में परेशानी हो रही है कि 1x1 का दोषी क्या है। मैंने भी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.