सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए


7
नियमितीकरण शब्द को * लागत कार्य (गुणक आदि के बजाय) * से क्यों जोड़ा गया है?
J(θ)=12(y−θXT)(y−θXT)T+α∥θ∥22J(θ)=12(y−θXT)(y−θXT)T+α‖θ‖22 J(\theta)=\frac 1 2(y-\theta X^T)(y-\theta X^T)^T+\alpha\|\theta\|_2^2 मेरा प्रश्न यह है कि इस नियमितीकरण शब्द को जोड़ा गया है, जो मूल लागत फ़ंक्शन में जोड़ा गया है और गुणा या कुछ और नहीं है जो नियमितीकरण के विचार के पीछे प्रेरणा की भावना रखता है? क्या यह इसलिए है क्योंकि यदि …

8
टेबल डिजाइन पर एक अच्छा संसाधन क्या है?
मैंने ग्राफिक्स के विभिन्न सैद्धांतिक उपचार देखे हैं, जैसे कि ग्राफिक्स का व्याकरण । लेकिन मैंने तालिकाओं के संबंध में कुछ भी नहीं देखा है। जब तक मैंने टेबल डिज़ाइन में अच्छे अभ्यास का एक अनौपचारिक मॉडल विकसित किया है। हालांकि, मैं छात्रों को एक अच्छा संदर्भ प्रदान करने में …
51 tables 

4
प्रतिगमन के माध्यम से वर्गीकरण क्यों नहीं?
मशीन लर्निंग पर मैंने जो कुछ सामग्री देखी है, उसने कहा कि प्रतिगमन के माध्यम से वर्गीकरण समस्या का सामना करना एक बुरा विचार है। लेकिन मुझे लगता है कि डेटा को फिट करने के लिए एक निरंतर प्रतिगमन करना संभव है और असतत वर्गीकरणों का उत्पादन करने के लिए …

6
आर में आरओसी वक्र का उपयोग करके सर्वश्रेष्ठ कटऑफ बिंदु और उसके आत्मविश्वास अंतराल का निर्धारण कैसे करें?
मेरे पास एक परीक्षण का डेटा है जिसे सामान्य और ट्यूमर कोशिकाओं को भेद करने के लिए इस्तेमाल किया जा सकता है। आरओसी वक्र के अनुसार यह इस उद्देश्य के लिए अच्छा लगता है (वक्र के तहत क्षेत्र 0.9 है): मेरे प्रश्न हैं: इस परीक्षण और इसके आत्मविश्वास अंतराल के …

3
सांख्यिकी और कारण निष्कर्ष?
अपने १ ९ In४ के पेपर "स्टैटिस्टिक्स एंड कॉसल इनविज़न" में , पॉल हॉलैंड ने आंकड़ों में सबसे बुनियादी सवालों में से एक उठाया: एक सांख्यिकीय मॉडल कार्य-कारण के बारे में क्या कह सकता है? यह उनके आदर्श वाक्य के लिए नेतृत्व किया: बिना किसी सहूलियत के जो प्रयोग को …
51 causality 

2
एक कण फिल्टर (अनुक्रमिक मोंटे कार्लो) और एक कलमन फिल्टर के बीच अंतर क्या है?
एक कण फ़िल्टर और कलमन फ़िल्टर दोनों पुनरावर्ती बायेसियन अनुमानक हैं । मैं अक्सर अपने क्षेत्र में कलमन फ़िल्टर का सामना करता हूं, लेकिन बहुत कम ही कण फिल्टर का उपयोग देखता हूं। एक दूसरे पर कब इस्तेमाल किया जाएगा?


3
क्या हमें "अफ़सोस" की समस्या है?
मुझे पता है, यह लग सकता है जैसे यह ऑफ-टॉपिक है, लेकिन मुझे सुनें। स्टैक ओवरफ्लो में और यहां हमें पदों पर वोट मिलते हैं, यह सब एक सारणीबद्ध रूप में संग्रहीत होता है। उदाहरण के लिए: आईडी आईडी मतदाता आईडी वोट प्रकार डेटाइम ------- -------- --------- -------- 10 1 …

5
यादृच्छिक वन एक बूस्टिंग एल्गोरिथ्म है?
बढ़ाने की संक्षिप्त परिभाषा : क्या कमजोर शिक्षार्थियों का एक समूह एक मजबूत शिक्षार्थी बना सकता है? एक कमजोर शिक्षार्थी को एक क्लासिफायरियर के रूप में परिभाषित किया जाता है जो केवल सच्चे वर्गीकरण से थोड़ा संबंधित है (यह यादृच्छिक अनुमान से बेहतर उदाहरणों को लेबल कर सकता है)। यादृच्छिक …


3
क्या बहु-रेखीय प्रतिगमन में सुविधा चयन के लिए एक यादृच्छिक वन का उपयोग किया जा सकता है?
चूंकि आरएफ गैर-रैखिकता को संभाल सकता है, लेकिन गुणांक प्रदान नहीं कर सकता है, क्या यह सबसे महत्वपूर्ण सुविधाओं को इकट्ठा करने के लिए यादृच्छिक वन का उपयोग करने के लिए बुद्धिमान होगा और फिर अपने गुणांक प्राप्त करने के लिए उन विशेषताओं को कई रैखिक प्रतिगमन मॉडल में प्लग …

4
तेजी से रैखिक प्रतिगमन outliers के लिए मजबूत
मैं आउटलेर्स के साथ रैखिक डेटा के साथ काम कर रहा हूं, जिनमें से कुछ अनुमानित प्रतिगमन लाइन से 5 मानक विचलन से अधिक हैं। मैं एक रेखीय प्रतिगमन तकनीक की तलाश कर रहा हूं जो इन बिंदुओं के प्रभाव को कम करता है। अब तक मैंने जो किया वह …

9
क्या किसी को डेटाबेस से डेटा की कल्पना करने के लिए कोई अच्छा खुला स्रोत सॉफ़्टवेयर पता है?
हाल ही में मैं झांकी में आया और डेटाबेस और सीएसवी फ़ाइल से डेटा की कल्पना करने की कोशिश की। उपयोगकर्ता पुनरावृत्ति उपयोगकर्ता को समय और स्थानिक डेटा की कल्पना करने और एक पल में भूखंड बनाने में सक्षम बनाता है। ऐसा टूल वास्तव में उपयोगी है क्योंकि यह कोड …

8
सांख्यिकीय सीखने के तत्वों से पहले पढ़ने के लिए पुस्तक?
इस पोस्ट के आधार पर , मैं सांख्यिकीय लर्निंग के तत्वों को पचाना चाहता हूं। सौभाग्य से यह मुफ्त में उपलब्ध है और मैंने इसे पढ़ना शुरू कर दिया है। मेरे पास इसे समझने के लिए पर्याप्त ज्ञान नहीं है। क्या आप ऐसी पुस्तक की सिफारिश कर सकते हैं जो …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.