सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

10
एक कठिन सांख्यिकीय अवधारणा के लिए आपके पसंदीदा आम आदमी की व्याख्या क्या है?
मैं वास्तव में जटिल समस्याओं के लिए सरल स्पष्टीकरण सुनने का आनंद लेता हूं। आपका पसंदीदा सादृश्य या किस्सा क्या है जो एक कठिन सांख्यिकीय अवधारणा की व्याख्या करता है? मेरा पसंदीदा एक शराबी और उसके कुत्ते का उपयोग कर मुरैना का स्पष्टीकरण है। मरे बताते हैं कि कैसे दो …

2
ग्लमनेट की व्याख्या कैसे करें?
मैं लगभग 60 भविष्यवक्ता चर और 30 टिप्पणियों के साथ एक बहुभिन्नरूपी रैखिक प्रतिगमन मॉडल को फिट करने की कोशिश कर रहा हूं, इसलिए मैं नियमित प्रतिगमन के लिए glmnet पैकेज का उपयोग कर रहा हूं क्योंकि p> n। मैं दस्तावेज़ीकरण और अन्य प्रश्नों से गुजर रहा हूं, लेकिन मैं …

2
ड्यूरिचलेट वितरण बहुराष्ट्रीय वितरण के लिए पूर्व क्यों है?
एलडीए विषय मॉडल एल्गोरिथ्म में, मैंने इस धारणा को देखा। लेकिन मुझे नहीं पता कि डिर्चिलेट वितरण को क्यों चुना? मुझे नहीं पता कि क्या हम एक जोड़ी के रूप में बहुसंख्या पर समान वितरण का उपयोग कर सकते हैं?

3
Tufte- शैली विज़ुअलाइज़ेशन का समर्थन करने वाले प्रायोगिक साक्ष्य?
प्रश्न: क्या निगेल होम्स के चार्ट-जंक किए गए विज़ुअलाइज़ेशन पर टफ्टे-शैली, न्यूनतम, डेटा-बोलने वाले विज़ुअलाइज़ेशन का समर्थन करने वाले प्रयोगात्मक सबूत मौजूद हैं ? मैंने पूछा कि आर प्लॉट्स में चार्ट-जंक को यहाँ कैसे जोड़ा जाए और उत्तरदाताओं ने मुझे एक भारी मात्रा में स्नार्क वापस फेंक दिया। इसलिए, निश्चित …

4
पारंपरिक प्रोग्रामिंग भाषा का उपयोग करके ज्ञात माध्य और विचरण के साथ एक सामान्य वितरण से नमूना कैसे लें?
मेरे पास आँकड़ों में कोई कोर्स नहीं है, इसलिए मुझे उम्मीद है कि मैं यहाँ सही जगह पूछ रहा हूँ। मान लीजिए मैं केवल दो एक सामान्य वितरण का वर्णन डेटा है: मतलब μμ\mu और विचरण σ2σ2\sigma^2 । मैं इस वितरण से बेतरतीब ढंग से नमूने के लिए एक कंप्यूटर …

6
कैसे (आर में) तार के दो वैक्टर मैच के लिए अर्ध?
मुझे यकीन नहीं है कि इसे कैसे समाप्त किया जाना चाहिए, इसलिए यदि आप बेहतर शब्द जानते हैं तो कृपया मुझे सही करें। मुझे दो सूचियाँ मिली हैं। 55 वस्तुओं में से एक (जैसे: तार का एक सदिश), 92 का दूसरा। आइटम नाम समान हैं, लेकिन समान नहीं हैं। मैं …
36 r  text-mining 

4
वाद्य चर क्या है?
एप्लाइड इकोनॉमिक्स और स्टैटिस्टिक्स में इंस्ट्रुमेंटल वेरिएबल तेजी से कॉमन हो रहे हैं। निर्विवाद के लिए, क्या हम निम्नलिखित प्रश्नों के कुछ गैर-तकनीकी उत्तर दे सकते हैं: वाद्य चर क्या है? एक इंस्ट्रूमेंटल वैरिएबल को कब लगाना होगा? इंस्ट्रूमेंटल वैरिएबल को कोई कैसे खोजता या चुनता है?


5
विभिन्न संभावनाओं के लिए संभाव्यता वितरण
अगर मैं 16 परीक्षणों में 9 सफलताओं की संभावना प्राप्त करना चाहता था, तो प्रत्येक परीक्षण में 0.6 की संभावना होने के साथ मैं द्विपद वितरण का उपयोग कर सकता था। 16 परीक्षणों में से प्रत्येक की सफलता की एक अलग संभावना होने पर मैं क्या उपयोग कर सकता हूं?

3
मशीन लर्निंग: क्या मुझे बाइनरी भविष्यवाणियों के लिए एक श्रेणीगत क्रॉस एन्ट्रापी या बाइनरी क्रॉस एन्ट्रापी नुकसान का उपयोग करना चाहिए?
सबसे पहले, मुझे एहसास हुआ कि अगर मुझे द्विआधारी भविष्यवाणियां करने की आवश्यकता है, तो मुझे एक-गर्म-एन्कोडिंग के माध्यम से कम से कम दो कक्षाएं बनाना होगा। क्या ये सही है? हालांकि, केवल एक वर्ग के साथ भविष्यवाणियों के लिए बाइनरी क्रॉस एन्ट्रॉपी है? अगर मैं एक श्रेणीगत क्रॉस एन्ट्रापी …

5
तंत्रिका नेटवर्क का लागत समारोह गैर-उत्तल है?
तंत्रिका नेटवर्क की लागत फ़ंक्शन , और यह गैर-उत्तल होने का दावा किया जाता है । मुझे यह समझ में नहीं आया कि यह ऐसा क्यों है, क्योंकि मैं देख रहा हूं कि यह लॉजिस्टिक रिग्रेशन के लागत समारोह के समान है, है ना?जम्मू( डब्ल्यू।), बी )J(W,b)J(W,b) यदि यह गैर-उत्तल …

4
एसवीएम 'अनंत सुविधा वाला स्थान' कैसे खोज सकता है जहां रैखिक पृथक्करण हमेशा संभव है?
इस तथ्य के पीछे अंतर्ज्ञान क्या है कि एक गॉसियन कर्नेल के साथ एक एसवीएम में ite नाइट आयामी विशेषता स्थान है?

5
प्रतिगमन समस्याओं को "प्रतिगमन" समस्या क्यों कहा जाता है?
मैं बस सोच रहा था कि क्यों प्रतिगमन समस्याओं को "प्रतिगमन" समस्याएं कहा जाता है। नाम के पीछे की कहानी क्या है? प्रतिगमन के लिए एक परिभाषा: "एक कम परिपूर्ण या विकसित राज्य के लिए पलायन।"

1
वैरिएशन का निष्कर्ष बनाम MCMC: जब एक दूसरे को चुनने के लिए?
मुझे लगता है कि मुझे VIMC और MCMC दोनों के सामान्य विचार मिलते हैं, जिसमें MCMC के विभिन्न फ्लेवर जैसे गिब्स सैंपलिंग, मेट्रोपोलिस हेस्टिंग्स आदि शामिल हैं। यह पेपर दोनों विधियों का एक अद्भुत प्रदर्शन प्रदान करता है। मेरे पास निम्नलिखित प्रश्न हैं: अगर मैं बायेसियन इंट्रेंस करना चाहता हूं, …

2
-1 और 1 के बीच डेटा को सामान्य कैसे करें?
मैंने न्यूनतम-अधिकतम सामान्यीकरण फॉर्मूला देखा है, लेकिन यह 0 और 1. के बीच मानों को सामान्य करता है, मैं -1 और 1 के बीच अपने डेटा को कैसे सामान्य करूंगा? मेरे डेटा मैट्रिक्स में नकारात्मक और सकारात्मक दोनों मूल्य हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.