सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
आपको कब और क्यों एक वितरण (संख्याओं) का लॉग लेना चाहिए?
कहो कि मेरे पास कुछ ऐतिहासिक डेटा हैं, पिछले स्टॉक की कीमतें, एयरलाइन टिकट की कीमत में उतार-चढ़ाव, कंपनी के पिछले वित्तीय डेटा ... अब कोई (या कोई सूत्र) साथ आता है और कहता है "चलो वितरण के लॉग का उपयोग करें / उपयोग करें" और यहाँ मैं WHY कहाँ …

4
क्यूक्यू प्लॉट की व्याख्या कैसे करें
मैं एक छोटे डेटासेट (21 अवलोकनों) के साथ काम कर रहा हूं और आर में सामान्य क्यूक्यू प्लॉट है: यह देखते हुए कि साजिश सामान्यता का समर्थन नहीं करती है, मैं अंतर्निहित वितरण के बारे में क्या अनुमान लगा सकता हूं? यह मुझे लगता है कि अधिक वितरण को दाईं …

9
क्यों दसियों के साथ अचानक आकर्षण?
मैंने हाल ही में देखा है कि बहुत सारे लोग कई तरीकों (टैंसर फैक्टराइजेशन, टेनर कर्नेल, विषय मॉडलिंग के लिए टेंसर्स आदि) के टेनॉर समकक्ष विकसित कर रहे हैं, मैं सोच रहा हूं, दुनिया अचानक टेंसर्स के साथ क्यों मोहित हो गई है? क्या हाल के पेपर / मानक परिणाम …

3
मुझे लसो बनाम रिज का उपयोग कब करना चाहिए?
मान लीजिए कि मैं बड़ी संख्या में मापदंडों का अनुमान लगाना चाहता हूं, और मैं उनमें से कुछ को दंडित करना चाहता हूं क्योंकि मेरा मानना ​​है कि उनका दूसरों की तुलना में बहुत कम प्रभाव होना चाहिए। मैं कैसे तय करूं कि किस दंड योजना का उपयोग करना है? …


8
रैखिक प्रतिगमन में, वास्तविक मूल्यों के बजाय एक स्वतंत्र चर के लॉग का उपयोग करना कब उचित है?
क्या मैं प्रश्न में स्वतंत्र चर के लिए एक बेहतर व्यवहार किए गए वितरण की तलाश कर रहा हूं, या बाहर के प्रभाव को कम करने के लिए, या कुछ और?

8
लॉजिस्टिक रिग्रेशन में सही अलगाव से कैसे निपटें?
यदि आपके पास एक चर है जो लक्ष्य चर में पूरी तरह से शून्य और लोगों को अलग करता है, तो आर निम्नलिखित "पूर्ण या अर्ध पूर्ण पृथक्करण" चेतावनी संदेश देगा: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred हम अभी भी मॉडल प्राप्त करते हैं लेकिन गुणांक …

21
क्या जूलिया को सांख्यिकीय समुदाय में चिपके रहने की कोई उम्मीद है?
मैं हाल ही में आर-ब्लॉगर से एक पोस्ट, से जुड़ी पढ़ इस ब्लॉग पोस्ट नामक एक नई भाषा के बारे में जॉन माइल्स व्हाइट से जूलिया । जूलिया एक जस्ट-इन-टाइम कंपाइलर का लाभ उठाता है जो इसे दुष्ट तेजी से चलाता है और इसे गति के परिमाण पर C / …

3
आर के लैमर चीट शीट
विभिन्न पदानुक्रमित मॉडल का उपयोग करने के उचित तरीके के बारे में इस मंच पर बहुत चर्चा चल रही है lmer। मुझे लगा कि एक ही जगह सारी जानकारी रखना बहुत अच्छा होगा। सवालों की एक जोड़ी शुरू करने के लिए: कई स्तरों को कैसे निर्दिष्ट किया जाए, जहां एक …

3
आरओसी बनाम सटीक-और-रिकॉल घटता है
मैं उनके बीच औपचारिक मतभेदों को समझता हूं, जो मैं जानना चाहता हूं वह यह है कि एक बनाम दूसरे का उपयोग करना अधिक प्रासंगिक है। क्या वे हमेशा किसी दिए गए वर्गीकरण / पहचान प्रणाली के प्रदर्शन के बारे में पूरक अंतर्दृष्टि प्रदान करते हैं? एक कागज में यह …

2
मैं R में किसी डेटा की पंक्तियों की संख्या कैसे प्राप्त करूं? [बन्द है]
डेटासेट पढ़ने के बाद: dataset <- read.csv("forR.csv") मुझे मेरे द्वारा दिए गए मामलों की संख्या देने के लिए आर कैसे मिल सकता है? इसके अलावा, क्या लौटाए गए मूल्य में शामिल मामलों को शामिल नहीं किया जाएगा na.omit(dataset)?
157 r 

2
पीढ़ीगत बनाम भेदभावपूर्ण
मुझे पता है कि जेनेरिक का अर्थ है " पर आधारित" और भेदभाव का मतलब है " आधार पर ", लेकिन मैं कई बिंदुओं पर भ्रमित हूं:P ( y | x )P(x,y)P(x,y)P(x,y)P(y|x)P(y|x)P(y|x) विकिपीडिया (वेब ​​पर कई अन्य हिट) एसवीएम जैसी चीजों को वर्गीकृत करते हैं और भेदभावपूर्ण होने के नाते …


6
1 से अधिक होने की संभावना वितरण मूल्य ठीक हो सकता है?
भोले Bayes के बारे में विकिपीडिया पृष्ठ पर , यह रेखा है: p(height|male)=1.5789पी(जइमैंजीजटी|मएएलइ)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (1 के लिए एक संभाव्यता वितरण ठीक है। यह घंटी वक्र के नीचे का क्षेत्र है जो 1. के बराबर है।) एक मान कैसे ठीक हो सकता है? मैंने सोचा था कि सभी संभाव्यता मूल्य …

6
K- गुना क्रॉस-सत्यापन के बाद एक पूर्वानुमान मॉडल का चयन कैसे करें?
मैं सोच रहा हूं कि के-फोल्ड क्रॉस-वैरिफिकेशन करने के बाद एक प्रेडिक्टिव मॉडल कैसे चुना जाए। यह अजीबोगरीब तरीके से किया जा सकता है, इसलिए मुझे और अधिक विस्तार से समझाएं: जब भी मैं K- गुना क्रॉस-सत्यापन चलाते हैं, मैं प्रशिक्षण डेटा के K सबसेट का उपयोग करता हूं, और …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.