सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

17
मशीन सीखने रसोई की किताब / संदर्भ कार्ड / धोखा देती है?
मुझे डेटा माइनिंग के लिए संभाव्यता और सांख्यिकी कुकबुक और आर संदर्भ कार्ड जैसे संसाधन अविश्वसनीय रूप से उपयोगी हैं। वे स्पष्ट रूप से संदर्भ के रूप में अच्छी तरह से काम करते हैं, लेकिन मुझे एक विषय पर अपने विचारों को व्यवस्थित करने और भूमि पर लेटने में भी …

8
क्या यह कभी स्पष्ट डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है?
असतत और निरंतर डेटा पर इस सवाल का जवाब देने में मैंने गौर किया कि यह शायद ही कभी डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है। इसके चेहरे पर जो स्वयं स्पष्ट प्रतीत होता है, लेकिन अंतर्ज्ञान अक्सर आंकड़ों के लिए एक गरीब …

2
बेयस रिग्रेशन: यह मानक रिग्रेशन की तुलना में कैसे किया जाता है?
मुझे बायेसियन रिग्रेशन के बारे में कुछ सवाल मिले: रूप में एक मानक प्रतिगमन को देखते हुए । अगर मैं इसे एक बायेसियन रिग्रेशन में बदलना चाहता हूं, तो क्या मुझे और दोनों के लिए पूर्व वितरण की आवश्यकता है (या यह इस तरह से काम नहीं करता है)?y=β0+β1x+εy=β0+β1x+εy = …

10
प्रशिक्षण त्रुटि से कम त्रुटि?
मुझे इस मुद्दे के बारे में यहां और यहां दो प्रश्न मिले लेकिन अभी तक कोई स्पष्ट उत्तर या स्पष्टीकरण नहीं है। मैं उसी समस्या को लागू करता हूं जहां सत्यापन त्रुटि मेरे रूपांतरण तंत्रिका नेटवर्क में प्रशिक्षण त्रुटि से कम है। इसका क्या मतलब है?

3
लॉग स्केल कब उपयुक्त हैं?
मैंने पढ़ा है कि चार्टिंग / ग्राफ़िंग का उपयोग करते समय चार्टिंग / ग्राफिंग कुछ परिस्थितियों में उचित होती है, जैसे कि समय श्रृंखला चार्ट में y- अक्ष। हालाँकि, मैं इस बारे में एक निश्चित स्पष्टीकरण नहीं पा सका हूँ कि ऐसा क्यों है, या जब यह उचित होगा। कृपया …

3
क्यों नमूना मानक विचलन का एक पक्षपाती आकलनकर्ता है
मानक विचलन के निष्पक्ष आकलन पर विकिपीडिया लेख के अनुसार नमूना एसडी s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} जनसंख्या के एसडी का एक पक्षपाती अनुमानक है। यह बताता है कि ।E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} एनबी। यादृच्छिक चर स्वतंत्र होते हैं और प्रत्येकxi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) मेरा सवाल दो गुना है: पक्षपात …

9
क्या “80 में से 1 की मृत्यु कार दुर्घटना से हुई” गलत है? ”कार दुर्घटना के परिणामस्वरूप 80 लोगों में से 1 की मृत्यु हो जाती है?”
स्टेटमेंट वन (S1): "80 मौतों में से एक कार दुर्घटना के कारण होती है।" कथन दो (S2): "कार दुर्घटना के परिणामस्वरूप 80 लोगों में से एक की मृत्यु हो जाती है।" अब, मैं व्यक्तिगत रूप से इन दोनों कथनों के बीच बहुत अंतर नहीं देखता हूं। लिखते समय, मैं उन्हें …

7
उद्योग बनाम कागल की चुनौतियां। क्या अधिक अवलोकन एकत्र करना और फैंसी मॉडलिंग की तुलना में अधिक चर का उपयोग करना अधिक महत्वपूर्ण है?
मुझे आशा है कि शीर्षक स्व व्याख्यात्मक है। कागले में, अधिकांश विजेता एमएसई, सटीकता के कुछ अतिरिक्त% निचोड़ने के लिए कभी-कभी सैकड़ों आधार मॉडल के साथ स्टैकिंग का उपयोग करते हैं ... सामान्य तौर पर, आपके अनुभव में, फैंसी मॉडलिंग जैसे कि स्टैकिंग बनाम बस अधिक डेटा और अधिक सुविधाएँ …


6
L2 नियमितीकरण गौसियन प्रायर के बराबर है
मैं इसे पढ़ता रहता हूं और सहज रूप से मैं इसे देख सकता हूं लेकिन कोई एल 2 नियमितीकरण से यह कहने के लिए कैसे जाता है कि यह विश्लेषणात्मक रूप से एक गाऊसी पूर्व है? L1 कहने के लिए समान पूर्ववर्ती एक लाप्लासियन के बराबर है। आगे कोई संदर्भ …

1
R में लॉजिस्टिक रिग्रेशन सही पृथक्करण (हक-डोनर घटना) के परिणामस्वरूप हुआ। अब क्या?
मैं 50 निरंतर व्याख्यात्मक चर का उपयोग करके एक द्विआधारी परिणाम की भविष्यवाणी करने की कोशिश कर रहा हूं (अधिकांश चर की सीमा है से binary )। मेरे डेटा सेट में लगभग 24,000 पंक्तियाँ हैं। जब मैं R में दौड़ता हूं , मुझे मिलता है:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm …

8
गहन शिक्षण के लिए पुस्तकालय
मैं सोच रहा था कि वहाँ कोई अच्छा आर पुस्तकालयों वहाँ गहरी सीखने तंत्रिका नेटवर्क के लिए है? मैं वहाँ पता nnet, neuralnetहै, और RSNNSहै, लेकिन इनमें से कोई भी गहरी शिक्षण विधियों को लागू करने लगते हैं। मैं विशेष रूप से पर्यवेक्षित सीखने के बाद अनपरावीकृत में रुचि रखता …

4
क्या 95% विश्वास अंतराल के भीतर सभी मूल्य समान रूप से होने की संभावना है?
मुझे इस प्रश्न पर अप्रिय जानकारी मिली है: " यदि कोई साधन या अनुपात में अंतर का 95% विश्वास अंतराल (CI) का निर्माण करता है, तो क्या CI के भीतर सभी मूल्य समान रूप से होने की संभावना है? या, क्या बिंदु का अनुमान सबसे अधिक है? , सीआई के …

6
क्या फिशर और नेमन-पीयरसन के बीच "हाइब्रिड" सांख्यिकीय परीक्षण के लिए वास्तव में एक "अविवेकी मिशाश" है?
विचार के एक निश्चित स्कूल में मौजूद है जिसके अनुसार सांख्यिकीय परीक्षण के लिए सबसे व्यापक दृष्टिकोण दो दृष्टिकोणों के बीच एक "हाइब्रिड" है: फिशर का और नेमन-पियर्सन का; ये दो दृष्टिकोण, दावा "असंगत" हैं, और इसलिए परिणामी "हाइब्रिड" एक "अविवेकी मिशाश" है। मैं नीचे एक ग्रंथ सूची और कुछ …

9
कैसे एक lme4 मिश्रित मॉडल में एक प्रभाव के पी-मूल्य (चेक महत्व) प्राप्त करने के लिए?
मैं मिश्रित मॉडल को फिट करने के लिए R में lme4 का उपयोग करता हूं lmer(value~status+(1|experiment))) जहां मूल्य निरंतर है, स्थिति और प्रयोग कारक हैं, और मुझे मिलता है Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.