सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

7
उस सांख्यिकीय गिरावट का क्या नाम है जिससे पिछले सिक्के के परिणामों के नतीजे बाद के सिक्का के बारे में मान्यताओं को प्रभावित करते हैं?
जैसा कि हम सभी जानते हैं, यदि आप एक सिक्के को फ्लिप करते हैं जिसके सिर के बराबर लैंडिंग की संभावना है क्योंकि यह पूंछ करता है, तो यदि आप कई बार सिक्का फ्लिप करते हैं, तो आधा समय आपको सिर मिलेगा और आधे समय में आपको पूंछ मिल जाएगी। …

1
टेलर एक्सपेंशन के साथ XGBoost लॉस फंक्शन अप्रूवल
उदाहरण के लिए, पर XGBoost मॉडल का उद्देश्य समारोह ले 'वें यात्रा:ttt L(t)=∑i=1nℓ(yi,y^(t−1)i+ft(xi))+Ω(ft)L(t)=∑i=1nℓ(yi,y^i(t−1)+ft(xi))+Ω(ft)\mathcal{L}^{(t)}=\sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)}+f_t(\mathbf{x}_i))+\Omega(f_t) जहां नुकसान समारोह है, है 'वें पेड़ उत्पादन और नियमितीकरण है। तेजी से गणना के लिए (कई) महत्वपूर्ण चरणों में से एक है:ℓℓ\ellftftf_ttttΩΩ\Omega L(t)≈∑i=1nℓ(yi,y^(t−1)i)+gtft(xi)+12hif2t(xi)+Ω(ft),L(t)≈∑i=1nℓ(yi,y^i(t−1))+gtft(xi)+12hift2(xi)+Ω(ft),\mathcal{L}^{(t)}\approx \sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)})+g_tf_t(\mathbf{x}_i)+\frac{1}{2}h_if_t^2(\mathbf{x}_i)+\Omega(f_t), जहां gigig_i और hihih_i नुकसान फ़ंक्शन के पहले और दूसरे डेरिवेटिव हैं। …

7
सांख्यिकी अवधारणा की व्याख्या करने के लिए कि आपको कम संख्या में सिर को पूंछ के रूप में फ्लिप करने की संभावना क्यों है, क्योंकि फ़्लिप की संख्या बढ़ जाती है?
मैं कुछ किताबें पढ़कर और कुछ कोड लिखकर संभाव्यता और सांख्यिकी सीखने पर काम कर रहा हूं, और सिक्का फ्लिप्स का अनुकरण करते समय मैंने कुछ ऐसा देखा जो मुझे किसी के भोले अंतर्ज्ञान से थोड़ा काउंटर करता है। यदि आप एक उचित सिक्के को बार फ्लिप करते हैं , …

2
EM और ग्रेडिएंट एसेंट के बीच अंतर क्या है?
एल्गोरिदम ईएम (एक्सपेक्टेशन मैक्सिमाइजेशन) और ग्रैडिएंट एसेंट (या डीसेंट) में क्या अंतर है? क्या कोई शर्त है जिसके तहत वे समकक्ष हैं?

1
एक काटे गए वितरण के लिए अधिकतम संभावना अनुमानक
पर विचार करें स्वतंत्र नमूने एक यादृच्छिक चर से प्राप्त कि एक छोटा कर दिया वितरण का पालन करने माना जाता है (उदाहरण के लिए एक छोटा कर दिया सामान्य वितरण न्यूनतम जाना जाता है (परिमित) और अधिकतम मानों के) और लेकिन अज्ञात मापदंडों के और । यदि एक गैर-काटे …

3
गाऊसी अनुपात वितरण: डेरिवेटिव्स अंतर्निहित अंतर्निहित 's और s
मैं दो स्वतंत्र सामान्य वितरण और साथ काम कर रहा हूं , जिसका अर्थ है और और variances और ।XXXYYYμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y मुझे उनके अनुपात के वितरण में दिलचस्पी है । न तो और का शून्य का मतलब है, इसलिए को कॉची के रूप में वितरित नहीं किया गया है।Z=X/YZ=X/YZ=X/YXXXYYYZZZ मुझे का …

3
"स्वतंत्र टिप्पणियों" का क्या अर्थ है?
मैं यह समझने की कोशिश कर रहा हूं कि स्वतंत्र टिप्पणियों का क्या मतलब है। कुछ परिभाषाएँ हैं: "दो घटनाएँ स्वतंत्र हैं यदि और केवल यदि ।" ( सांख्यिकीय शर्तें शब्दकोश )पी(a∩b)=P(a)∗P(b)पी(ए∩ख)=पी(ए)*पी(ख)P(a \cap b) = P(a) * P(b) "एक घटना की घटना दूसरे के लिए संभावना नहीं बदलती" ( विकिपीडिया …

7
आर पैकेज क्यों और कब बनाएं?
मैं समझता हूं कि यह प्रश्न काफी व्यापक है, लेकिन मुझे आश्चर्य है कि आर के लिए एक नया पैकेज बनाने (या नहीं) का निर्णय लेने में निर्णायक बिंदु क्या होना चाहिए। और अधिक विशिष्ट होने के लिए, मैं यह जोड़ना चाहूंगा कि यह सवाल उन कारणों के बारे में …
28 r  software 

5
आम वितरण के वास्तविक जीवन के उदाहरण
मैं सांख्यिकी के लिए रुचि विकसित करने वाला एक स्नातक छात्र हूं। मुझे सामग्री बहुत पसंद है, लेकिन मुझे कभी-कभी वास्तविक जीवन के अनुप्रयोगों के बारे में सोचने में कठिन समय लगता है। विशेष रूप से, मेरा प्रश्न आमतौर पर इस्तेमाल किए जाने वाले सांख्यिकीय वितरण (सामान्य - बीटा- गामा …

5
एक सांख्यिकी पुस्तक जो समीकरणों की तुलना में अधिक छवियों का उपयोग करके बताती है
मुझे आंकड़ों में दिलचस्पी हो गई है, लेकिन मुझे यह स्वीकार करना चाहिए कि जब मैंने गणित को गंभीरता से लिया है, तब तक यह एक लंबा समय है। कभी-कभी मैं समझता हूं कि समीकरणों का क्या मतलब है, लेकिन कभी-कभी मैं उनका अनुसरण नहीं कर सकता। मुझे यहां दिए …
28 references 

3
क्या होगा यदि आपका यादृच्छिक नमूना स्पष्ट रूप से प्रतिनिधि नहीं है?
क्या होगा यदि आप एक यादृच्छिक नमूना लेते हैं और आप देख सकते हैं कि यह स्पष्ट रूप से प्रतिनिधि नहीं है, जैसा कि हालिया प्रश्न में है । उदाहरण के लिए, क्या होगा यदि जनसंख्या वितरण 0 के आसपास सममित माना जाता है और आपके द्वारा बेतरतीब ढंग से …

3
बढ़ावा देने में, शिक्षार्थी "कमजोर" क्यों हैं?
इसी तरह का सवाल आँकड़े पर भी देखें । में बढ़ाने जैसे एल्गोरिदम AdaBoost और LPBoost यह ज्ञात है कि "कमज़ोर" शिक्षार्थियों केवल, उपयोगी होने के लिए विकिपीडिया से मौका तुलना में बेहतर प्रदर्शन करने के लिए है जोड़ा जा करने के लिए: इसका उपयोग करने वाले क्लासीफायर कमजोर हो …

5
रैखिक प्रतिगमन के लिए समरूपता धारणा का उल्लंघन करने के खतरे क्या हैं?
एक उदाहरण के रूप ChickWeightमें, आर में सेट किए गए आंकड़ों पर विचार करें । समय के साथ विचरण स्पष्ट रूप से बढ़ता है, इसलिए यदि मैं एक सरल रेखीय प्रतिगमन का उपयोग करता हूं जैसे: m <- lm(weight ~ Time*Diet, data=ChickWeight) मेरे सवाल: मॉडल के कौन से पहलू संदिग्ध …

4
एक अध्ययन शिक्षा बनाम स्व अध्ययन?
प्रोग्रामर पर समान इरादे के साथ एक सवाल है । एसई । उस प्रश्न के कुछ अच्छे उत्तर हैं, लेकिन सामान्य विषय यह लगता है कि बिना आत्म अध्ययन के, आपको कोई जगह नहीं मिलती। जाहिर है प्रोग्रामिंग और सांख्यिकी के बीच कुछ प्रमुख अंतर हैं - प्रोग्रामिंग के साथ, …

1
मिश्रित-प्रभाव मॉडल में यादृच्छिक प्रभावों के विचरण और सहसंबंध की व्याख्या कैसे करें?
मुझे आशा है कि आप सभी को यह सवाल बुरा नहीं लगेगा, लेकिन मुझे एक रैखिक मिश्रित प्रभाव मॉडल उत्पादन के लिए आउटपुट की व्याख्या करने में मदद की ज़रूरत है जो मैं आर में करने के लिए सीखने की कोशिश कर रहा हूं। मैं अनुदैर्ध्य डेटा विश्लेषण और रैखिक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.