सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

12
वास्तविक जीवन नकारात्मक तिरछापन के साथ वितरण का उदाहरण है
" सामान्य वितरण के वास्तविक जीवन के उदाहरण " से प्रेरित होकर , मुझे आश्चर्य है कि लोग नकारात्मक तिरछेपन का प्रदर्शन करने के लिए किस शैक्षणिक उदाहरण का उपयोग करते हैं? शिक्षण में उपयोग किए जाने वाले सममित या सामान्य वितरण के कई "विहित" उदाहरण हैं - भले ही …

1
लॉग का अपेक्षित मूल्य और भिन्नता (ए)
मैं एक यादृच्छिक चर है एक्स( a ) = लॉग( ए )X(a)=log⁡(a)X(a) = \log(a) , जहां एक सामान्य वितरित एन( μ , σ2)N(μ,σ2)\mathcal N(\mu,\sigma^2) । मैं के बारे में क्या कह सकते हैं इ( एक्स))E(X)E(X) और वीए आर ( एक्स))Var(X)Var(X) ? एक अनुमान भी मददगार होगा।

1
सैंडविच अनुमानक अंतर्ज्ञान
विकिपीडिया और आर सैंडविच पैकेज विगनेट, ओएलएस गुणांक मानक त्रुटियों का समर्थन करने वाली मान्यताओं और सैंडविच निर्माताओं की गणितीय पृष्ठभूमि के बारे में अच्छी जानकारी देते हैं। मैं अभी भी स्पष्ट नहीं हूं कि अवशेषों की विषमता की समस्या को कैसे संबोधित किया जाता है, शायद इसलिए कि मैं …

3
शून्य हाइपोथीसिस को अस्वीकार करने के लिए 0.04993 का पी-मूल्य पर्याप्त है?
एक विलकॉक्सन हस्ताक्षरित-रैंक सांख्यिकीय महत्व परीक्षण में, हम कुछ आंकड़ों के साथ आए, जो का । की एक सीमा के साथ , क्या यह परिणाम अशक्त परिकल्पना को अस्वीकार करने के लिए पर्याप्त है, या क्या यह कहना सुरक्षित है कि परीक्षण अनिर्णायक था, क्योंकि यदि हम पी-मान को 3 …

2
बाइनरी डेटा के लिए समानता गुणांक: रसेल और राव पर जैकार्ड का चयन क्यों करें?
से सांख्यिकीय विज्ञान विश्वकोश मुझे लगता है कि यह देखते हुए समझ में दिचोतोमोउस (बाइनरी: 1 = वर्तमान; 0 = अनुपस्थित) विशेषताओं (चर), हम किसी भी दो वस्तुओं के लिए एक आपात तालिका फार्म कर सकते हैं मैं और जे एक नमूने की:पीपीp j 1 0 ------- 1 | a …

2
आवर्तक सुदृढीकरण सीखना क्या है
मैं हाल ही में "आवर्तक सुदृढीकरण सीखने" के शब्द पर आया हूं। मैं समझता हूं कि "पुनरावर्ती तंत्रिका नेटवर्क" क्या है और "सुदृढीकरण सीखना" क्या है, लेकिन "पुनरावृत्ति सुदृढीकरण सीखना" के बारे में अधिक जानकारी नहीं मिल सकी है। क्या कोई मुझे समझा सकता है कि एक "रिकरंट रिइनफोर्समेंट लर्निंग" …

3
रैखिक पृथक्करण के लिए परीक्षण
क्या उच्च आयामों में दो-स्तरीय डेटासेट के रैखिक पृथक्करण का परीक्षण करने का एक तरीका है? मेरे फ़ीचर वैक्टर 40-लंबे हैं। मुझे पता है कि मैं हमेशा लॉजिस्टिक रिग्रेशन प्रयोगों को चला सकता हूं और यह निष्कर्ष निकालने के लिए हिट्रेट बनाम झूठी अलार्म दर निर्धारित कर सकता हूं कि …

2
EM एल्गोरिथ्म मैन्युअल रूप से लागू किया गया
मैं ईएम एल्गोरिथ्म मैन्युअल लागू करने और उसके बाद के परिणामों की तुलना करना चाहते हैं normalmixEMका mixtoolsपैकेज। निश्चित रूप से, मुझे खुशी होगी अगर वे दोनों एक ही परिणाम के लिए नेतृत्व करेंगे। मुख्य संदर्भ जेफ्री मैकलैक्लन (2000), फ़िनाइट मिक्सचर मॉडल है । मेरे पास दो गॉसियों का मिश्रण …

2
क्या हम प्रकृति में कहीं सामान्य वक्र का आकार देख सकते हैं?
मैं यह नहीं जानना चाहता कि क्या प्रकृति में कुछ घटनाओं का सामान्य वितरण है, लेकिन क्या हम कहीं न कहीं सामान्य वक्र का आकार देख सकते हैं क्योंकि हम इसे गैल्टन बॉक्स में उदाहरण के लिए देख सकते हैं। विकिपीडिया के इस आंकड़े को देखें । ध्यान दें कि …

1
क्या रैंडम वैरिएबल सहसंबंधित होते हैं यदि और केवल तभी जब उनके रैंक सहसंबद्ध होते हैं?
मान लें कि परिमित दूसरे क्षणों के साथ निरंतर यादृच्छिक चर हैं। स्पीयरमैन के रैंक सहसंबंध गुणांक ρ_s के जनसंख्या संस्करण को Pearson के उत्पाद-क्षण गुणांक ρ के रूप में परिभाषित किया जा सकता है, प्रायिकता इंटीग्रल का रूपांतरण F_X (X) और F_Y (Y) , जहां F_X, F_Y cdf के …

5
उम्मीद अधिकतमकरण एल्गोरिथ्म का प्रेरणा
EM एल्गोरिथ्म दृष्टिकोण में हम Jensen की असमानता का उपयोग करने के लिए पर पहुंचने के लिएlogp(x|θ)≥∫logp(z,x|θ)p(z|x,θ(k))dz−∫logp(z|x,θ)p(z|x,θ(k))dzlog⁡p(x|θ)≥∫log⁡p(z,x|θ)p(z|x,θ(k))dz−∫log⁡p(z|x,θ)p(z|x,θ(k))dz\log p(x|\theta) \geq \int \log p(z,x|\theta) p(z|x,\theta^{(k)}) dz - \int \log p(z|x,\theta) p(z|x,\theta^{(k)})dz और को θ ( कश्मीर + 1 ) = आर्ग अधिकतम θ ∫ लॉग पी ( z , x | θ …

3
फिशर मैट्रिक और रिश्तेदार एन्ट्रापी के बीच संबंध
क्या कोई फ़िशर सूचना मीट्रिक और रिश्तेदार एन्ट्रापी (या केएल विचलन) के बीच निम्नलिखित संबंध को विशुद्ध रूप से गणितीय रूप से कठोर तरीके से साबित कर सकता है ? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) ) =\frac{1}{2} g_{i,j} \, da^i \, da^j + (O( \|da\|^3)a=(a1,…,an),da=(da1,…,dan)a=(a1,…,an),da=(da1,…,dan)a=(a^1,\dots, a^n), da=(da^1,\dots,da^n)gi,j=∫∂i(logp(x;a))∂j(logp(x;a)) p(x;a) dxgi,j=∫∂i(log⁡p(x;a))∂j(log⁡p(x;a)) …

1
यादृच्छिक वन पेड़ों के लिए छंटाई की आवश्यकता क्यों नहीं है?
ब्रीमन का कहना है कि पेड़ों को छंटाई के साथ उगाया जाता है। क्यों? मेरे कहने का तात्पर्य यह है कि इस बात का ठोस कारण होना चाहिए कि बेतरतीब जंगल में पेड़ क्यों नहीं उगते हैं। दूसरी ओर, एक एकल निर्णय पेड़ को अधिक फिटिंग से बचने के लिए …

4
निरंतर डेटा मॉडलिंग करते समय एक पॉइसन वितरण कैसे काम करता है और क्या इससे सूचना हानि होती है?
एक सहकर्मी कुछ बुरा Heteroscedasticity (नीचे आंकड़ा) के साथ उसके शोध प्रबंध के लिए कुछ जैविक डेटा का विश्लेषण कर रहा है। वह एक मिश्रित मॉडल के साथ इसका विश्लेषण कर रही है लेकिन अभी भी अवशेषों से परेशान है। प्रतिक्रिया-चर को लॉग-ट्रांसफ़ॉर्म करना चीजों को साफ़ करता है और …

1
libsvm "पुनरावृत्तियों की अधिकतम संख्या तक पहुँच" चेतावनी और क्रॉस-मान्यता
मैं डिग्री 2 के बहुपद कर्नेल के साथ C-SVC मोड में libsvm का उपयोग कर रहा हूं और मुझे कई एसवीएम को प्रशिक्षित करने की आवश्यकता है। प्रत्येक प्रशिक्षण सेट में 10 सुविधाएँ और 5000 वैक्टर हैं। प्रशिक्षण के दौरान, मुझे अधिकांश SVM के लिए यह चेतावनी मिल रही है …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.