सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
प्रतिगमन में गुणांक के विश्वास अंतराल का अनुमान लगाने के लिए बूटस्ट्रैप का उपयोग करने के दो तरीके
मैं अपने डेटा में एक रेखीय मॉडल लागू कर रहा हूं: yमैं= β0+ β1एक्समैं+ ϵमैं,εमैं∼ एन( 0 , σ2) का है ।yमैं=β0+β1एक्समैं+εमैं,εमैं~एन(0,σ2)। y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). मैं बूटस्ट्रैप विधि का उपयोग करके गुणांकों के विश्वास अंतराल (CI) ( , ) का । दो तरीके हैं जिनसे मैं बूटस्ट्रैप विधि लागू …

1
क्या कार्य एक कर्नेल हो सकता है?
मशीन लर्निंग और पैटर्न मान्यता के संदर्भ में, कर्नेल ट्रिक नामक एक अवधारणा है । उन समस्याओं का सामना करना, जहां मुझे यह निर्धारित करने के लिए कहा जाता है कि क्या कोई फ़ंक्शन कर्नेल फ़ंक्शन हो सकता है या नहीं, वास्तव में क्या किया जाना चाहिए? क्या मुझे पहले …

3
चमक में फिट की अच्छाई की गणना कैसे करें (R)
मेरे पास glm फ़ंक्शन चलाने के निम्नलिखित परिणाम हैं। मैं निम्नलिखित मूल्यों की व्याख्या कैसे कर सकता हूं: अशक्त विचलन अवशिष्ट अवतरण AIC क्या उनके पास फिट होने की भलाई के लिए कुछ करना है? क्या मैं इन परिणामों से फिट माप की कुछ अच्छाई की गणना कर सकता हूं …

2
एलडीए हाइपरपरमेटर्स के लिए प्राकृतिक व्याख्या
क्या कोई यह बता सकता है कि एलडीए हाइपरपरमेटर्स के लिए प्राकृतिक व्याख्या क्या है? ALPHAऔर BETAक्रमशः (प्रति दस्तावेज) विषय और (प्रति विषय) शब्द वितरण के लिए डिरिचलेट वितरण के पैरामीटर हैं। हालाँकि क्या कोई यह बता सकता है कि इन हाइपरपेरेटरों बनाम छोटे मूल्यों के बड़े मूल्यों को चुनने …

1
GB की n.minobsinnode पैरामीटर की भूमिका R [बंद] में
यह सवाल भविष्य के किसी भी आगंतुक की मदद करने की संभावना नहीं है; यह केवल एक छोटे से भौगोलिक क्षेत्र के लिए प्रासंगिक है, समय में एक विशिष्ट क्षण, या एक असाधारण रूप से संकीर्ण स्थिति जो आमतौर पर इंटरनेट के दुनिया भर के दर्शकों के लिए लागू नहीं …
21 r  gbm 

2
अधिकतम वितरण की संभावना के लिए कौन से वितरण बंद-रूप समाधान हैं?
स्वतंत्र टिप्पणियों के एक नमूने से मापदंडों के अधिकतम संभावना अनुमानों के लिए कौन से वितरण बंद-बंद समाधान हैं?

3
जब बातचीत प्रभाव महत्वपूर्ण नहीं है तो मुख्य प्रभावों की व्याख्या कैसे करें?
मैंने आर में एक सामान्यीकृत रैखिक मिश्रित मॉडल चलाया और दो भविष्यवक्ताओं के बीच एक बातचीत प्रभाव शामिल किया। बातचीत महत्वपूर्ण नहीं थी, लेकिन मुख्य प्रभाव (दो भविष्यवक्ता) दोनों थे। अब कई पाठ्यपुस्तक के उदाहरण मुझे बताते हैं कि यदि बातचीत का एक महत्वपूर्ण प्रभाव है, तो मुख्य प्रभावों की …

4
कार्यात्मक प्रमुख घटक विश्लेषण (FPCA): यह सब क्या है?
कार्यात्मक प्रमुख घटक विश्लेषण (FPCA) एक ऐसी चीज है जिस पर मैं लड़खड़ा गया हूं और कभी समझ में नहीं आया। यह सब किस बारे मे है? शांग, 2011 द्वारा "कार्यात्मक प्रमुख घटक विश्लेषण का एक सर्वेक्षण" देखें , और मैं उद्धृत कर रहा हूं: पीसीए "आयामीता के अभिशाप" (बेलमैन …

3
यादृच्छिक चर को कार्यों के रूप में क्यों परिभाषित किया गया है?
मुझे फ़ंक्शन के रूप में एक यादृच्छिक चर की अवधारणा को समझने में समस्या हो रही है। मैं यांत्रिकी को समझता हूं (मुझे लगता है) लेकिन मैं प्रेरणा को नहीं समझता ... कहो एक संभावना ट्रिपल, जहां Ω = [ 0 , 1 ] , बी Borel- है σ -algebra …

2
क्या छोटा नमूना आकार टाइप 1 त्रुटि का कारण बन सकता है?
मैंने सीखा है कि छोटे नमूने का आकार अपर्याप्त शक्ति और टाइप 2 त्रुटि का कारण बन सकता है। हालाँकि, मुझे लगता है कि छोटे नमूने आमतौर पर अविश्वसनीय हो सकते हैं और संयोग से किसी भी तरह का परिणाम हो सकता है। क्या यह सच है?

2
क्यों एक से पहले विचरण को कमजोर माना जाता है?
पृष्ठभूमि विचरण से पहले सबसे अधिक उपयोग किए जाने वाले कमजोर में से एक, पैरामीटर (जेलमैन 2006) के साथ उलटा-गामा है ।α=0.001,β=0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 हालाँकि, इस वितरण में लगभग [3 \ times10 ^ {19}, \ infty] का 90% सीआई है [3×1019,∞][3×1019,∞][3\times10^{19},\infty]। library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 …

2
व्युत्क्रम परिवर्तन विधि कैसे काम करती है?
उलटा तरीका कैसे काम करता है? मान लें कि मेरे पास एक यादृच्छिक नमूना X1,X2,...,XnX1,X2,...,XnX_1,X_2,...,X_n साथ घनत्व f(x;θ)=1θx(1−θ)θf(x;θ)=1θx(1−θ)θf(x;\theta)={1\over \theta} x^{(1-\theta)\over \theta} ओवर 0&lt;x&lt;10&lt;x&lt;10<x<1और इसलिए cdfFX(x)=x1/θFX(x)=x1/θF_X(x)=x^{1/\theta}on(0,1)(0,1)(0,1)। फिर उलट विधि से मैं का वितरण प्राप्तXXXके रूप मेंF−1X(u)=uθFX−1(u)=uθF_X^{-1}(u)=u^\theta। ऐसा नहीं करता है uθuθu^\theta का वितरण किया गया है XXX ? क्या यह उलटा …

3
समय के साथ प्रशिक्षण की हानि बढ़ती है [डुप्लिकेट]
इस प्रश्न के पहले से ही यहाँ उत्तर हैं : लागत समारोह में बदलाव सकारात्मक कैसे हो सकता है? (1 उत्तर) जब मेरा तंत्रिका नेटवर्क नहीं सीखता है तो मुझे क्या करना चाहिए? (5 उत्तर) पिछले महीने बंद हुआ । मैं 4 प्रकार के अनुक्रमों को वर्गीकृत करने के लिए …

2
पीसीपी इन सूपी और स्केलेर अलग परिणाम देता है
क्या मैं किसी बात को गलत समझ रहा हूँ? यह मेरा कोड है कपाल का उपयोग करना import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], …

2
तंत्रिका नेटवर्क में टोंटी आर्किटेक्चर कैसे काम करते हैं?
हम एक टोंटी आर्किटेक्चर को परिभाषित करते हैं जैसे कि रेसनेट पेपर में पाया जाने वाला प्रकार [दो 3x3 कन्टेस्ट लेयर] को [एक 1x1 कनव, एक 3x3 कन्ट और दूसरी 1x1 कन्टेन लेयर] से बदल दिया जाता है। मैं समझता हूं कि 1x1 दृढ़ परतों का उपयोग आयाम में कमी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.