सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
क्लस्टरिंग - क्लेनबर्ग की असंभवता प्रमेय के पीछे अंतर्ज्ञान
मैं क्लेनबर्ग (2002) द्वारा इस दिलचस्प विश्लेषण पर एक ब्लॉग पोस्ट लिखने के बारे में सोच रहा हूं जो क्लस्टरिंग की कठिनाई की पड़ताल करता है। क्लेनबर्ग एक क्लस्टरिंग फंक्शन के लिए तीन प्रतीत होता है सहज डेसिडरटा की रूपरेखा तैयार करता है और फिर साबित करता है कि ऐसा …

2
एक नमूना का सीडीएफ समान रूप से क्यों वितरित किया जाता है
मैंने यहाँ पढ़ा है कि एक नमूना दिया गया है cdf साथ एक निरंतर वितरण से , अनुरूप नमूना एक मानक समान वितरण का अनुसरण करता है।F X U i = F X ( X i )X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) मैंने इसे पायथन में गुणात्मक सिमुलेशन …
17 pdf  uniform  cdf  intuition 

5
क्या हमें एक अनुप्रयुक्त सांख्यिकी पाठ्यक्रम में कुर्तोसिस सिखाना चाहिए? यदि हां, तो कैसे?
केंद्रीय प्रवृत्ति, प्रसार और तिरछापन सभी को अपेक्षाकृत अच्छी तरह से परिभाषित किया जा सकता है, कम से कम एक सहज ज्ञान युक्त आधार पर; इन चीजों के मानक गणितीय उपाय भी हमारी सहज धारणाओं के अनुरूप हैं। लेकिन कुर्तोसिस अलग लगता है। यह बहुत भ्रामक है और यह वितरण …

3
मुझे पहनावा क्लासिफायर का उपयोग कब नहीं करना चाहिए?
सामान्य तौर पर, एक वर्गीकरण समस्या में जहां लक्ष्य आउट-ऑफ-सैंपल क्लास सदस्यता की सटीक भविष्यवाणी करना है, मुझे एंबेडेड एम्पलीफायर का उपयोग कब नहीं करना चाहिए ? यह प्रश्न निकट से संबंधित है कि हमेशा पहनावा सीखने का उपयोग क्यों न करें? । यह सवाल पूछता है कि हम हर …

2
प्रतिगमन विश्लेषण और वक्र फिटिंग के बीच अंतर
क्या कोई मुझे प्रतिगमन विश्लेषण और वक्र फिटिंग (रैखिक और गैर-रेखीय) के बीच वास्तविक अंतर (उदाहरण) समझा सकता है, यदि संभव हो तो एक उदाहरण के साथ? ऐसा लगता है कि दोनों दो चर (स्वतंत्र बनाम निर्भर) के बीच संबंध खोजने की कोशिश करते हैं और फिर प्रस्तावित मॉडल से …

3
क्या वर्णनात्मक आंकड़ों के पी-मान हैं?
मुझे वर्णनात्मक आंकड़ों के लिए पी-मान खोजने के लिए कहा जा रहा है। हालाँकि, यह मेरी समझ है कि पी-मान परीक्षण आंकड़ों के लिए हैं। यदि मैं गलत नहीं हूं, तो एक पी-वैल्यू टेस्ट स्टेटिस्टिक के रूप में एक मूल्य का अवलोकन करने की संभावना है यदि अशक्त परिकल्पना सच …

1
एन अंतराल को समान रूप से यादृच्छिक रूप से आकर्षित करना, संभावना है कि कम से कम एक अंतराल सभी अन्य के साथ ओवरलैप हो
[ 0 , 1 ] से यादृच्छिक रूप से एनnn अंतराल , जहां प्रत्येक अंत बिंदु A, B को [ 0 , 1 ] के बीच समान वितरण से चुना जाता है ।[0,1][0,1][0,1][0,1] क्या संभावना है कि कम से कम एक अंतराल सभी दूसरों के साथ ओवरलैप हो जाए?

1
LOESS के लिए पूर्वानुमान अंतराल की गणना कैसे करें?
मेरे पास कुछ डेटा है जो मैंने R में LOESS मॉडल का उपयोग करके फिट किया है, मुझे यह दे रहा है: डेटा में एक भविष्यवक्ता और एक प्रतिक्रिया है, और यह विषमलैंगिक है। मैंने विश्वास अंतराल भी जोड़ा। समस्या यह है कि अंतराल लाइन के लिए विश्वास अंतराल हैं, …

1
बैगिंग की सैद्धांतिक गारंटी क्या है
मैंने (लगभग) सुना है कि: बैगिंग एक भविष्यवक्ता / अनुमानक / सीखने के एल्गोरिथ्म के विचरण को कम करने की एक तकनीक है। हालाँकि, मैंने कभी इस कथन का औपचारिक गणितीय प्रमाण नहीं देखा। क्या किसी को पता है कि यह गणितीय रूप से सच क्यों है? यह सिर्फ इतना …

2
इको स्टेट नेटवर्क्स की एक सहज व्याख्या क्या है?
मैं आवर्तक तंत्रिका नेटवर्क (आरएनएन) के लिए नया हूं और अभी भी अवधारणाओं को सीख रहा हूं। मैं एक अमूर्त स्तर पर समझता हूं कि एक इको स्टेट नेटवर्क (ईएसएन) इनपुट हटाए जाने के बाद भी इनपुट के अनुक्रम का उत्पादन (पुन:) करने में सक्षम है। हालाँकि, मुझे स्कॉलरपीडिया लेख …

2
एक पूर्व के लिए उदाहरण, कि जेफ्री के विपरीत, एक पोस्टीरियर की ओर जाता है जो कि अपरिवर्तनीय नहीं है
मैं एक सवाल का "जवाब" दे रहा हूं, जो मैंने कुछ दो हफ्ते पहले यहां दिया था: जेफ्रीज पूर्व उपयोगी क्यों है? यह वास्तव में एक सवाल था (और मुझे उस समय टिप्पणी पोस्ट करने का अधिकार नहीं था, या तो), हालांकि, मुझे आशा है कि ऐसा करना ठीक है: …

2
क्या (सममित) वितरण नमूना माध्यिका की तुलना में अधिक कुशल अनुमानक है?
मैंने इस विश्वास के तहत लेबल किया है कि नमूना माध्य नमूना की तुलना में केंद्रीय प्रवृत्ति का अधिक मजबूत माप है, क्योंकि यह आउटलेर को अनदेखा करता है। इसलिए मुझे यह जानकर आश्चर्य हुआ ( एक अन्य प्रश्न के उत्तर में ) कि सामान्य वितरण से लिए गए नमूनों …

2
के वितरण क्या है
मेरे पास चार स्वतंत्र रूप से वितरित चर हैं a,b,c,da,b,c,da,b,c,d , प्रत्येक में [0,1][0,1][0,1] । मैं के वितरण की गणना करना चाहता हूं (a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc। मैं के वितरण की गणना की u2=4bcu2=4bcu_2=4bc होने के लिए f2(u2)=−14lnu24f2(u2)=−14ln⁡u24f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4} (इसलिएu2∈(0,4]u2∈(0,4]u_2\in(0,4]), और केu1=(a−d)2u1=(a−d)2u_1=(a-d)^2होने के लिएf1(u1)=1−u1−−√u1−−√.f1(u1)=1−u1u1.f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.अब,u1+u2u1+u2u_1+u_2कावितरणहै (u1,u2u1,u2u_1,\, u_2 भी स्वतंत्र हैं)fu1+u2(x)=∫+∞−∞f1(x−y)f2(y)dy=−14∫401−x−y−−−−√x−y−−−−√⋅lny4dy,fu1+u2(x)=∫−∞+∞f1(x−y)f2(y)dy=−14∫041−x−yx−y⋅ln⁡y4dy,f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,क्योंकिy∈(0,4]y∈(0,4]y\in(0,4]। यहाँ, यहx>yx>yx>yइसलिए इंटीग्रलfu1+u2(x)=-1 केबराबर हैfu1+u2(x)=−14∫x01−x−y−−−−√x−y−−−−√⋅lny4dy.fu1+u2(x)=−14∫0x1−x−yx−y⋅ln⁡y4dy.f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.अब …

3
"टाइम सीरीज़" को ऐसे क्यों कहा जाता है?
"टाइम सीरीज़" को ऐसे क्यों कहा जाता है? श्रृंखला का अर्थ है एक अनुक्रम का योग। यह समय श्रृंखला क्यों है , समय अनुक्रम नहीं ? क्या समय स्वतंत्र चर है?

3
हम पीसीए करने से पहले मानक विचलन और कुछ अन्य मानकीकरण कारक से क्यों विभाजित होते हैं?
मैं निम्नलिखित औचित्य (सीएस 229 कोर्स नोट्स से) पढ़ रहा था कि हम कच्चे डेटा को उसके मानक विचलन द्वारा क्यों विभाजित करते हैं: हालांकि मैं समझता हूं कि स्पष्टीकरण क्या कह रहा है, यह मेरे लिए स्पष्ट नहीं है कि मानक विचलन द्वारा विभाजित करने से ऐसा लक्ष्य क्यों …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.