सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
संचयी वितरण फ़ंक्शन (CDF) विशिष्ट रूप से वितरण को क्यों परिभाषित करता है?
मुझे हमेशा कहा गया है कि एक सीडीएफ अद्वितीय है, लेकिन एक पीडीएफ / पीएमएफ अद्वितीय नहीं है, ऐसा क्यों है? क्या आप एक उदाहरण दे सकते हैं जहां एक पीडीएफ / पीएमएफ अद्वितीय नहीं है?

1
बार-बार के-गुना क्रॉस-सत्यापन के रिपोर्टिंग संस्करण
मैं बार-बार के-फोल्ड क्रॉस सत्यापन का उपयोग कर रहा हूं और क्रॉस वेलिडेशन के विभिन्न रनों के सिलसिले में भव्य माध्य के रूप में गणना (मूल्यांकन मीट्रिक उदा, संवेदनशीलता, विशिष्टता) का मतलब बता रहा हूं। हालांकि, मुझे यकीन नहीं है कि मुझे विचरण की रिपोर्ट कैसे देनी चाहिए। मैंने यहां …

1
PCA घटक के साथ एक चर (बाइपोलॉट / लोडिंग प्लॉट पर) का उचित संघ माप क्या है?
मैं FactoMineRअव्यक्त चर के लिए माप के अपने डेटा सेट को कम करने के लिए उपयोग कर रहा हूं । ऊपर दिए गए चर का नक्शा मेरे लिए व्याख्या करने के लिए स्पष्ट है, लेकिन जब चर और घटक के बीच जुड़ाव की बात आती है तो मैं भ्रमित हो …

2
मैथ्यू सहसंबंध गुणांक (MCC) की व्याख्या कैसे करें?
प्रश्न के लिए उत्तर फी, मैथ्यू और पियर्सन सहसंबंध गुणांक के बीच संबंध? दिखाता है कि तीन गुणांक विधियां सभी समकक्ष हैं। मैं आँकड़ों से नहीं हूँ, इसलिए यह एक आसान प्रश्न होना चाहिए। मैथ्यू पेपर (www.sciencedirect.com/science/article/pii/0005279575901099) निम्नलिखित का वर्णन करता है: "A correlation of: C = 1 indicates perfect …

2
रिज प्रतिगमन में मानकीकरण के बारे में प्रश्न
हे दोस्तों मुझे एक या दो पेपर मिले जो रिज रिग्रेशन (बास्केटबॉल डेटा के लिए) का उपयोग करते हैं। मुझे हमेशा अपने वैरिएबल को मानकीकृत करने के लिए कहा जाता था यदि मैं एक रिज रिग्रेशन चलाता था, लेकिन मुझे बस ऐसा करने के लिए कहा गया था क्योंकि रिज …

4
KNN एक भेदभावपूर्ण सीखने का एल्गोरिथ्म है?
ऐसा लगता है कि KNN एक भेदभावपूर्ण शिक्षण एल्गोरिथ्म है, लेकिन मैं इसकी पुष्टि करने वाले किसी भी ऑनलाइन स्रोत को खोजने के लिए प्रतीत नहीं कर सकता। KNN एक भेदभावपूर्ण सीखने का एल्गोरिथ्म है?

1
बाद के वितरण के इस चित्रण में क्या गलत है?
मेरे पास निम्न छवि है जो मुझे बताया गया है कि पूर्ववर्ती संभावना वितरण और संयोजन के वितरण का संयोजन कैसे होता है इसका एक उदाहरण है। मुझे बताया गया है कि छवि के साथ कुछ गड़बड़ है, अर्थात् पीछे के वितरण में वह रूप नहीं हो सकता है जो …

2
प्रतिगमन के लिए बहुपद विरोधाभास
मैं प्रतिगमन फिटिंग में बहुपद विरोधाभासों के उपयोग को नहीं समझ सकता। विशेष रूप से, मैं इस पृष्ठR पर वर्णित अंतराल अंतराल (समान रूप से स्थान के साथ क्रमिक चर) को व्यक्त करने के लिए उपयोग किए जाने वाले एन्कोडिंग का उल्लेख कर रहा हूं । उस पृष्ठ के उदाहरण …

4
"समय श्रृंखला विश्लेषण" और "अनुदैर्ध्य डेटा विश्लेषण" शब्दों के बीच क्या अंतर हैं
जब अनुदैर्ध्य डेटा के बारे में बात करते हैं, तो हम एक ही विषय / अध्ययन इकाई से बार-बार एकत्र किए गए डेटा को संदर्भित कर सकते हैं, इस प्रकार एक ही विषय के भीतर टिप्पणियों के लिए सहसंबंध होते हैं, अर्थात, विषय-समान समानता। जब समय-श्रृंखला डेटा के बारे में …

2
मैं संख्यात्मक / श्रेणीबद्ध मान दोनों के साथ R में साधारण लॉजिस्टिक रिग्रेशन विश्लेषण कैसे चलाऊं?
आधार डेटा : मेरे पास मूल्यांकन के साथ ~ 1,000 लोग चिह्नित हैं: '1,' [अच्छा] '2,' [मध्य] या '3' [बुरा] - ये वे मूल्य हैं जो मैं भविष्य में लोगों के लिए भविष्यवाणी करने की कोशिश कर रहा हूं । इसके अलावा, मेरे पास कुछ जनसांख्यिकीय जानकारी है: लिंग (श्रेणी: …

3
हमें ऑटोचेनडर्स की आवश्यकता क्यों है?
हाल ही में, मैं ऑटोएन्कोडर्स का अध्ययन कर रहा हूं। अगर मुझे सही तरीके से समझा जाए, तो एक ऑटोएन्कोडर एक तंत्रिका नेटवर्क है जहां इनपुट परत आउटपुट परत के समान है। इसलिए, तंत्रिका नेटवर्क इनपुट का उपयोग करके आउटपुट का अनुमान लगाने की कोशिश करता है, क्योंकि यह गोल्डन …

2
मैं इस सज्जित बनाम अवशिष्ट भूखंड की व्याख्या कैसे करूं?
मैं वास्तव में विषमलैंगिकता को नहीं समझता। मैं जानना चाहूंगा कि मेरा मॉडल इस प्लॉट के अनुसार उचित है या नहीं।

2
यह कैसे संभव है कि पॉइसन जीएलएम गैर-पूर्णांक संख्याओं को स्वीकार करे?
मैं वास्तव में इस तथ्य से स्तब्ध हूं कि पोइसन जीएलएम गैर-पूर्णांक संख्या स्वीकार करता है! देखो: डेटा (सामग्री data.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 आर स्क्रिप्ट: t <- read.table("data.txt") names(t) …

2
रैंडम फ़ॉरेस्ट के साथ फ़ीचर चयन
मेरे पास ज्यादातर वित्तीय चर (120 विशेषताएं, 4k उदाहरण) के साथ एक डेटासेट है जो ज्यादातर अत्यधिक सहसंबद्ध और बहुत शोर (तकनीकी संकेतक, उदाहरण के लिए) हैं, इसलिए मैं मॉडल प्रशिक्षण (बाइनरी वर्गीकरण) के साथ अधिकतम 20-30 के बारे में चयन करना चाहूंगा - वृद्धि कमी)। मैं फीचर रैंकिंग के …

4
और F- टेस्ट के बीच संबंध क्या है ?
मैं सोच रहा था कि क्या R2R2R^2 और एफ-टेस्ट के बीच कोई संबंध है । आमतौर पर R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} और यह प्रतिगमन में रैखिक संबंध की ताकत को मापता है। एक एफ-टेस्ट सिर्फ एक परिकल्पना साबित …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.