सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
2x2 की तुलना में आकस्मिक तालिकाओं में फिशर का सटीक परीक्षण
मुझे केवल आकस्मिक तालिका में फिशर का सटीक परीक्षण लागू करने के लिए सिखाया गया था जो 2x2 थे। प्रशन: क्या फिशर ने खुद को कभी भी इस परीक्षण की कल्पना की थी जो 2x2 से बड़ी सारणी में इस्तेमाल किया जाता है (मुझे उसकी कहानी से अवगत कराते हुए …

6
मैं d20 ​​की निष्पक्षता का परीक्षण कैसे कर सकता हूं?
मैं बीस पक्षीय मरने (d20) की निष्पक्षता का परीक्षण कैसे कर सकता हूं? जाहिर है कि मैं समान वितरण के खिलाफ मूल्यों के वितरण की तुलना करूंगा। मुझे कॉलेज में ची-स्क्वायर टेस्ट का उपयोग करने की याद है। मैं यह देखने के लिए कैसे आवेदन कर सकता हूं कि क्या …

11
सांख्यिकीय पॉडकास्ट
सांख्यिकीय विश्लेषण से संबंधित कुछ पॉडकास्ट क्या हैं? मुझे ITunes यू पर कॉलेज व्याख्यान की कुछ ऑडियो रिकॉर्डिंग मिली हैं, लेकिन मुझे किसी भी सांख्यिकीय पॉडकास्ट के बारे में पता नहीं है। सबसे करीबी बात जो मुझे पता है कि एक ऑपरेशन रिसर्च पॉडकास्ट द साइंस ऑफ़ बेटर है । …
29 references 

3
क्या कोलमोगोरोव-स्मिरनोव परीक्षण असतत वितरण के साथ वैध है?
मैं एक नमूने की तुलना कर रहा हूं और यह जांच रहा हूं कि क्या यह कुछ, असतत, वितरण के रूप में वितरित करता है। हालाँकि, मुझे पूरा यकीन नहीं है कि Kolmogorov-Smirnov लागू होता है। विकिपीडिया को लगता है कि इसका मतलब यह नहीं है। यदि यह नहीं है, …

6
बाइनरी वर्गीकरण के लिए परिवर्तनीय चयन प्रक्रिया
वे चर / सुविधा चयन क्या हैं जो आप बाइनरी वर्गीकरण के लिए पसंद करते हैं जब सीखने के सेट में टिप्पणियों की तुलना में कई अधिक चर / फ़ीचर होते हैं? यहाँ उद्देश्य यह है कि सबसे अच्छा वर्गीकरण त्रुटि को कम करने वाली सुविधा चयन प्रक्रिया क्या है। …

3
पीसीए के माध्यम से ऑर्थोगोनल रिग्रेशन (कुल कम से कम वर्ग) कैसे करें?
मैं हमेशा x पर ylm() का रैखिक प्रतिगमन करने के लिए R में उपयोग करता हूं । यह फ़ंक्शन एक गुणांक लौटाता है जैसे किyyyxxxय = β x ।ββ\betay=βx.y=βx.y = \beta x. आज मैंने कुल कम से कम वर्गों के बारे में सीखा और princomp()इसे पूरा करने के लिए उस …

6
परिमित विचरण के लिए परीक्षण?
क्या किसी नमूने को दिए गए यादृच्छिक चर के भिन्नता के परिमितता (या अस्तित्व) के लिए परीक्षण करना संभव है? एक अशक्त के रूप में, या तो {विचरण मौजूद है और परिमित है} या {विचरण मौजूद नहीं है / अनंत है} स्वीकार्य होगा। दार्शनिक रूप से (और कम्प्यूटेशनल रूप से), …

1
मीन एब्सोल्यूट प्रतिशत त्रुटि (एमएपीई) की कमी क्या हैं?
मीन निरपेक्ष प्रतिशत त्रुटि ( मैप ), एक आम सटीकता या समय श्रृंखला या अन्य भविष्यवाणियों के लिए त्रुटि उपाय है MAPE=100n∑t=1n|At−Ft|At%,MAPE=100n∑t=1n|At−Ft|At%, \text{MAPE} = \frac{100}{n}\sum_{t=1}^n\frac{|A_t-F_t|}{A_t}\%, जहां वास्तविक और संगत पूर्वानुमान या भविष्यवाणियां हैं।एफ टीAtAtA_tFtFtF_t एमएपीई एक प्रतिशत है, इसलिए हम आसानी से श्रृंखला के बीच तुलना कर सकते हैं, और …
29 accuracy  mape 

2
स्तरीकृत क्रॉस सत्यापन का उपयोग क्यों करें? यह विचरण से संबंधित लाभ को नुकसान क्यों नहीं पहुंचाता है?
मुझे बताया गया है कि स्तरीकृत क्रॉस सत्यापन का उपयोग करना फायदेमंद है, खासकर जब प्रतिक्रिया कक्षाएं असंतुलित होती हैं। यदि क्रॉस-वैलिडेशन का एक उद्देश्य हमारे मूल प्रशिक्षण डेटा नमूने की यादृच्छिकता के लिए खाते में मदद करना है, तो निश्चित रूप से प्रत्येक तह को एक ही वर्ग वितरण …

1
बूटस्ट्रैप भविष्यवाणी अंतराल
क्या रेखीय प्रतिगमन या अन्य प्रतिगमन विधि (k- निकटतम पड़ोसी, प्रतिगमन पेड़ आदि) से प्राप्त बिंदु भविष्यवाणियों के लिए पूर्वानुमान अंतराल की गणना करने के लिए कोई बूटस्ट्रैप तकनीक उपलब्ध है? किसी तरह मुझे लगता है कि कभी-कभी प्रस्तावित भविष्यवाणी को बूट करने के लिए कभी-कभी प्रस्तावित तरीका (देखें उदाहरण …

4
मैकफेडन के छद्म-आर 2 व्याख्या
मेरे पास एक बाइनरी लॉजिस्टिक रिग्रेशन मॉडल है जिसमें मैकफेडन के छद्म आर-स्क्वायड 0.192 पर निर्भर है, जिसे भुगतान (1 = भुगतान और 0 = भुगतान नहीं) कहा जाता है। इस छद्म आर-वर्ग की व्याख्या क्या है? क्या यह नेस्टेड मॉडल के लिए एक सापेक्ष तुलना है (उदाहरण के लिए …

4
एलएम () से समीकरण में परिणामों का अनुवाद कैसे करें?
हम lm()एक मूल्य का अनुमान लगाने के लिए उपयोग कर सकते हैं , लेकिन हमें अभी भी कुछ मामलों में परिणाम सूत्र के समीकरण की आवश्यकता है। उदाहरण के लिए, भूखंडों में समीकरण जोड़ें।
29 r  regression  lm 

3
स्किकिट-सीख का उपयोग कर बहुपद प्रतिगमन
मैं बहुपद प्रतिगमन के लिए scikit-learn का उपयोग करने की कोशिश कर रहा हूं। मैं बहुपद प्रतिगमन को जो भी पढ़ता हूं वह रैखिक प्रतिगमन का एक विशेष मामला है। मैं सोच रहा था कि हो सकता है कि scitit के सामान्यीकृत रैखिक मॉडल में से एक को उच्च क्रम …

1
पॉइज़न मॉडल को पार करने के लिए त्रुटि मैट्रिक्स
मैं एक मॉडल की पुष्टि करने के लिए पार कर रहा हूं जो एक गिनती की भविष्यवाणी करने की कोशिश कर रहा है। यदि यह एक द्विआधारी वर्गीकरण समस्या थी, तो मैं आउट-ऑफ-फोल्ड एयूसी की गणना करूंगा, और यदि यह एक प्रतिगमन समस्या थी, तो मैं आरएमएसई या एमएई की …

4
आप RMSLE (रूट मीन स्क्वेर लॉगरिदमिक एरर) की व्याख्या कैसे करते हैं?
मैं एक मशीन लर्निंग प्रतियोगिता कर रहा हूँ जहाँ वे RMSLE (रूट मीन स्क्वैर्ड लॉगरिदमिक एरर) का उपयोग करते हैं, ताकि उपकरण की श्रेणी के विक्रय मूल्य की भविष्यवाणी करने वाले प्रदर्शन का मूल्यांकन किया जा सके। समस्या यह है कि मुझे यकीन नहीं है कि मेरे अंतिम परिणाम की …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.