सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
लॉजिस्टिक क्लासिफायर में सॉफ्टमैक्स बनाम सिग्मोइड फ़ंक्शन?
एक लॉजिस्टिक क्लासिफायरियर में फ़ंक्शन (सॉफ्टमैक्स बनाम सिग्मॉइड) का विकल्प क्या तय करता है? मान लीजिए कि 4 आउटपुट क्लास हैं। उपरोक्त फ़ंक्शन में से प्रत्येक प्रत्येक वर्ग की संभावनाओं को सही आउटपुट देता है। तो क्लासिफायर के लिए कौन सा लेना है?

4
छोटे
में कुछ परीक्षणों के लिए R, के पी-वैल्यू गणना पर कम सीमा है । मुझे यकीन नहीं है कि यह संख्या क्यों है, अगर इसके लिए एक अच्छा कारण है या यदि यह सिर्फ मनमाना है। बहुत सारे अन्य आँकड़े पैकेज में जाते हैं , इसलिए यह बहुत अधिक सटीक …


3
प्रथम मानक सामान्य तालिका किसने बनाई?
मैं अपने परिचयात्मक सांख्यिकी वर्ग में मानक सामान्य तालिका पेश करने वाला हूं, और मुझे आश्चर्य हो रहा है: पहला मानक सामान्य तालिका किसने बनाई? कंप्यूटर के साथ आने से पहले उन्होंने इसे कैसे किया? मैं हाथ से एक हजार Riemann रकम कंप्यूटिंग किसी जानवर-बल के बारे में सोचने के …

5
जेफ्रीज़ पूर्व उपयोगी क्यों है?
मैं समझता हूं कि जेफ्री के पूर्व पुन: पैरामीटर के तहत अपरिवर्तनीय है। हालाँकि, मुझे समझ में नहीं आता है कि यह संपत्ति क्यों वांछित है। आप चर के परिवर्तन से पहले परिवर्तन क्यों नहीं करना चाहेंगे?
61 bayesian  prior 

10
"वैज्ञानिक सांख्यिकीय महत्व के खिलाफ उठते हैं" क्या मतलब है? (प्रकृति में टिप्पणी)
प्रकृति वैज्ञानिकों में टिप्पणी का शीर्षक सांख्यिकीय महत्व के खिलाफ उठता है : वैलेंटाइन अमरेहिन, सैंडर ग्रीनलैंड, ब्लेक मैकेन और 800 से अधिक हस्ताक्षरकर्ताओं ने दावों को समाप्त करने और संभवतः महत्वपूर्ण प्रभावों को खारिज करने का आह्वान किया। और बाद में जैसे बयान शामिल हैं: फिर, हम पी मूल्यों, …

2
संभावना अनुपात बनाम बेयस फैक्टर
मैं बल्कि एक घटना के लिए / के खिलाफ उद्देश्य सबूत का प्रतिनिधित्व करने के लिए संभावना अनुपात के उपयोग के संबंध में प्रचारक हूं। हालाँकि, मुझे हाल ही में पता चला है कि बेयस फैक्टर बायेसियन तरीकों के संदर्भ में एक समान कार्य करता है (यानी व्यक्तिपरक पूर्व उद्देश्य …

2
केवल तीन विभाजन क्यों? (प्रशिक्षण, सत्यापन, परीक्षण)
जब आप एक बड़े डेटासेट के लिए मॉडल फिट करने की कोशिश कर रहे हैं, तो आम सलाह डेटा को तीन भागों में विभाजित करना है: प्रशिक्षण, सत्यापन और परीक्षण डेटासेट। ऐसा इसलिए है क्योंकि मॉडल में आमतौर पर मापदंडों के तीन "स्तर" होते हैं: पहला "पैरामीटर" मॉडल वर्ग (जैसे …

6
"नेस्टेड" और "नॉन-नेस्टेड" मॉडल के बीच अंतर क्या है?
पदानुक्रमित / बहुस्तरीय मॉडल पर साहित्य में मैंने अक्सर "नेस्टेड मॉडल" और "नॉन-नेस्टेड मॉडल" के बारे में पढ़ा है, लेकिन इसका क्या मतलब है? क्या कोई मुझे कुछ उदाहरण दे सकता है या मुझे इस वाक्यांश के गणितीय प्रभावों के बारे में बता सकता है?

5
संकोचन विधियों से क्या समस्या हल होती है?
छुट्टियों के मौसम ने मुझे द एलिमेंट्स ऑफ स्टैटिस्टिकल लर्निंग के साथ आग के बगल में कर्ल करने का मौका दिया है । (बार-बार) अर्थमिति के परिप्रेक्ष्य में आने से, मुझे रिज रेज्रेशन, लासो, और कम से कम कोण रिग्रेशन (LAR) जैसे संकोचन विधियों के उपयोग को समझने में परेशानी …

7
कई आश्रित चर के साथ प्रतिगमन?
क्या दो या अधिक आश्रित चर के साथ एक (एकाधिक) प्रतिगमन समीकरण होना संभव है? ज़रूर, आप दो अलग-अलग प्रतिगमन समीकरणों को चला सकते हैं, प्रत्येक के लिए एक DV, लेकिन ऐसा नहीं लगता है कि यह दो डीवी के बीच किसी भी रिश्ते को पकड़ लेगा?
61 regression 

6
आर का उपयोग करते हुए लासो भविष्यवाणी के लिए मानक त्रुटियां
मैं भविष्यवाणी के लिए एक LASSO मॉडल का उपयोग करने की कोशिश कर रहा हूं, और मुझे मानक त्रुटियों का अनुमान लगाने की आवश्यकता है। निश्चित रूप से किसी ने पहले से ही ऐसा करने के लिए एक पैकेज लिखा है। लेकिन जहाँ तक मैं देख सकता हूँ, CRAN पर …

4
स्थानिक स्वायत्तता के लिए एक GAM खाते में अक्षांश और देशांतर को शामिल क्यों किया जाता है?
मैंने वनों की कटाई के लिए सामान्यीकृत योगात्मक मॉडल का उत्पादन किया है। स्थानिक-निरंकुशता को ध्यान में रखते हुए, मैंने अक्षांश और देशांतर को एक स्मूथ, इंटरैक्शन टर्म (जैसे s (x, y)) के रूप में शामिल किया है। मैं कई पत्रों को पढ़ने पर आधारित हूं, जहां लेखक कहते हैं …

5
एक महत्वपूर्ण परिणाम प्राप्त करने तक डेटा एकत्र करना टाइप I त्रुटि दर में वृद्धि क्यों करता है?
मैं वास्तव में सोच रहा था कि एक महत्वपूर्ण परिणाम (जैसे, ) प्राप्त होने तक डेटा क्यों एकत्र किया जाता है (यानी, पी-हैकिंग) टाइप I त्रुटि दर को बढ़ाता है?पी < .05p<.05p \lt .05 मैं Rइस घटना के प्रदर्शन की भी बहुत सराहना करूंगा ।

15
पैरापैट्रिक आंकड़े कभी भी गैर-पैरामीटर पर क्यों पसंद किए जाएंगे?
क्या कोई मुझे समझा सकता है कि परिकल्पना परीक्षण या प्रतिगमन विश्लेषण के लिए एक गैर-सांख्यिकीय सांख्यिकीय पद्धति पर कोई पैरामीट्रिक क्यों चुनेगा? मेरे दिमाग में, यह राफ्टिंग के लिए जा रहा है और एक गैर-जल प्रतिरोधी घड़ी चुनना है, क्योंकि आप इसे गीला नहीं कर सकते । हर अवसर …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.