सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

8
बायेसियन विश्लेषण के विपक्ष क्या हैं?
किसी भी संदर्भ में बायेसियन सांख्यिकीय विधियों के उपयोग के लिए कुछ व्यावहारिक आपत्तियां क्या हैं? नहीं, मेरा मतलब यह नहीं है कि पहले की पसंद के बारे में सामान्य कार्पिंग। मुझे खुशी होगी अगर इसका कोई जवाब नहीं मिला।
44 bayesian 

6
यह देखने के लिए कि डेटा सामान्य वितरण का अनुसरण करता है, R का उपयोग करके परीक्षण कैसे करें
मेरे पास निम्नलिखित संरचना के साथ एक डेटा सेट है: a word | number of occurrence of a word in a document | a document id मैं आर में सामान्य वितरण के लिए एक परीक्षण कैसे कर सकता हूं? संभवतः यह एक आसान सवाल है लेकिन मैं एक आर नौसिखिया …

4
सांख्यिकीय मॉडल शीट को धोखा देते हैं
मैं सोच रहा था कि कोई सांख्यिकीय मॉडल "चीट शीट" है जो किसी भी या अधिक जानकारी को सूचीबद्ध करता है: जब मॉडल का उपयोग करने के लिए जब मॉडल का उपयोग करने के लिए नहीं आवश्यक और वैकल्पिक जानकारी अपेक्षित आउटपुट क्या मॉडल को विभिन्न क्षेत्रों (नीति, जैव, इंजीनियरिंग, …

8
एक बाहरी की कठोर परिभाषा?
लोग अक्सर आंकड़ों में आउटलेर से निपटने के बारे में बात करते हैं। इसके बारे में मुझे जो बात परेशान करती है, वह यह है कि जहां तक ​​मैं बता सकता हूं, एक अलग की परिभाषा पूरी तरह से व्यक्तिपरक है। उदाहरण के लिए, यदि कुछ रैंडम वैरिएबल का सही …

5
एक समस्या की तुलना एकाधिक क्यों है?
मुझे यह समझना मुश्किल है कि वास्तव में कई तुलनाओं के साथ समस्या क्या है । एक सरल सादृश्य के साथ, यह कहा जाता है कि एक व्यक्ति जो कई निर्णय लेगा वह कई गलतियाँ करेगा। तो बहुत ही रूढ़िवादी एहतियात लागू किया जाता है, जैसे बोन्फेरोनी सुधार, ताकि संभावना …

6
आधुनिक सांख्यिकी / मशीन लर्निंग में मल्टीकोलिनरिटी की जाँच क्यों नहीं की जाती है
पारंपरिक आंकड़ों में, एक मॉडल का निर्माण करते समय, हम विचरण मुद्रास्फीति कारक (VIF) जैसे अनुमानों का उपयोग करते हुए मल्टीकोलिनरिटी की जांच करते हैं, लेकिन मशीन लर्निंग में, हम इसके बजाय सुविधा चयन के लिए नियमितीकरण का उपयोग करते हैं और यह जांचने के लिए प्रतीत नहीं होते हैं …

4
क्या यह निर्धारित करने के लिए एक परीक्षण है कि क्या जीएलएम अतिप्रवाह महत्वपूर्ण है?
मैं आर। में पॉइसन GLMs बना रहा हूँ। अतिप्रवाह के लिए जाँच करने के लिए मैं अवशिष्ट अवशिष्टता के अनुपात को स्वतंत्रता द्वारा प्रदान की गई डिग्री के रूप में देख रहा हूँ summary(model.name)। क्या इस अनुपात के लिए कोई कटऑफ मान या परीक्षण "महत्वपूर्ण" माना जाता है? मुझे पता …


6
आर प्लाट में ओवरलैपिंग लेबल से मैं कैसे बचूँ? [बन्द है]
मैं आर में एक बहुत ही सरल स्कैल्पल को लेबल करने की कोशिश कर रहा हूं। यही वह है जो मैं उपयोग करता हूं: plot(SI, TI) text(SI, TI, Name, pos=4, cex=0.7) परिणाम औसत दर्जे का है, जैसा कि आप देख सकते हैं (विस्तार के लिए क्लिक करें): मैंने textxyफ़ंक्शन का …

4
आउटपुट लेयर के लिए कौन सा सक्रियण कार्य करता है?
जबकि छिपी हुई परत के लिए सक्रियण कार्यों की पसंद काफी स्पष्ट है (ज्यादातर सिग्मॉइड या टैन), मुझे आश्चर्य है कि आउटपुट परत के लिए सक्रियण फ़ंक्शन पर कैसे निर्णय लिया जाए। सामान्य पसंद रैखिक कार्य, सिग्मोइड फ़ंक्शन और सॉफ्टमैक्स फ़ंक्शन हैं। हालांकि, मुझे किसका उपयोग कब करना चाहिए?

3
दो अलग-अलग रजिस्टरों से गुणांक के परीक्षण समानता
यह एक मूल मुद्दा लगता है, लेकिन मुझे सिर्फ यह महसूस हुआ कि मुझे वास्तव में यह पता नहीं है कि दो अलग-अलग व्यवस्थाओं से गुणांक की समानता का परीक्षण कैसे किया जाता है। क्या कोई इस पर रोशनी डाल सकता है? अधिक औपचारिक रूप से, मान लीजिए मैं निम्नलिखित …

5
क्या क्लस्टरिंग से पहले डेटा को स्केल करना महत्वपूर्ण है?
मुझे यह ट्यूटोरियल मिला , जो बताता है कि आपको क्लस्टरिंग से पहले सुविधाओं पर स्केल फ़ंक्शन चलाना चाहिए (मेरा मानना ​​है कि यह डेटा को z- स्कोर में परिवर्तित करता है)। मैं सोच रहा हूँ कि क्या यह आवश्यक है। मैं ज्यादातर पूछ रहा हूं क्योंकि डेटा को स्केल …

5
आगे-पिछड़े और विटर्बी एल्गोरिदम के बीच अंतर क्या है?
मैं यह जानना चाहता हूं कि छिपे हुए मार्कोव मॉडल (HMM) में अनुमान के लिए फॉरवर्ड-बैकवर्ड एल्गोरिथम और विटर्बी एल्गोरिदम में क्या अंतर हैं।

4
द्विपद यादृच्छिक चर के नमूने के लिए मानक त्रुटि
मान लीजिए मैं एक प्रयोग कर रहा हूं जिसमें 2 परिणाम हो सकते हैं, और मैं यह मान रहा हूं कि 2 परिणामों का अंतर्निहित "सत्य" वितरण पैरामीटर और : साथ एक द्विपद वितरण है ।nnnB i n o m i a l ( n , p )pppBinomial(n,p)Binomial(n,p){\rm Binomial}(n, p) …

7
शुरुआती के लिए तंत्रिका नेटवर्क संदर्भ (पाठ्यपुस्तक, ऑनलाइन पाठ्यक्रम)
मैं न्यूरल नेटवर्क सीखना चाहता हूं। मैं एक कम्प्यूटेशनल भाषाविद् हूं। मुझे पता है कि सांख्यिकीय मशीन सीखने के दृष्टिकोण और पायथन में कोड कर सकते हैं। मैं इसकी अवधारणाओं के साथ शुरू करना चाहता हूं, और एक या दो लोकप्रिय मॉडल जानता हूं जो कम्प्यूटेशनल भाषाविज्ञान के दृष्टिकोण से …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.