सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
सर्वश्रेष्ठ डाकू एल्गोरिथ्म?
सबसे प्रसिद्ध दस्यु एल्गोरिथ्म ऊपरी विश्वास बाध्य (यूसीबी) है जिसने एल्गोरिदम के इस वर्ग को लोकप्रिय बनाया। तब से मुझे लगता है कि अब बेहतर एल्गोरिदम हैं। वर्तमान सर्वश्रेष्ठ एल्गोरिथ्म (अनुभवजन्य प्रदर्शन या सैद्धांतिक सीमा के संदर्भ में) क्या है? क्या यह एल्गोरिथ्म कुछ अर्थों में इष्टतम है?

1
एक मॉडल से शर्तें छोड़ने के बाद स्वतंत्रता के उचित अवशिष्ट डिग्री
मैं इस प्रश्न के आसपास की चर्चा और विशेष रूप से फ्रैंक हैरेल की टिप्पणी पर विचार कर रहा हूं कि एक कम मॉडल में विचरण का अनुमान (यानी जिसमें से कई व्याख्यात्मक चर का परीक्षण और अस्वीकार कर दिया गया है) को यू के सामान्यीकृत डिग्री का उपयोग करना …

12
मूल्यों की धारा के लिए बुनियादी आंकड़ों की गणना करने के लिए कमांड-लाइन टूल [बंद]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । पिछले साल बंद हुआ । क्या कोई कमांड-लाइन टूल है जो मानक इनपुट …

4
प्रशिक्षण कदम और मूल्यांकन कदम के बीच एक विषमता क्यों है?
यह अच्छी तरह से जाना जाता है, विशेष रूप से प्राकृतिक भाषा प्रसंस्करण में, कि मशीन लर्निंग को दो चरणों, एक प्रशिक्षण चरण और एक मूल्यांकन चरण में आगे बढ़ना चाहिए, और उन्हें अलग-अलग डेटा का उपयोग करना चाहिए। ऐसा क्यों है? सहज रूप से, यह प्रक्रिया डेटा को ओवरफिट …

3
किस अस्पताल को चुना जाना चाहिए? एक की सफलता दर अधिक है, लेकिन दूसरे की सफलता दर अधिक है
यह सवाल गणित स्टैक एक्सचेंज से माइग्रेट किया गया था क्योंकि इसका उत्तर क्रॉस वैलिडेट पर दिया जा सकता है। 7 साल पहले पलायन कर गए । मेरे पास एक सवाल है जो मेरे सांख्यिकी शिक्षक ने निम्नलिखित समस्या के बारे में कहा है। मेरा सवाल इस स्थिति में सिम्पसन …

2
क्या अशक्त और वैकल्पिक परिकल्पनाओं को संपूर्ण होना चाहिए या नहीं?
मैंने कई बार यह दावा किया कि उन्हें थकावट का सामना करना पड़ता है (ऐसी किताबों में उदाहरण हमेशा इस तरह से निर्धारित किए जाते हैं, कि वे वास्तव में थे), दूसरी तरफ मैंने कई बार यह भी देखा कि किताबें यह बताती हैं कि उन्हें अनन्य होना चाहिए ( …

1
क्या क्रॉस सत्यापन सत्यापन सेट के लिए एक उचित विकल्प है?
पाठ वर्गीकरण में, मेरे पास लगभग 800 नमूनों के साथ एक प्रशिक्षण सेट है, और लगभग 150 नमूनों के साथ एक परीक्षण सेट है। परीक्षण सेट का उपयोग कभी नहीं किया गया है, और अंत तक उपयोग किए जाने की प्रतीक्षा की जा रही है। मैं पूरे 800 सैंपल ट्रेनिंग …

2
प्रतिगमन में पी-मूल्यों का अर्थ
यह सवाल गणित स्टैक एक्सचेंज से माइग्रेट किया गया था क्योंकि इसका उत्तर क्रॉस वैलिडेट पर दिया जा सकता है। 8 साल पहले पलायन कर गए । जब मैं कुछ सॉफ़्टवेयर पैकेज (उदाहरण के लिए गणितज्ञ) में एक रेखीय प्रतिगमन करता हूं, तो मुझे मॉडल में अलग-अलग मापदंडों से जुड़े …

3
जेफ्रीज़ के पुजारियों को गैर-संचारी क्यों माना जाता है?
पहले एक पर विचार करें जहां , जहां फिशर जानकारी है।मैंp ( θ ) ∝ | मैं ( θ ) |----√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}मैंii मैं इसे पहले एक बिना सूचना के उल्लेख के रूप में देखता रहा हूं, लेकिन मैंने कभी भी एक तर्क नहीं देखा कि यह क्यों नहीं है। …
27 bayesian  prior 

2
आर का उपयोग करके समय श्रृंखला की एसटीएल प्रवृत्ति
मैं आर से नया हूं और समय श्रृंखला विश्लेषण के लिए। मैं एक लंबी (40 वर्ष) दैनिक तापमान समय श्रृंखला की प्रवृत्ति को खोजने की कोशिश कर रहा हूं और अलग-अलग अनुमान लगाने की कोशिश कर रहा हूं। पहला एक साधारण रेखीय प्रतिगमन है और दूसरा लूस द्वारा टाइम सीरीज़ …
27 r  time-series  trend 

5
क्या एक अस्पष्ट पहले गैर-सूचनात्मक के समान है?
यह शब्दावली के बारे में एक प्रश्न है। क्या "अस्पष्ट पूर्व" गैर-सूचनात्मक पूर्व के समान है, या दोनों के बीच कुछ अंतर है? मेरी धारणा है कि वे समान हैं (एक साथ अस्पष्ट और गैर-जानकारीपूर्ण दिखने से), लेकिन मैं निश्चित नहीं हो सकता।

2
क्या सहसंबंध डेटा की स्थिरता को मानता है?
अंतर-बाजार विश्लेषण विभिन्न बाजारों के बीच संबंधों को खोजने के माध्यम से बाजार के व्यवहार को मॉडलिंग करने की एक विधि है। S & P 500 और 30-साल के अमेरिकी कोषों के अनुसार, कई बार, दो बाजारों के बीच एक संबंध की गणना की जाती है। ये गणना अधिक बार …

4
CART का उपयोग करते समय "चर महत्व" को कैसे मापें / रैंक करें? (विशेष रूप से R से {rpart} का उपयोग करते हुए)
आरएटीआर (आर) का उपयोग करके एक कार्ट मॉडल (विशेष रूप से वर्गीकरण ट्री) का निर्माण करते समय, यह जानना अक्सर दिलचस्प होता है कि मॉडल के लिए पेश किए गए विभिन्न चर का क्या महत्व है। इस प्रकार, मेरा प्रश्न है: कार्ट मॉडल में भाग लेने वाले चर के रैंकिंग …

3
क्या AIC विभिन्न प्रकार के मॉडल की तुलना कर सकता है?
मैं R में गैर-रेखीय मॉडल की तुलना करने के लिए AIC (Akaike's Information Criterion) का उपयोग कर रहा हूं। क्या AIC की तुलना विभिन्न प्रकार के मॉडल से करना मान्य है? विशेष रूप से, मैं glm द्वारा फिट किए गए एक मॉडल की तुलना कर रहा हूं, जिसमें ग्लैमर (lme4) …

3
आर में प्रतीकात्मक गणना?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मैं सोच रहा था कि क्या आर में प्रतीकात्मक गणना करना संभव है? उदाहरण के लिए, …
27 r 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.