सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
क्या दो यादृच्छिक चर का समान वितरण हो सकता है, फिर भी लगभग निश्चित रूप से अलग-अलग हो सकते हैं?
क्या यह संभव है कि दो यादृच्छिक चर का समान वितरण हो और फिर भी वे लगभग निश्चित रूप से भिन्न हों?

2
"अन्वेषक का इरादा" और थ्रेसहोल्ड / पी-मान
मैं जॉन क्रुश्के की "डूइंग बायेसियन डेटा एनालिसिस" स्लाइड्स पढ़ रहा हूं , लेकिन वास्तव में टी-टेस्ट और / या संपूर्ण नल-परिकल्पना महत्व परीक्षण ढांचे की उनकी व्याख्या के बारे में एक प्रश्न है। उनका तर्क है कि पी-वैल्यू बीमार परिभाषित हैं क्योंकि वे अन्वेषक के इरादों पर निर्भर करते …

2
तुलना क्लस्टरिंग: रैंड इंडेक्स बनाम सूचना का विविधता
मैं सोच रहा था कि क्या किसी के पास क्लस्टरिंग की तुलना के लिए सूचना और विविधता सूचकांक के अंतर के पीछे कोई अंतर्दृष्टि या अंतर्ज्ञान है। मैंने मरीना मेलिया (जर्नल ऑफ़ मल्टीवेरेट एनालिसिस, 2007) द्वारा पेपर " कम्पेयरिंग कलस्टरिंग - एन इंफॉर्मेशन बेस्ड डिस्टेंस " पढ़ा है , लेकिन, …

1
मार्कोव यादृच्छिक क्षेत्र
उनकी पाठ्यपुस्तक में, ग्राफिकल मॉडल, एक्सपोनेंशियल फ़ैमिलीज़ और वैरिएशन इंट्रेंस , एम। जॉर्डन और एम। वेनराइट एक्सपोनेंशियल परिवारों और मार्कोव रैंडम फील्ड्स (अप्रत्यक्ष ग्राफ़िकल मॉडल) के बीच संबंध पर चर्चा करते हैं । मैं निम्नलिखित प्रश्नों के साथ उनके बीच के संबंधों को बेहतर समझने की कोशिश कर रहा हूं: …

5
आधुनिक तंत्रिका नेटवर्क जो अपनी खुद की टोपोलॉजी का निर्माण करते हैं
मानक तंत्रिका शुद्ध एल्गोरिदम (बैकप्रॉप की तरह) की एक सीमा यह है कि आपको कितने छिपे हुए परतों और न्यूरॉन्स-प्रति-परत की एक डिजाइन निर्णय करना है। आमतौर पर, सीखने की दर और सामान्यीकरण इन विकल्पों के प्रति अत्यधिक संवेदनशील है। यही कारण है कि, क्यूसेक सहसंबंध जैसे तंत्रिका शुद्ध एल्गोरिदम …

5
वर्गीकरण परिणामों के महत्व का परीक्षण करने का सही तरीका क्या है
ऐसी कई स्थितियाँ हैं जहाँ आप कई अलग-अलग क्लासिफायर को प्रशिक्षित कर सकते हैं, या कई अलग-अलग फ़ीचर निष्कर्षण विधियों का उपयोग कर सकते हैं। साहित्य लेखकों में अक्सर डेटा के यादृच्छिक विभाजन के एक सेट (यानी एक डबल नेस्टेड-क्रॉस-सत्यापन के बाद) के माध्यम से माध्य वर्गीकरण त्रुटि देते हैं, …

2
रैखिक सहसंयोजक की तुलना में दूरी covariance कम उपयुक्त है?
मुझे सिर्फ ब्राउनियन / दूरी सहसंयोजक / सहसंबंध में पेश किया गया है (अस्पष्ट) । यह कई गैर-रैखिक स्थितियों में विशेष रूप से उपयोगी लगता है, जब निर्भरता के लिए परीक्षण किया जाता है। लेकिन इसका उपयोग बहुत बार नहीं किया जाता है, भले ही गैर-रैखिक / अराजक डेटा के …

6
छिपे हुए मार्कोव मॉडल समस्याओं के उदाहरण?
मैं काफी हद तक छिपे हुए मार्कोव मॉडल को पढ़ता हूं और खुद इसका एक बहुत ही मूल संस्करण कोड करने में सक्षम था। लेकिन मुझे सीखने के दो मुख्य तरीके हैं। एक इसे कोड में पढ़ना और लागू करना है (जो किया गया है) और दूसरा यह समझना है …

1
आर में मैट्रिक्स व्युत्क्रम की कुशल गणना
मुझे मैट्रिक्स व्युत्क्रम की गणना करने की आवश्यकता है और solveफ़ंक्शन का उपयोग कर रहा है। जबकि यह छोटे मेट्रिसेस पर अच्छा काम करता है, solveबड़े मेट्रिसेस पर बहुत धीमी गति से चलता है । मैं सोच रहा था कि क्या कोई अन्य फ़ंक्शन या फ़ंक्शन (एसवीडी, क्यूआर, एलयू, या …

3
मैं एनपीएस (नेट प्रमोटर स्कोर) परिणाम में त्रुटि के मार्जिन की गणना कैसे कर सकता हूं?
मैं विकिपीडिया को समझाऊंगा कि एनपीएस की गणना कैसे की जाती है: नेट प्रमोटर स्कोर 0 से 10 रेटिंग पैमाने पर ग्राहकों से एक ही सवाल पूछकर प्राप्त किया जाता है, जहां 10 "बेहद संभावना" है और 0 "बिल्कुल नहीं है": "यह कैसे संभव है कि आप हमारी कंपनी को …

3
प्रतिगमन बनाम एनोवा विसंगति (आर में बनाम बनाम एलएम)
मैं हमेशा इस धारणा के तहत था कि प्रतिगमन एनोवा का सिर्फ एक सामान्य रूप है और परिणाम समान होंगे। हाल ही में, हालांकि, मैंने एक ही डेटा पर एक प्रतिगमन और एक एनोवा दोनों चलाए हैं और परिणाम काफी भिन्न हैं। यही है, प्रतिगमन मॉडल में मुख्य प्रभाव और …
21 r  regression  anova 

3
हमें MCMC श्रृंखलाओं में तेजी से मिश्रण की परवाह क्यों करनी चाहिए?
जब मार्कोव चेन मोंटे कार्लो के साथ काम कर रहे थे, तो हमें एक श्रृंखला की आवश्यकता थी, जो तेजी से मिक्स हो, यानी तेजी से पीछे वितरण का समर्थन तेजी से बढ़ता है। लेकिन मुझे समझ नहीं आ रहा है कि हमें इस संपत्ति की आवश्यकता क्यों है, क्योंकि …
21 mcmc 

4
"निष्पक्षता" का क्या अर्थ है?
यह कहने का क्या मतलब है कि "विचरण एक पक्षपाती अनुमानक है"। साधारण फॉर्मूले के माध्यम से एक पूर्वाग्रहित अनुमान को निष्पक्ष अनुमान में बदलने का क्या मतलब है। यह रूपांतरण वास्तव में क्या करता है? इसके अलावा, इस रूपांतरण का व्यावहारिक उपयोग क्या है? क्या आप कुछ विशेष प्रकार …

1
मैं आर में एक रैखिक मॉडल के नए इनपुट से मूल्यों की भविष्यवाणी कैसे कर सकता हूं?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मैंने R: में एक लीनियर मॉडल बनाया है mod = lm(train_y ~ train_x)। मैं इसे एक्स …

4
आयामीता का अभिशाप क्या है?
विशेष रूप से, मैं संदर्भों (कागजात, किताबें) की तलाश कर रहा हूं जो कठोरता के अभिशाप को दिखाएंगे और समझाएंगे। यह प्रश्न तब सामने आया जब मैंने लैफ़र्टी और वासरमैन द्वारा इस श्वेत पत्र को पढ़ना शुरू किया। तीसरे पैराग्राफ में वे एक "अच्छी तरह से ज्ञात" समीकरण का उल्लेख …
21 theory 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.