सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
यादृच्छिक वन विकृत सटीकता और सुविधा-चयन में अत्यधिक सहसंबद्ध चर नहीं होंगे?
मेरी समझ में, अत्यधिक सहसंबद्ध चर यादृच्छिक वन मॉडल में बहु-संप्रभुता मुद्दों का कारण नहीं बनेंगे (कृपया मुझे गलत समझें तो सही करें)। हालांकि, दूसरे तरीके से, अगर मेरे पास समान जानकारी वाले कई चर हैं, तो क्या मॉडल का वजन दूसरों के बजाय इस सेट पर बहुत अधिक होगा? …

3
क्या पी-वैल्यू एक बिंदु अनुमान है?
चूँकि कोई p- मानों के लिए विश्वास अंतराल की गणना कर सकता है और चूंकि अंतराल अनुमान के विपरीत बिंदु अनुमान है: p- मान एक बिंदु अनुमान है?

3
क्या मनाया डेटा (उर्फ मछली पकड़ने के अभियान) से मिलान करने के लिए एक परिकल्पना को बदलना संभव है और टाइप I त्रुटियों में वृद्धि से बचना चाहिए?
यह सर्वविदित है कि शोधकर्ताओं को एक परिकल्पना बनाने से पहले मौजूदा डेटा और शोध को देखने और तलाशने में समय बिताना चाहिए और फिर उस परिकल्पना (अशक्त-परिकल्पना महत्व परीक्षण का जिक्र) का परीक्षण करने के लिए डेटा एकत्र करना चाहिए। कई बुनियादी सांख्यिकी पुस्तकें चेतावनी देती हैं कि परिकल्पना …

5
"हेटेरोसेडैस्टिक" या "हेटेरोसेडैस्टिक" दो वर्तनी क्यों हैं?
मैं अक्सर दोनों वर्तनी "हेटेरोसेडैस्टिक" और "हेटेरोसेडस्टिक" देखता हूं, और इसी तरह "होमोसैडैस्टिक" और "होमोसैकेस्टिक"। "सी" और "के" वेरिएंट के बीच अर्थ में कोई अंतर नहीं लगता है, बस शब्द के ग्रीक व्युत्पत्ति से संबंधित एक ऑर्थोग्राफिक अंतर है। दो अलग-अलग वर्तनी की उत्पत्ति क्या है? क्या एक उपयोग दूसरे …

2
लॉजिस्टिक रिग्रेशन: बर्नौली बनाम बिनोमियल रिस्पॉन्स वेरिएबल्स
मैं निम्नलिखित द्विपद प्रतिक्रिया के साथ और मेरे भविष्यवक्ताओं के रूप में और साथ लॉजिस्टिक प्रतिगमन करना चाहता हूं। एक्स1एक्स1X_1एक्स2एक्स2X_2 मैं निम्नलिखित प्रारूप में बर्नौली प्रतिक्रियाओं के समान डेटा प्रस्तुत कर सकता हूं। इन 2 डेटा सेट के लिए लॉजिस्टिक रिग्रेशन आउटपुट ज्यादातर समान हैं। अवशिष्ट अवशिष्ट और AIC भिन्न …

3
एक सहसंयोजक मैट्रिक्स का व्युत्क्रम यादृच्छिक चर के बीच आंशिक सहसंबंध क्यों पैदा करता है?
मैंने सुना है कि यादृच्छिक चर के बीच आंशिक सहसंबंध सहसंयोजक मैट्रिक्स को निष्क्रिय करके और इस तरह के परिणामस्वरूप सटीक मैट्रिक्स से उपयुक्त कोशिकाओं को लेने से मिल सकता है (यह तथ्य http://en.wikipedia.org/wiki/Partial_correlation में वर्णित है , लेकिन बिना किसी प्रमाण के) । यह एक केस क्यों है?

5
मॉडल चयन में एआईसी के दिशानिर्देश
मैं आमतौर पर BIC का उपयोग करता हूं क्योंकि मेरी समझ यह है कि यह AIC की तुलना में अधिक दृढ़ता से पारसमणि को महत्व देता है। हालाँकि, मैंने अब अधिक व्यापक दृष्टिकोण का उपयोग करने का निर्णय लिया है और एआईसी का भी उपयोग करना चाहूंगा। मुझे पता है …

1
आर में एनोवा () फ़ंक्शन का उपयोग करके दो मॉडल की तुलना करना
के लिए प्रलेखन से anova(): जब वस्तुओं का एक क्रम दिया जाता है, तो 'एनोवा' निर्दिष्ट क्रम में एक दूसरे के खिलाफ मॉडल का परीक्षण करता है ... एक दूसरे के खिलाफ मॉडल का परीक्षण करने का क्या मतलब है? और आदेश क्यों मायने रखता है? यहाँ GenABEL ट्यूटोरियल से …
32 r  anova 

3
डेटासेट्स का निर्माण एंस्कॉम्ब की चौकड़ी के समान एक उद्देश्य के लिए किया गया था
मैं बस अंस्कोम्बे की चौकड़ी पर आया हूं (चार डेटासेट में लगभग अप्रभेद्य वर्णनात्मक आँकड़े हैं, लेकिन प्लॉट किए जाने पर बहुत अलग दिखते हैं) और मैं उत्सुक हूं कि क्या कुछ और कम या ज्यादा जाने-माने डेटासेट हैं जो कुछ पहलुओं के महत्व को प्रदर्शित करने के लिए बनाए …

3
कर्नेल लॉजिस्टिक रिग्रेशन बनाम एसवीएम
जैसा कि सभी जानते हैं, एसवीएम कर्नेल विधि का उपयोग डेटा पॉइंट्स को उच्च स्थानों में प्रोजेक्ट करने के लिए कर सकते हैं ताकि पॉइंट्स को एक रैखिक स्थान से अलग किया जा सके। लेकिन कर्नेल स्पेस में इस सीमा को चुनने के लिए हम लॉजिस्टिक रिग्रेशन का भी उपयोग …
32 svm 

1
टेम्पोरल नेटवर्क में लिंक विसंगति
मुझे इस पेपर के बारे में पता चला जो ट्रेंडिंग टॉपिक्स की भविष्यवाणी करने के लिए लिंक विसंगति का पता लगाने का उपयोग करता है, और मैंने इसे अविश्वसनीय रूप से पेचीदा पाया: पेपर "लिंक एनोमली डिटेक्शन के माध्यम से सामाजिक धाराओं में उभरते विषयों की खोज" है । मैं …

6
तंत्रिका नेटवर्क के साथ शुरुआत कैसे करें
मैं तंत्रिका नेटवर्क के लिए पूरी तरह से नया हूं, लेकिन उन्हें समझने में बहुत दिलचस्पी है। हालाँकि शुरुआत करना आसान नहीं है। क्या कोई अच्छी पुस्तक या किसी अन्य प्रकार के संसाधन की सिफारिश कर सकता है? क्या कोई पढ़ना चाहिए? मैं किसी भी तरह की टिप के लिए …

4
अजगर में सीआरएफ का कार्यान्वयन
क्या पायथन में कंडिशनल रैंडम फील्ड्स का लोकप्रिय कार्यान्वयन है ? मुझे ऐसा कोई भी नहीं मिल रहा है जो व्यापक रूप से उपयोग किया जाता हो और लोकप्रिय हो!

3
दो या दो से अधिक समूहों के पूल किए गए विचरण की गणना ज्ञात समूह संस्करण, साधन और नमूना आकार कैसे करें?
मान लें कि m+nm+nm+n तत्व दो समूहों ( mmm और nnn ) में विभाजित हैं । पहले समूह का विचरण है σ2mσm2\sigma_m^2 और दूसरे समूह के विचरण है σ2nσn2\sigma^2_n । तत्वों को अज्ञात माना जाता है, लेकिन मुझे पता है कि μmμm\mu_m और μnμn\mu_n । वहाँ संयुक्त विचरण गणना करने …
32 variance  pooling 

3
क्या संयुक्त मानक विचलन खोजना संभव है?
मान लीजिए मेरे पास 2 सेट हैं: सेट एक : आइटम्स की संख्या n=10n=10n= 10 , μ=2.4μ=2.4\mu = 2.4 , σ=0.8σ=0.8\sigma = 0.8 सेट बी : आइटम की संख्या , ,μ = 2 σ = 1.2n=5n=5n= 5μ=2μ=2\mu = 2σ=1.2σ=1.2\sigma = 1.2 मैं संयुक्त माध्य ( ) आसानी से पा सकता …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.