सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
मानव निर्मित ग्लोबल वार्मिंग हिट 'गोल्ड स्टैंडर्ड' के लिए साक्ष्य: उन्होंने यह कैसे किया?
25.02.2019 से Reuter के लेख में यह संदेश वर्तमान में सभी समाचारों पर है: मानव निर्मित ग्लोबल वार्मिंग के लिए साक्ष्य 'गोल्ड स्टैंडर्ड' [वैज्ञानिकों] ने कहा कि विश्वास है कि मानव गतिविधियां पृथ्वी की सतह पर गर्मी बढ़ा रही थीं, "पांच-सिग्मा" स्तर तक पहुंच गई थीं, एक सांख्यिकीय गेज का …

1
आर में tsoutliers पैकेज का उपयोग करके टाइम सीरीज़ (LS / AO / TC) में आउटलेयर का पता लगाना। समीकरण प्रारूप में आउटलेयर का प्रतिनिधित्व कैसे करें?
टिप्पणियाँ: सबसे पहले मैं नए tsoutliers पैकेज के लेखक को एक बड़ा धन्यवाद कहना चाहूंगा जो चेन और लियू की टाइम सीरीज़ की एकतरफा पहचान को लागू करता है जो जर्नल ऑफ़ द अमेरिकन स्टेटिस्टिकल एसोसिएशन में 1993 में ओपन सोर्स सॉफ्टवेयर में प्रकाशित हुआ था ।आरआरR पैकेज समय श्रृंखला …

11
पूर्ण विचलन बनाम मानक विचलन
ग्रीर (1983) द्वारा टेक्स्ट बुक "ओ कॉम्प्रिहेंसिव मैथेमैटिक्स फॉर ओ लेवल" में, मुझे इस तरह से औसतन विचलन देखा गया है: एकल मूल्यों और माध्य के बीच के पूर्ण अंतरों को जोड़ो। फिर उसका औसत प्राप्त करें। अध्याय के माध्यम से शब्द का अर्थ विचलन होता है। लेकिन मैंने हाल …

8
एक घन के किनारों पर यादृच्छिक चलना
एक चींटी को एक घन के एक कोने में रखा जाता है और वह हिल नहीं सकती। एक मकड़ी विपरीत कोने से शुरू होती है, और किसी भी दिशा में क्यूब के किनारों के साथ समान संभावना साथ आगे बढ़ सकती है । औसतन, मकड़ी को चींटी तक पहुंचने के …

1
लॉजिस्टिक रिग्रेशन: एनोवा ची-स्क्वायर टेस्ट बनाम गुणांक का महत्व (एनोवा () बनाम सारांश (आर में)
मेरे पास 8 वैरिएबल वाला लॉजिस्टिक GLM मॉडल है। मैंने आर में ची-स्क्वायर टेस्ट चलाया anova(glm.model,test='Chisq')और 2 वेरिएबल्स का अनुमान लगाया गया जब टेस्ट के शीर्ष पर ऑर्डर किया गया था और सबसे नीचे ऑर्डर करने पर ऐसा नहीं किया गया था। summary(glm.model)पता चलता है कि उनके गुणांकों तुच्छ (उच्च …

3
रैखिक प्रतिगमन में महत्वपूर्ण विरोधाभास: एक गुणांक बनाम गैर-महत्वपूर्ण समग्र एफ-सांख्यिकीय के लिए महत्वपूर्ण टी-परीक्षण
मैं 4 श्रेणीबद्ध चर (प्रत्येक 4 स्तरों के साथ) और एक संख्यात्मक आउटपुट के बीच एक बहु रैखिक प्रतिगमन मॉडल फिटिंग कर रहा हूं। मेरे डेटासेट में 43 अवलोकन हैं। प्रतिगमन मुझे प्रत्येक ढलान गुणांक के लिए -est से निम्नलिखित -values देता है : । इस प्रकार, 4 भविष्यवक्ता के …

3
कैसे साबित किया जाए कि रेडियल आधार फ़ंक्शन एक कर्नेल है?
यह कैसे साबित करें कि रेडियल आधार फ़ंक्शन एक कर्नेल है? जहां तक ​​मैं समझता हूं, यह साबित करने के लिए हमें निम्नलिखित में से किसी एक को साबित करना होगा:k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2}) वैक्टर मैट्रिक्स = के किसी भी सेट के लिए सकारात्मक अर्धविराम है।x1,x2,...,xnx1,x2,...,xnx_1, x_2, ..., x_nK(x1,x2,...,xn)K(x1,x2,...,xn)K(x_1, x_2, …
35 svm  kernel-trick 


5
बहुत उच्च आयामी वर्गीकरण के लिए मुफ्त डेटा सेट [बंद]
1000 से अधिक सुविधाओं के साथ वर्गीकरण के लिए स्वतंत्र रूप से उपलब्ध डेटा सेट क्या हैं (या नमूना अंक यदि इसमें वक्र हैं)? मुफ्त डेटा सेट के बारे में पहले से ही एक समुदाय विकि है: स्वतंत्र रूप से उपलब्ध डेटा नमूनों का पता लगाना लेकिन यहाँ, एक और …

3
अवशिष्ट मानक त्रुटि क्या है?
आर में एक बहु प्रतिगमन मॉडल चलाते समय, आउटपुट में से एक स्वतंत्रता के 95,161 डिग्री पर 0.0589 का एक अवशिष्ट मानक त्रुटि है। मुझे पता है कि मेरे मॉडल में टिप्पणियों की संख्या और मेरे मॉडल में चर की संख्या के बीच अंतर से 95,161 डिग्री दी गई है। …

4
गामा यादृच्छिक चर की सामान्य राशि
मैंने पढ़ा है कि समान पैमाने के पैरामीटर के साथ गामा यादृच्छिक चर का योग एक और गामा यादृच्छिक चर है। मैंने मोस्कोपोउलोस द्वारा गामा यादृच्छिक चर के सामान्य सेट के योग के लिए एक विधि का वर्णन करते हुए कागज भी देखा है । मैंने मोशोपोलोस की पद्धति को …

5
क्या होगा यदि मेरे रेखीय प्रतिगमन डेटा में कई सह-रेखीय रैखिक संबंध शामिल हैं?
मान लीजिए कि मैं अध्ययन कर रहा हूं कि विभिन्न मिट्टी की स्थितियों में डैफोडील्स कैसे प्रतिक्रिया करते हैं। मैंने मिट्टी के पीएच बनाम डैफोडिल की परिपक्व ऊंचाई पर डेटा एकत्र किया है। मैं एक रैखिक संबंध की उम्मीद कर रहा हूं, इसलिए मैं एक रैखिक प्रतिगमन चलाने के बारे …

4
जब कक्षाएं अच्छी तरह से अलग हो जाती हैं तो लॉजिस्टिक रिग्रेशन अस्थिर क्यों हो जाता है?
जब कक्षाएं अच्छी तरह से अलग हो जाती हैं तो लॉजिस्टिक रिग्रेशन अस्थिर क्यों हो जाता है? अच्छी तरह से अलग वर्गों का क्या मतलब है? अगर कोई उदाहरण के साथ समझा सकता है तो मैं वास्तव में सराहना करूंगा।

3
आर - अवशिष्ट शब्दावली पर उलझन
मीन वर्ग त्रुटि को रूट करें वर्गों का अवशिष्ट योग अवशिष्ट मानक त्रुटि मतलब चुकता त्रुटि परीक्षण त्रुटि मुझे लगता था कि मैं इन शर्तों को समझता था, लेकिन जितना अधिक मैं सांख्यिकीय समस्याओं को करता हूं उतना ही मैंने खुद को भ्रमित कर लिया है जहां मैं खुद को …

1
क्या डाउन-सैंपलिंग लॉजिस्टिक रिग्रेशन गुणांक को बदल देता है?
अगर मेरे पास एक बहुत ही दुर्लभ सकारात्मक वर्ग के साथ एक डेटासेट है, और मैं नकारात्मक वर्ग का नमूना देता हूं, तो एक लॉजिस्टिक प्रतिगमन करें, क्या मुझे इस तथ्य को प्रतिबिंबित करने के लिए प्रतिगमन गुणांक को समायोजित करने की आवश्यकता है कि मैंने सकारात्मक वर्ग की व्यापकता …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.