सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

14
एक सामान्य समय श्रृंखला के ऑनलाइन बाह्य विकृति का सरल एल्गोरिथ्म
मैं बड़ी मात्रा में समय श्रृंखला के साथ काम कर रहा हूं। ये समय श्रृंखला मूल रूप से हर 10 मिनट में आने वाले नेटवर्क माप हैं, और उनमें से कुछ आवधिक (यानी बैंडविड्थ) हैं, जबकि कुछ अन्य नहीं हैं (यानी रूटिंग ट्रैफ़िक की मात्रा)। मैं एक ऑनलाइन "बाहरी पहचान" …

30
क्या टाइप I और टाइप II त्रुटियों की परिभाषाओं को याद रखने का एक तरीका है?
मैं शिक्षाविद नहीं हूं, मैं एक सॉफ्टवेयर इंजीनियर हूं। फिर भी आंकड़े बहुत सामने आते हैं। वास्तव में, विशेष रूप से टाइप I और टाइप II त्रुटि के बारे में प्रश्न प्रमाणित सॉफ़्टवेयर डेवलपमेंट एसोसिएट परीक्षा के लिए मेरे अध्ययन के दौरान बहुत अधिक आ रहे हैं (गणित और सांख्यिकी …

2
Lme4 में अभिसरण चेतावनी के बारे में हमें कितना डर ​​होना चाहिए
यदि हम फिर से एक आकर्षक फिटिंग करते हैं तो हमें एक चेतावनी मिल सकती है जो हमें बताती है कि मॉडल को अभिसरण करने के लिए एक कठिन समय मिल रहा है ... उदा >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with …

3
रैंक की कमी क्या है, और इससे कैसे निपटें?
Lme4 का उपयोग करके एक लॉजिस्टिक रिग्रेशन को समाप्त करना Error in mer_finalize(ans) : Downdated X'X is not positive definite. इस त्रुटि का एक संभावित कारण स्पष्ट रूप से रैंक की कमी है। रैंक की कमी क्या है, और मुझे इसे कैसे पता होना चाहिए?
87 r  logistic  lme4-nlme 

5
K- साधन और K- निकटतम पड़ोसियों के बीच मुख्य अंतर क्या हैं?
मुझे पता है कि k- साधन अनसुना है और क्लस्टरिंग आदि के लिए उपयोग किया जाता है और k-NN की देखरेख की जाती है। लेकिन मैं दोनों के बीच ठोस अंतर जानना चाहता था?

2
इन दिनों कंप्यूटर की शक्ति को देखते हुए, क्या कभी फिशर के सटीक परीक्षण के बजाय ची-स्क्वेर्ड परीक्षण करने का कोई कारण है?
यह देखते हुए कि सॉफ्टवेयर फिशर की सटीक परीक्षण गणना इतनी आसानी से कर सकता है , क्या ऐसी कोई परिस्थिति है जहां, सैद्धांतिक रूप से या व्यावहारिक रूप से, ची-स्क्वेर परीक्षण वास्तव में फिशर के सटीक परीक्षण के लिए बेहतर है? फिशर के सटीक परीक्षण के लाभों में शामिल …

3
ऐसे उदाहरण क्या हैं जहां "भोली बूटस्ट्रैप" विफल रहता है?
मान लीजिए कि मेरे पास अज्ञात या जटिल वितरण से नमूना डेटा का एक सेट है, और मैं डेटा के सांख्यिकीय पर कुछ निष्कर्ष निकालना चाहता हूं । मेरे डिफ़ॉल्ट झुकाव बस प्रतिस्थापन के साथ बूटस्ट्रैप नमूनों की एक गुच्छा उत्पन्न, और मेरे आंकड़ा गणना करने के लिए है प्रत्येक …

9
क्या, ठीक है, एक आत्मविश्वास अंतराल है?
मैं मोटे तौर पर और अनौपचारिक रूप से जानता हूं कि आत्मविश्वास अंतराल क्या है। हालाँकि, मैं अपने सिर को एक महत्वपूर्ण विस्तार से नहीं लपेट सकता। एक विश्वास अंतराल यह अनुमान नहीं लगाता है कि पैरामीटर का सही मूल्य विश्वास अंतराल में होने की एक विशेष संभावना है जो …

9
क्या एक सहज स्पष्टीकरण है कि बहुकोशिकीय रैखिक प्रतिगमन में समस्या क्यों है?
विकी उन समस्याओं की चर्चा करता है जब बहुसांस्कृतिकता रैखिक प्रतिगमन में एक मुद्दा है। मूल समस्या अस्थिर पैरामीटर अनुमानों में बहुरूपता परिणाम है जो निर्भर चर पर स्वतंत्र चर के प्रभाव का आकलन करना बहुत मुश्किल बनाता है। मैं समस्याओं के पीछे तकनीकी कारणों को समझता हूं ( को …

17
एक मॉडल में बातचीत लेकिन मुख्य प्रभाव शामिल नहीं है
क्या मुख्य प्रभावों को शामिल किए बिना किसी मॉडल में दो-तरफ़ा बातचीत को शामिल करना कभी मान्य है? क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?

24
"आधुनिक" आंकड़ों के लिए अंगूठे के नियम
मुझे थम्ब के सांख्यिकीय नियमों पर जी वैन बेले की पुस्तक पसंद है , और कुछ हद तक कॉमन एरर्स इन स्टैटिस्टिक्स (और हाउ टू अवॉयड देम) फिलिप आई गुड और जेम्स डब्ल्यू हार्डिन से। प्रायोगिक और अवलोकन अध्ययनों के परिणामों की व्याख्या करते समय वे आम नुकसान को संबोधित …

16
सहसंबंध किस शर्तों के तहत उचित कारण है?
हम सभी जानते हैं कि मंत्र "सहसंबंध का अर्थ कार्य नहीं होता है" जो कि सभी प्रथम वर्ष के सांख्यिकी छात्रों में निहित है। इस विचार को स्पष्ट करने के लिए यहाँ कुछ अच्छे उदाहरण हैं । लेकिन कभी-कभी सहसंबंध भी करणीय कार्य करता है। निम्नलिखित उदाहरण इस विकिपीडिया पृष्ठ …

4
मिश्रित प्रभाव मॉडल के लिए nlme या lme4 R लाइब्रेरी का चयन कैसे करें?
मैंने कुछ मिश्रित प्रभाव वाले मॉडल (विशेष रूप से अनुदैर्ध्य मॉडल) का उपयोग करके फिट किया है lme4, Rलेकिन वास्तव में उन मॉडलों और उनके साथ जाने वाले कोड को मास्टर करना चाहता हूं। हालांकि, दोनों पैरों के साथ डाइविंग (और कुछ किताबें खरीदने से पहले) मैं यह सुनिश्चित करना …

8
यदि माध्य इतना संवेदनशील है, तो पहले स्थान पर इसका उपयोग क्यों करें?
यह एक ज्ञात तथ्य है कि माध्य बाहरी लोगों के लिए प्रतिरोधी है। अगर ऐसा है, तो हम पहली जगह में कब और क्यों इसका इस्तेमाल करेंगे? एक बात जो मैं सोच सकता हूं, वह यह है कि आउटलेर्स की उपस्थिति को समझना है, यदि मध्य माध्य से दूर है, …

1
समय श्रृंखला पूर्वानुमान के लिए तंत्रिका नेटवर्क कैसे लागू करें?
मैं मशीन लर्निंग के लिए नया हूं, और मैं यह जानने की कोशिश कर रहा हूं कि समय श्रृंखला पूर्वानुमान के लिए तंत्रिका नेटवर्क कैसे लागू किया जाए। मुझे अपनी क्वेरी से संबंधित संसाधन मिल गए हैं, लेकिन मैं अभी भी थोड़ा खो गया हूं। मुझे लगता है कि बहुत …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.