सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
पॉइसन और नकारात्मक द्विपद रिग्रेसिएशन एक ही गुणांक में कब फिट होते हैं?
मैंने देखा है कि आर, पॉइसन और नकारात्मक द्विपद (एनबी) के प्रतिगमन हमेशा स्पष्ट के लिए समान गुणांक वाले लगते हैं, लेकिन निरंतर नहीं, भविष्यवक्ता। उदाहरण के लिए, यहाँ एक श्रेणीबद्ध भविष्यवक्ता के साथ एक प्रतिगमन है: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ …

9
इस साजिश में
निम्नलिखित कथानक में और बीच क्या संबंध है ? मेरे विचार में, नकारात्मक रैखिक संबंध है, लेकिन क्योंकि हमारे पास बहुत सारे आउटलेयर हैं, संबंध बहुत कमजोर है। क्या मैं सही हू? मैं सीखना चाहता हूं कि हम बिखराव को कैसे समझा सकते हैं।एक्सYYYXXX

3
भोले बेसेसियन क्लासिफायर इतने अच्छे प्रदर्शन क्यों करते हैं?
वर्गीकरण समस्याओं के लिए Naive Bayes classifiers एक लोकप्रिय विकल्प है। इसके कई कारण हैं, जिनमें शामिल हैं: "Zeitgeist" - लगभग दस साल पहले स्पैम फिल्टर की सफलता के बाद व्यापक जागरूकता लिखना आसान है क्लासिफायर मॉडल बनाने में तेज है मॉडल के पुनर्निर्माण के बिना मॉडल को नए प्रशिक्षण …

5
कॉक्स प्रतिगमन में भविष्यवाणी
मैं एक बहुभिन्नरूपी कॉक्स प्रतिगमन कर रहा हूं, मेरे पास मेरे महत्वपूर्ण स्वतंत्र चर और बीटा मान हैं। मॉडल मेरे डेटा के लिए बहुत अच्छी तरह से फिट बैठता है। अब, मैं अपने मॉडल का उपयोग करना चाहता हूं और एक नए अवलोकन के अस्तित्व की भविष्यवाणी करना चाहता हूं। …

2
मॉडल पहचान क्या है?
मुझे पता है कि एक मॉडल जो पहचानने योग्य नहीं है, के साथ कहा जा सकता है कि यह मॉडल मापदंडों के लिए कई अलग-अलग असाइनमेंट द्वारा उत्पन्न किया जा सकता है। मुझे पता है कि कभी-कभी मापदंडों को कसना संभव है ताकि सभी पहचानने योग्य हों, जैसा कि कैसला …

6
विश्वसनीय क्षेत्रों और बायेसियन परिकल्पना परीक्षणों के बीच क्या संबंध है?
लगातार आंकड़ों में, विश्वास अंतराल और परीक्षणों के बीच घनिष्ठ संबंध है। उदाहरण के रूप में वितरण में बारे में अनुमान का उपयोग करते हुए , विश्वास अंतराल के सभी मान हैं कि द्वारा अस्वीकार कर दिया नहीं कर रहे हैं महत्व स्तर पर टेस्ट ।एन ( μ , σ …

7
क्या R डेटासेट (.rda फ़ाइल) देखने के लिए एक अच्छा ब्राउज़र / दर्शक है
मैं .rda फ़ाइल (R डाटासेट) ब्राउज़ करना चाहता हूं। मुझे View(datasetname)कमांड के बारे में पता है । मैक के लिए आने वाला डिफ़ॉल्ट R.app में डेटा के लिए बहुत अच्छा ब्राउज़र नहीं है (यह X11 में एक विंडो खोलता है)। मुझे RStudio डेटा ब्राउज़र पसंद है जो Viewकमांड के साथ …
38 r 

4
सामान्य यादृच्छिक चर के लिए अनुमानित क्रम आँकड़े
क्या कुछ यादृच्छिक वितरण के आदेश आँकड़ों के लिए अच्छी तरह से ज्ञात सूत्र हैं? विशेष रूप से एक सामान्य यादृच्छिक चर के पहले और अंतिम क्रम के आँकड़े, लेकिन एक अधिक सामान्य उत्तर की भी सराहना की जाएगी। संपादित करें: स्पष्ट करने के लिए, मैं उन अनुमानित सूत्रों की …

8
क्या परिवर्तन के अंकों पर एक स्वतंत्र चर के प्रभाव का परीक्षण करते समय आधारभूत माप को नियंत्रण चर के रूप में शामिल करना मान्य है?
मैं एक OLS प्रतिगमन चलाने का प्रयास कर रहा हूं: DV: एक वर्ष में वजन में परिवर्तन (प्रारंभिक वजन - अंत वजन) IV: आप व्यायाम करते हैं या नहीं। हालांकि, यह उचित प्रतीत होता है कि भारी लोग पतले लोगों की तुलना में व्यायाम के प्रति यूनिट अधिक वजन कम …

5
आर में टाइम सीरीज़ 'क्लस्टरिंग'
मेरे पास समय श्रृंखला डेटा का एक सेट है। प्रत्येक श्रृंखला एक ही अवधि को कवर करती है, हालांकि हर बार श्रृंखला में वास्तविक तारीखें सभी 'लाइन अप' बिल्कुल नहीं हो सकती हैं। यह कहना है, यदि समय श्रृंखला को 2 डी मैट्रिक्स में पढ़ा जाना था, तो यह कुछ …

9
मैं बर्नौली यादृच्छिक चर का योग कैसे कुशलता से कर सकता हूं?
मैं एक रैंडम वैरिएबल ( ) मॉडलिंग कर रहा हूं, जो कि कुछ ~ 15-40k स्वतंत्र बर्नौली रैंडम वैरिएबल ( ) का , प्रत्येक एक अलग सफलता की संभावना ( ) के साथ है। औपचारिक रूप से, जहां और \ Pr (X_i = 0) = 1-p_i ।YYYXiXiX_ipipip_iY=∑XiY=∑XiY=\sum X_iPr(Xi=1)=piPr(Xi=1)=pi\Pr(X_i=1)=p_iPr(Xi=0)=1−piPr(Xi=0)=1−pi\Pr(X_i=0)=1-p_i मुझे Pr(Y&lt;=k)Pr(Y&lt;=k)\Pr(Y<=k) …

8
कैसे कुशलतापूर्वक यादृच्छिक सकारात्मक-अर्ध-सहसंबद्ध सहसंबंध matrices उत्पन्न करने के लिए?
मैं सकारात्‍मक रूप से सकारात्‍मक-साम्‍प्रदायिक (पीएसडी) सहसंबंध वाले मैट्रिसेस पैदा करने में सक्षम होना चाहूंगा। मेरी विधि नाटकीय रूप से धीमी हो जाती है क्योंकि मैं उत्पन्न होने वाले मैट्रिस के आकार को बढ़ाता हूं। क्या आप कोई कुशल उपाय सुझा सकते हैं? यदि आप मतलाब में किसी भी उदाहरण …

3
रैंडम फ़ॉरेस्ट और अत्यधिक रेंडमाइज़्ड पेड़ों के बीच अंतर
मैं समझ गया कि रैंडम फ़ॉरेस्ट और एक्सट्रीमली रेंडमाइज्ड ट्री इस मायने में भिन्न होते हैं कि रैंडम फ़ॉरेस्ट में पेड़ों के विभाजन नियतात्मक होते हैं जबकि वे अत्यधिक रैंडमाइज्ड ट्रीज़ के मामले में रैंडम होते हैं (अधिक सटीक होने के लिए, अगला स्प्लिट बेस्ट स्प्लिट है वर्तमान पेड़ के …

3
कैसे काठी सन्निकटन काम करता है?
कैसे काठी सन्निकटन काम करता है ? यह किस तरह की समस्या है? (उदाहरण के माध्यम से किसी विशेष उदाहरण या उदाहरण का उपयोग करने के लिए स्वतंत्र महसूस करें) क्या कोई कमियां, कठिनाइयाँ, चीजों को देखने के लिए या अनचाहे के लिए जाल हैं?

2
ImageNet: शीर्ष -1 और शीर्ष -5 त्रुटि दर क्या है?
ImageNet वर्गीकरण पत्रों में शीर्ष -1 और शीर्ष -5 त्रुटि दर कुछ समाधानों की सफलता को मापने के लिए महत्वपूर्ण इकाइयाँ हैं, लेकिन वे त्रुटि दर क्या हैं? में दीप Convolutional तंत्रिका नेटवर्क के साथ ImageNet वर्गीकरण Krizhevsky एट अल द्वारा। एक एकल सीएनएन (पृष्ठ 7) पर आधारित हर समाधान …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.