सांख्यिकी और बिग डेटा

2

पॉइसन और नकारात्मक द्विपद रिग्रेसिएशन एक ही गुणांक में कब फिट होते हैं?

मैंने देखा है कि आर, पॉइसन और नकारात्मक द्विपद (एनबी) के प्रतिगमन हमेशा स्पष्ट के लिए समान गुणांक वाले लगते हैं, लेकिन निरंतर नहीं, भविष्यवक्ता। उदाहरण के लिए, यहाँ एक श्रेणीबद्ध भविष्यवक्ता के साथ एक प्रतिगमन है: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ …

38 regression negative-binomial poisson-regression

9

इस साजिश में

निम्नलिखित कथानक में और बीच क्या संबंध है ? मेरे विचार में, नकारात्मक रैखिक संबंध है, लेकिन क्योंकि हमारे पास बहुत सारे आउटलेयर हैं, संबंध बहुत कमजोर है। क्या मैं सही हू? मैं सीखना चाहता हूं कि हम बिखराव को कैसे समझा सकते हैं।एक्सYYYXXX

38 self-study correlation scatterplot

3

भोले बेसेसियन क्लासिफायर इतने अच्छे प्रदर्शन क्यों करते हैं?

वर्गीकरण समस्याओं के लिए Naive Bayes classifiers एक लोकप्रिय विकल्प है। इसके कई कारण हैं, जिनमें शामिल हैं: "Zeitgeist" - लगभग दस साल पहले स्पैम फिल्टर की सफलता के बाद व्यापक जागरूकता लिखना आसान है क्लासिफायर मॉडल बनाने में तेज है मॉडल के पुनर्निर्माण के बिना मॉडल को नए प्रशिक्षण …

38 classification naive-bayes

5

कॉक्स प्रतिगमन में भविष्यवाणी

मैं एक बहुभिन्नरूपी कॉक्स प्रतिगमन कर रहा हूं, मेरे पास मेरे महत्वपूर्ण स्वतंत्र चर और बीटा मान हैं। मॉडल मेरे डेटा के लिए बहुत अच्छी तरह से फिट बैठता है। अब, मैं अपने मॉडल का उपयोग करना चाहता हूं और एक नए अवलोकन के अस्तित्व की भविष्यवाणी करना चाहता हूं। …

38 regression survival prediction cox-model

2

मॉडल पहचान क्या है?

मुझे पता है कि एक मॉडल जो पहचानने योग्य नहीं है, के साथ कहा जा सकता है कि यह मॉडल मापदंडों के लिए कई अलग-अलग असाइनमेंट द्वारा उत्पन्न किया जा सकता है। मुझे पता है कि कभी-कभी मापदंडों को कसना संभव है ताकि सभी पहचानने योग्य हों, जैसा कि कैसला …

38 identifiability

6

विश्वसनीय क्षेत्रों और बायेसियन परिकल्पना परीक्षणों के बीच क्या संबंध है?

लगातार आंकड़ों में, विश्वास अंतराल और परीक्षणों के बीच घनिष्ठ संबंध है। उदाहरण के रूप में वितरण में बारे में अनुमान का उपयोग करते हुए , विश्वास अंतराल के सभी मान हैं कि द्वारा अस्वीकार कर दिया नहीं कर रहे हैं महत्व स्तर पर टेस्ट ।एन ( μ , σ …

38 hypothesis-testing bayesian confidence-interval frequentist credible-interval

7

क्या R डेटासेट (.rda फ़ाइल) देखने के लिए एक अच्छा ब्राउज़र / दर्शक है

मैं .rda फ़ाइल (R डाटासेट) ब्राउज़ करना चाहता हूं। मुझे View(datasetname)कमांड के बारे में पता है । मैक के लिए आने वाला डिफ़ॉल्ट R.app में डेटा के लिए बहुत अच्छा ब्राउज़र नहीं है (यह X11 में एक विंडो खोलता है)। मुझे RStudio डेटा ब्राउज़र पसंद है जो Viewकमांड के साथ …

38 r

4

सामान्य यादृच्छिक चर के लिए अनुमानित क्रम आँकड़े

क्या कुछ यादृच्छिक वितरण के आदेश आँकड़ों के लिए अच्छी तरह से ज्ञात सूत्र हैं? विशेष रूप से एक सामान्य यादृच्छिक चर के पहले और अंतिम क्रम के आँकड़े, लेकिन एक अधिक सामान्य उत्तर की भी सराहना की जाएगी। संपादित करें: स्पष्ट करने के लिए, मैं उन अनुमानित सूत्रों की …

38 distributions normal-distribution approximation order-statistics

8

क्या परिवर्तन के अंकों पर एक स्वतंत्र चर के प्रभाव का परीक्षण करते समय आधारभूत माप को नियंत्रण चर के रूप में शामिल करना मान्य है?

मैं एक OLS प्रतिगमन चलाने का प्रयास कर रहा हूं: DV: एक वर्ष में वजन में परिवर्तन (प्रारंभिक वजन - अंत वजन) IV: आप व्यायाम करते हैं या नहीं। हालांकि, यह उचित प्रतीत होता है कि भारी लोग पतले लोगों की तुलना में व्यायाम के प्रति यूनिट अधिक वजन कम …

38 regression repeated-measures least-squares change-scores

5

आर में टाइम सीरीज़ 'क्लस्टरिंग'

मेरे पास समय श्रृंखला डेटा का एक सेट है। प्रत्येक श्रृंखला एक ही अवधि को कवर करती है, हालांकि हर बार श्रृंखला में वास्तविक तारीखें सभी 'लाइन अप' बिल्कुल नहीं हो सकती हैं। यह कहना है, यदि समय श्रृंखला को 2 डी मैट्रिक्स में पढ़ा जाना था, तो यह कुछ …

38 r time-series clustering cointegration

9

मैं बर्नौली यादृच्छिक चर का योग कैसे कुशलता से कर सकता हूं?

मैं एक रैंडम वैरिएबल ( ) मॉडलिंग कर रहा हूं, जो कि कुछ ~ 15-40k स्वतंत्र बर्नौली रैंडम वैरिएबल ( ) का , प्रत्येक एक अलग सफलता की संभावना ( ) के साथ है। औपचारिक रूप से, जहां और \ Pr (X_i = 0) = 1-p_i ।YYYXiXiX_ipipip_iY=∑XiY=∑XiY=\sum X_iPr(Xi=1)=piPr(Xi=1)=pi\Pr(X_i=1)=p_iPr(Xi=0)=1−piPr(Xi=0)=1−pi\Pr(X_i=0)=1-p_i मुझे Pr(Y<=k)Pr(Y<=k)\Pr(Y<=k) …

38 r distributions binomial random-variable poisson-binomial

8

कैसे कुशलतापूर्वक यादृच्छिक सकारात्मक-अर्ध-सहसंबद्ध सहसंबंध matrices उत्पन्न करने के लिए?

मैं सकारात्‍मक रूप से सकारात्‍मक-साम्‍प्रदायिक (पीएसडी) सहसंबंध वाले मैट्रिसेस पैदा करने में सक्षम होना चाहूंगा। मेरी विधि नाटकीय रूप से धीमी हो जाती है क्योंकि मैं उत्पन्न होने वाले मैट्रिस के आकार को बढ़ाता हूं। क्या आप कोई कुशल उपाय सुझा सकते हैं? यदि आप मतलाब में किसी भी उदाहरण …

38 random-generation correlation-matrix

3

रैंडम फ़ॉरेस्ट और अत्यधिक रेंडमाइज़्ड पेड़ों के बीच अंतर

मैं समझ गया कि रैंडम फ़ॉरेस्ट और एक्सट्रीमली रेंडमाइज्ड ट्री इस मायने में भिन्न होते हैं कि रैंडम फ़ॉरेस्ट में पेड़ों के विभाजन नियतात्मक होते हैं जबकि वे अत्यधिक रैंडमाइज्ड ट्रीज़ के मामले में रैंडम होते हैं (अधिक सटीक होने के लिए, अगला स्प्लिट बेस्ट स्प्लिट है वर्तमान पेड़ के …

38 machine-learning correlation references random-forest

3

कैसे काठी सन्निकटन काम करता है?

कैसे काठी सन्निकटन काम करता है ? यह किस तरह की समस्या है? (उदाहरण के माध्यम से किसी विशेष उदाहरण या उदाहरण का उपयोग करने के लिए स्वतंत्र महसूस करें) क्या कोई कमियां, कठिनाइयाँ, चीजों को देखने के लिए या अनचाहे के लिए जाल हैं?

38 distributions mathematical-statistics mgf saddlepoint-approximation partial-moments

2

ImageNet: शीर्ष -1 और शीर्ष -5 त्रुटि दर क्या है?

ImageNet वर्गीकरण पत्रों में शीर्ष -1 और शीर्ष -5 त्रुटि दर कुछ समाधानों की सफलता को मापने के लिए महत्वपूर्ण इकाइयाँ हैं, लेकिन वे त्रुटि दर क्या हैं? में दीप Convolutional तंत्रिका नेटवर्क के साथ ImageNet वर्गीकरण Krizhevsky एट अल द्वारा। एक एकल सीएनएन (पृष्ठ 7) पर आधारित हर समाधान …

38 classification neural-networks error measurement-error image-processing