सांख्यिकी और बिग डेटा missing-data

4

मैं यह कैसे निर्धारित करूं कि क्या दो सहसंबंध काफी भिन्न हैं?

मैं यह निर्धारित करना चाहता हूं कि डेटा के दो सेटों में से कौन सा (बी 1, बी 2) बेहतर सहसंबंधी (पी) आर) दूसरे सेट (ए) के लिए है। डेटा के सभी सेटों में डेटा गायब है। मैं यह कैसे निर्धारित कर सकता हूं कि परिणामी सहसंबंध काफी अलग है …

9 hypothesis-testing correlation statistical-significance missing-data

2

यादृच्छिक प्रभाव मेटा-विश्लेषण के लिए वैकल्पिक भार योजनाएं: लापता मानक विचलन

मैं एक यादृच्छिक प्रभाव मेटा-विश्लेषण पर काम कर रहा हूं जिसमें कई अध्ययन शामिल हैं जो मानक विचलन की रिपोर्ट नहीं करते हैं; सभी अध्ययन नमूना आकार की रिपोर्ट करते हैं। मेरा मानना है कि एसडी लापता डेटा को अनुमानित या अशुद्ध करना संभव नहीं है। एक मेटा-विश्लेषण का उपयोग …

9 stata missing-data meta-analysis meta-regression

2

समय के साथ अधिक विस्तृत व्याख्यात्मक चर शामिल करना

मैं यह समझने की कोशिश कर रहा हूं कि मैं एक वैरिएबल को कैसे मॉडल कर सकता हूं जहां समय के साथ मैंने तेजी से विस्तृत भविष्यवाणियां प्राप्त की हैं। उदाहरण के लिए, डिफ़ॉल्ट ऋणों पर मॉडलिंग रिकवरी दरों पर विचार करें। मान लीजिए कि हमारे पास 20 वर्षों के …

9 regression missing-data

1

रैंडम फ़ोरस्टेस्ट (R) के साथ पूर्वानुमान जब कुछ इनपुट में लापता मान हैं (NA)

मेरे पास एक अच्छा randomForestवर्गीकरण मॉडल है जिसे मैं एक ऐसे अनुप्रयोग में उपयोग करना चाहूंगा जो एक नए मामले की कक्षा की भविष्यवाणी करता है। नए मामले में अनिवार्य रूप से लापता मूल्य हैं। भविष्यवाणी NAs के लिए इस तरह के रूप में काम नहीं करेगा। फिर मुझे यह …

9 r random-forest prediction missing-data

1

मनाया बनाम अपेक्षित घटनाओं की तुलना कैसे करें?

मान लीजिए कि मेरे पास 4 संभावित घटनाओं की आवृत्तियों का एक नमूना है: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 और मुझे होने वाली मेरी घटनाओं की संभावित संभावनाएं हैं: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 मेरी चार …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

1

लापता प्रतिपादक चर के साथ एकाधिक प्रतिगमन

मान लीजिए कि हमें फॉर्म के डेटा का एक सेट दिया गया है (y,x1,x2,⋯,xn)(y,x1,x2,⋯,xn)(y,x_{1},x_{2},\cdots, x_{n}) तथा (y,x1,एक्स2, ⋯,एक्सएन - 1)(y,एक्स1,एक्स2,⋯,एक्सn-1)(y,x_{1},x_{2},\cdots, x_{n-1})। हमें भविष्यवाणी करने का काम दिया जाता हैyyy के मूल्यों पर आधारित है एक्सएक्सx। हम दो अनुमानों का अनुमान लगाते हैं: yy=च1(एक्स1, ⋯ ,एक्सएन - 1,एक्सn)=च2(एक्स1, ⋯,एक्सएन - 1)(1)(2)(1)y=च1(एक्स1,⋯,एक्सn-1,एक्सn)(2)y=च2(एक्स1,⋯,एक्सn-1) …

9 regression multiple-regression missing-data multicollinearity multiple-imputation

4

ऑटोक्लेररेशन और न्यूरल नेटवर्क के लिए मैटलैब का उपयोग करते समय समय श्रृंखला डेटा में अंतराल / NaN से कैसे निपटें?

मेरे पास मापों की एक समय श्रृंखला है (ऊँचाई-एक आयामी श्रृंखला)। अवलोकन अवधि में, माप प्रक्रिया कुछ समय बिंदुओं के लिए नीचे चली गई। इसलिए परिणामी डेटा NaNs के साथ एक वेक्टर है जहां डेटा में अंतराल थे। MATLAB का उपयोग करते हुए, यह मुझे एक समस्या पैदा कर रहा …

9 time-series dataset matlab autocorrelation missing-data

3

श्रेणीबद्ध चर के 'पता नहीं है / इनकार' के स्तर का इलाज

मैं लॉजिस्टिक रिग्रेशन का उपयोग करके डायबिटीज प्रेडिक्शन मॉडलिंग कर रहा हूं। उपयोग किया गया डेटासेट सेंटर फॉर डिजीज कंट्रोल (CDC) का बिहेवियरल रिस्क फैक्टर सर्विलांस सिस्टम (BRFSS) है। स्वतंत्र चर में से एक उच्च रक्तचाप है। यह निम्न स्तरों 'हां', 'नहीं', 'न जाने / मना कर दिया' के साथ …

9 logistic missing-data

7

असमान आकार के दो चर के बीच सहसंबंध

एक समस्या जिस पर मैं काम कर रहा हूं, मेरे पास दो यादृच्छिक चर हैं, एक्स और वाई। मुझे यह पता लगाने की आवश्यकता है कि उनमें से दो कैसे परस्पर संबंधित हैं, लेकिन वे विभिन्न आयामों के हैं। X के पंक्ति स्थान की रैंक 4350 है, और Y के …

9 time-series correlation missing-data finance

2

मैं यह कैसे निर्धारित करूं कि लापता डेटा वाला एक जीवित मॉडल उपयुक्त है?

थोड़ा सा घूमते हुए, मेरे पास लगभग एक लाख रिकॉर्ड हैं जो लगभग दस वर्षों में फैले सिस्टम में लोगों के प्रवेश समय और निकास समय को रिकॉर्ड करते हैं। हर रिकॉर्ड में एंट्री टाइम होता है, लेकिन हर रिकॉर्ड में एग्जिट टाइम नहीं होता। प्रणाली में औसत समय ~ …

9 survival missing-data

missing-data पर टैग किए गए जवाब