सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
ढलान अनुमान में बड़ी असहमति जब समूहों को यादृच्छिक बनाम एक मिश्रित मॉडल में तय किया जाता है
मैं समझता हूं कि हम यादृच्छिक प्रभाव (या मिश्रित प्रभाव) मॉडल का उपयोग करते हैं जब हम मानते हैं कि कुछ मॉडल पैरामीटर कुछ समूहों के समूह में यादृच्छिक रूप से भिन्न होते हैं। मुझे एक मॉडल फिट करने की इच्छा है, जहां एक समूहीकरण कारक में प्रतिक्रिया को सामान्यीकृत …

3
लार में वियरेन्स-कोवरियनस मैट्रिक्स
मुझे पता है कि मिश्रित मॉडल के फायदों में से एक यह है कि वे डेटा के लिए विचरण-कोवरियन मैट्रिक्स को निर्दिष्ट करने की अनुमति देते हैं (यौगिक समरूपता, ऑटोरेर्गिव, असंरचित, आदि) हालांकि, lmerआर में फ़ंक्शन इस मैट्रिक्स के आसान विनिर्देश के लिए अनुमति नहीं देता है। क्या किसी को …

1
केंद्रीय सीमा प्रमेय और बड़ी संख्या का कानून
मेरे पास केंद्रीय सीमा प्रमेय (CLT) के बारे में बहुत शुरुआत का प्रश्न है: मुझे पता है कि सीएलटी बताता है कि आईआईडी यादृच्छिक चर का एक मतलब लगभग सामान्य वितरित किया जाता है ( , जहां एन सम्मन का सूचकांक है) या मानकीकृत यादृच्छिक चर का मानक सामान्य वितरण …

4
लगातार बर्नौली सफलताओं की गैर-पूर्णांक राशि कैसे उत्पन्न करें?
दिया हुआ: अज्ञात पूर्वाग्रह (सिर) के साथ एक सिक्का ।ppp एक सख्ती से सकारात्मक वास्तविक ।a>0a>0a > 0 मुसीबत: पूर्वाग्रह साथ एक यादृच्छिक बर्नोली संस्करण उत्पन्न करें ।papap^{a} क्या किसी को भी यह करना आता है? उदाहरण के लिए, जब सकारात्मक पूर्णांक होता है, तो कोई सिक्का को बार फ्लिप …
18 sampling 

1
चरम यादृच्छिक वन यादृच्छिक वन से कैसे भिन्न होता है?
क्या ईआर अधिक कुशल कार्यान्वयन है (somelike Extreme Gradient Boostingग्रेडिएंट बूस्टिंग है) - व्यावहारिक दृष्टिकोण से महत्वपूर्ण अंतर है? आर पैकेज है जो उन्हें लागू करता है। क्या यह नया एल्गोरिथ्म है जो "जेनेरिक" कार्यान्वयन (आर से रैंडमफॉरस्ट पैकेज) को खत्म कर देता है न केवल दक्षता के मामले में …

3
आंकड़ों के इतिहास में काल
विज्ञान के कई क्षेत्रों के इतिहास को थोड़े समय के अंतराल में विभाजित किया जा सकता है जो अक्सर किसी महत्वपूर्ण खोज से शुरू होता है। लेकिन मैंने कभी भी आंकड़ों के टाइमलाइन में ऐसा कुछ नहीं देखा। जाहिर है, कुछ महत्वपूर्ण तिथियां हैं जिन्हें एक नई अवधि (पास्कल + …
18 history 

1
एकाधिक प्रतिगमन में भविष्यवाणियों के बीच उच्च सहसंबंध से कैसे निपटें?
मुझे एक लेख में एक संदर्भ मिला जो इस प्रकार है: तबैकनिक एंड फिडेल (1996) के अनुसार, एक से अधिक बाइरवेट सहसंबंध के साथ स्वतंत्र चर .70 को कई प्रतिगमन विश्लेषण में शामिल नहीं किया जाना चाहिए। समस्या: मैंने एकाधिक प्रतिगमन डिज़ाइन में उपयोग किया है 3 चर> .80, VIF's …

1
, पूर्वानुमान अवधि पर सिमुलेशन
मेरे पास समय श्रृंखला डेटा है और मैंने डेटा फिट करने के लिए मॉडल के रूप में ARIMA(p,d,q)+XtARIMA(p,d,q)+XtARIMA(p,d,q)+X_t का उपयोग किया। XtXtX_t एक संकेतक यादृच्छिक चर या तो यह है कि 0 (जब मैं दुर्लभ घटना देखें) (जब मैं एक दुर्लभ घटना नहीं दिख रहा है) या 1 है। पिछली …

2
क्या स्नातक विद्यालय में न्यूनतम भिन्नता के सिद्धांत का निष्पक्ष मूल्यांकन किया गया है?
हाल ही में जब मैं एक समान वितरण के मापदंडों के लिए न्यूनतम विचरण निष्पक्ष अनुमानों के बारे में कफ जवाब देने से पूरी तरह से गलत था, तो मैं बहुत शर्मिंदा था। सौभाग्य से मुझे तुरंत कार्डिनल और हेनरी द्वारा ठीक किया गया था, जिसमें हेनरी ने ओपी के …

6
आँकड़े क्यों उपयोगी होते हैं जब कई चीजें जो एक शॉट वाली चीजें होती हैं?
मुझे नहीं पता कि यह सिर्फ मेरे लिए है, लेकिन मैं सामान्य रूप से आंकड़ों पर बहुत संदेह करता हूं। मैं इसे पासा के खेल, पोकर गेम आदि में समझ सकता हूं। बहुत छोटे, सरल, अधिकतर आत्म-निहित दोहराया खेल ठीक हैं। उदाहरण के लिए, इसके किनारे पर एक सिक्का उतरना …

1
क्या यादृच्छिक संख्या जनरेटर से छंटनी की गई संख्याएं अभी भी 'यादृच्छिक' हैं?
यहाँ 'ट्रंकटिंग' से तात्पर्य है रैंडम नंबरों की सटीकता को कम करना और रैंडम नंबरों की श्रृंखला को छोटा न करना। उदाहरण के लिए, अगर मैं सही मायने में यादृच्छिक संख्या मनमाना परिशुद्धता के साथ (किसी भी वितरण, जैसे, सामान्य, वर्दी, आदि से तैयार) और मैं सभी नंबरों को छोटा …

6
आउट-ऑफ-कोर डेटा विश्लेषण विकल्प
मैं अब 5 साल के लिए एसएएस पेशेवर का उपयोग कर रहा हूं। मैंने इसे अपने लैपटॉप पर स्थापित किया है और अक्सर 1,000-2,000 चर और सैकड़ों हजारों टिप्पणियों के साथ डेटासेट का विश्लेषण करना पड़ता है। मैं एसएएस के विकल्पों की तलाश में हूं जो मुझे समान आकार के …
18 r  sas  large-data 

5
श्रेणीबद्ध या गुणात्मक चर के साथ उपयोग करने के लिए कौन से सारांश आँकड़े?
बस स्पष्ट करने के लिए, जब मेरा मतलब सारांश आँकड़े हैं, तो मैं मीन, मेडियन चतुर्थक पर्वतमाला, वैरियनस, मानक विचलन का उल्लेख करता हूं। सारांशित करते समय एक अविभाज्य जो है , जो नाममात्र और साधारण दोनों मामलों पर विचार करते हुए श्रेणीबद्ध या गुणात्मक है , क्या इसका मतलब, …

3
आधुनिक आंकड़ों में एमडीएस की क्या भूमिका है?
मैं हाल ही में बहुआयामी स्केलिंग में आया हूं। मैं इस टूल को बेहतर और आधुनिक आँकड़ों में इसकी भूमिका को समझने की कोशिश कर रहा हूँ। तो यहाँ कुछ मार्गदर्शक प्रश्न हैं: कौन से सवालों का जवाब देता है? कौन से शोधकर्ता अक्सर इसका उपयोग करने में रुचि रखते …

2
में एक कॉक्सफ मॉडल के सारांश में दिया गया " " मान क्या है
क्या है मूल्य आर में एक coxph मॉडल का सारांश में दिए गए? उदाहरण के लिए,आर2आर2R^2 Rsquare= 0.186 (max possible= 0.991 ) मैंने मूर्खता से इसे मान के रूप में शामिल किया और समीक्षक ने यह कहते हुए उस पर छलांग लगा दी कि उसे C मॉडल के लिए विकसित …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.