सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
फिशर वितरण के लिए फूरियर रूपांतरण
फिशर वितरण की विशेषता कार्य है: जहां है संगामी hypergeometric समारोह । मैं व्युत्क्रम फ़ॉयर ट्रांसफॉर्म को हल करने के लिए -convolution के वेरिएबल के घनत्व को ठीक करने की कोशिश कर रहा हूँ , वह है: के योग के वितरण के उद्देश्य सेसी ( टी ) = Γ ( …

2
ARMA का उपयोग करते हुए एक गैर-स्थिर प्रक्रिया के मॉडलिंग के परिणाम?
मैं समझता हूं कि हमें गैर-स्थिर समय श्रृंखला मॉडलिंग के लिए ARIMA का उपयोग करना चाहिए। इसके अलावा, मैं जो कुछ भी पढ़ता हूं वह कहता है कि एआरएमए को केवल स्थिर समय श्रृंखला के लिए उपयोग किया जाना चाहिए। मैं जो समझने की कोशिश कर रहा हूं, वह यह …

2
CHAID बनाम CRT (या कार्ट)
मैं लगभग 20 भविष्यवक्ताओं (कुछ श्रेणियों के साथ श्रेणीबद्ध) वाले डेटा सेट पर SPSS का उपयोग करके एक निर्णय ट्री वर्गीकरण चला रहा हूं । CHAID (ची-स्क्वैयर ऑटोमैटिक इंटरेक्शन डिटेक्शन) और CRT / CART (क्लासिफिकेशन एंड रिग्रेशन ट्रीज) मुझे अलग-अलग पेड़ दे रहे हैं। क्या कोई CHAID बनाम CRT के …
23 spss  cart 

1
एक प्राथमिक शक्ति विश्लेषण अनिवार्य रूप से बेकार है?
मैंने पिछले हफ्ते सोसाइटी फॉर पर्सनेलिटी एंड सोशल साइकोलॉजी की एक बैठक में भाग लिया था जहाँ मैंने उरी सिमोनसोहन द्वारा इस बात को इस आधार के साथ देखा कि नमूना आकार निर्धारित करने के लिए एक प्राथमिक शक्ति विश्लेषण का उपयोग करना अनिवार्य रूप से बेकार था क्योंकि इसके …

1
क्रॉस सत्यापन (सीवी) और सामान्यीकृत क्रॉस सत्यापन (जीसीवी) आँकड़े
मैं संभवतः पार सत्यापन (CV) आँकड़ों के लिए और एक रेखीय मॉडल के साथ जुड़े सामान्यीकृत पार सत्यापन (जीसीवी) आँकड़ों के लिए परिभाषाएँ परस्पर विरोधी पाया है (साथ एक सामान्य, homoscedastic त्रुटि वेक्टर )।Y= एक्सβ + εY=एक्सβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilonεε\boldsymbol\varepsilon एक ओर, गोलूब, हीथ और वहाबा GCV अनुमान _ …

2
विषय मॉडल में विषय स्थिरता
मैं एक ऐसी परियोजना पर काम कर रहा हूं, जहां मैं ओपन-एंडेड निबंधों की एक श्रृंखला की सामग्री के बारे में कुछ जानकारी निकालना चाहता हूं। इस विशेष परियोजना में, 148 लोगों ने एक बड़े प्रयोग के एक काल्पनिक छात्र संगठन के बारे में निबंध लिखा। यद्यपि मेरे क्षेत्र में …

2
मिश्रित मॉडल के लिए नमूना आकार की गणना
मैं सोच रहा हूं कि क्या मिश्रित मॉडल में नमूना आकार की गणना के लिए कोई तरीके हैं? मैं lmerमॉडल फिट करने के लिए आर में उपयोग कर रहा हूं (मेरे पास यादृच्छिक ढलान और इंटरसेप्ट्स हैं)।

4
(कुछ) छद्म-यादृच्छिककरण के साथ क्या गलत है
मुझे एक अध्ययन में पता चला, जिसमें मरीज, जिनकी उम्र 50 से अधिक थी, जन्म के वर्ष तक छद्म यादृच्छिक थे। यदि जन्म वर्ष एक समान संख्या, सामान्य देखभाल, यदि विषम संख्या, हस्तक्षेप है। इसे लागू करना आसान है, यह सबवर्ट करना कठिन है (यह जांचना आसान है कि मरीज …

2
परीक्षण सेट और प्रशिक्षण सेट के वितरण के बीच अंतर को कैसे संभालना है?
मुझे लगता है कि मशीन सीखने या पैरामीटर के आकलन की एक बुनियादी धारणा यह है कि अनदेखी डेटा प्रशिक्षण सेट के समान वितरण से आता है। हालांकि, कुछ व्यावहारिक मामलों में, परीक्षण सेट का वितरण लगभग प्रशिक्षण सेट से अलग होगा। बड़े पैमाने पर बहु-वर्गीकरण समस्या के लिए कहें …

2
पहले बल्लेबाजी औसत बल्लेबाजी
मैं बीटा वितरण के लिए अंतर्ज्ञान के बारे में एक उत्कृष्ट उत्तर से प्रेरित प्रश्न पूछना चाहता था । मैं बल्लेबाजी औसत के लिए पूर्व वितरण के लिए व्युत्पत्ति की बेहतर समझ प्राप्त करना चाहता था। ऐसा लग रहा है कि डेविड माध्य और सीमा से मापदंडों का समर्थन कर …
23 bayesian  prior 

3
गाऊसी के मिश्रण के रूप में छात्र टी
आज़ादी के डिग्री, स्थान पैरामीटर l और स्केल पैरामीटर s घनत्व वाले छात्र t- वितरण का उपयोग करनाk>0k>0k > 0lllsss Γ(k+12)Γ(k2kπs2−−−−√){1+k−1(x−ls)}−(k+1)/2,Γ(k+12)Γ(k2kπs2){1+k−1(x−ls)}−(k+1)/2,\frac{\Gamma \left(\frac{k+1}{2}\right)}{\Gamma\left(\frac{k}{2}\sqrt{k \pi s^2}\right)} \left\{ 1 + k^{-1}\left( \frac{x-l}{s}\right)\right\}^{-(k+1)/2}, कैसे पता चलता है कि छात्र -distribution अनुमति से गाऊसी वितरण का एक मिश्रण के रूप में लिखा जा सकता है …

3
K बर्नौली परीक्षणों में सफल रहा, या जॉर्ज लुकास फिल्म प्रयोग
मैं अब "द ड्रंकर्ड वॉक" पढ़ रहा हूं और इससे एक कहानी नहीं समझ सकता। ये रहा: कल्पना कीजिए कि जॉर्ज लुकास एक नई स्टार वार्स फिल्म बनाता है और एक परीक्षण बाजार में एक पागल प्रयोग करने का फैसला करता है। वह एक ही फिल्म को दो शीर्षकों के …

2
समोच्च / गर्मी ओवरले के साथ स्कैटरप्लॉट
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मैंने इस प्लॉट को एक हालिया पेपर के सप्लीमेंट में देखा और मैं इसे आर का …

4
आर में संचयी वितरण की गणना कैसे करें?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मुझे डेटा नमूने के संचयी वितरण फ़ंक्शन की गणना करने की आवश्यकता है। क्या R (H) …
23 r  distributions  cdf 

4
क्या कोई रैंडम फ़ॉरेस्ट कार्यान्वयन है जो बहुत विरल डेटा के साथ काम करता है?
क्या एक आर यादृच्छिक वन कार्यान्वयन है जो बहुत विरल डेटा के साथ अच्छी तरह से काम करता है? मेरे पास हजारों या लाखों बूलियन इनपुट वैरिएबल हैं, लेकिन केवल सैकड़ों या किसी भी उदाहरण के लिए TRUE होगा। मैं R के लिए अपेक्षाकृत नया हूं और देखा है कि …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.