सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
सामान्य आरवी के कर्टोसिस और तिरछापन को बढ़ाने के लिए परिवर्तन
मैं एक एल्गोरिथ्म है कि तथ्य यह है कि टिप्पणियों पर निर्भर करता है पर काम कर रहा हूँ एस सामान्य रूप से वितरित कर रहे हैं, और मैं अनुभव इस धारणा को एल्गोरिथ्म की मजबूती का परीक्षण करना चाहते हैं।YYY ऐसा करने के लिए, मैं परिवर्तनों का एक क्रम …

3
अवशेषों को सामान्य रूप से वितरित किए जाने की पुष्टि करने के लिए मैं किन परीक्षणों का उपयोग करता हूं?
मेरे पास कुछ आंकड़े हैं जो लगभग बनाम सामान्य समय के अवशेषों के ग्राफ को प्लॉट करने से दिखता है लेकिन मैं निश्चित होना चाहता हूं। मैं त्रुटि अवशेषों की सामान्यता के लिए कैसे परीक्षण कर सकता हूं?

5
बिना टी-टेस्ट वाली जोड़ी
मान लीजिए मेरे पास 20 चूहे हैं। मैं चूहों को किसी तरह से जोड़ देता हूं, ताकि मुझे 10 जोड़े मिलें। इस प्रश्न के उद्देश्य के लिए, यह एक यादृच्छिक जोड़ी हो सकती है, या यह एक समझदार जोड़ी हो सकती है, जैसे एक ही कूड़े से एक ही लिंग …

3
प्रतिगमन गुणांक की व्याख्या कैसे करें जब प्रतिक्रिया 4 वीं जड़ द्वारा बदल दी गई थी?
मैं 1/4अपने प्रतिक्रिया चर पर चौथी जड़ ( ) शक्ति परिवर्तन का उपयोग कर रहा हूं , जो विषमलैंगिकता के परिणामस्वरूप है। लेकिन अब मुझे यकीन नहीं है कि मैं अपने प्रतिगमन गुणांक की व्याख्या कैसे करूं। मुझे लगता है कि जब मैं बैक-ट्रांसफॉर्मेशन (प्रतिगमन आउटपुट नीचे देखता हूं) तो …

2
पियर्सन का सहसंबंध गुणांक सामान्यता के उल्लंघन के लिए कितना मजबूत है?
विशेष प्रकार की आबादी (जैसे कि मेजर डिप्रेसिव डिसऑर्डर वाले लोगों की आबादी में अवसाद के स्तर) में मापा जाने पर कुछ प्रकार के चर के लिए डेटा गैर-सामान्य हो जाता है। यह देखते हुए कि पियर्सन की सामान्यता मान ली गई है, गैर-सामान्यता की शर्तों के तहत परीक्षण सांख्यिकीय …

2
एक से अधिक प्रतिरूपण के बाद मैं पूल के बाद के साधनों और विश्वसनीय अंतरालों को कैसे कर सकता हूं?
मैंने कई भरे हुए डेटासेट प्राप्त करने के लिए कई प्रतिरूपण का उपयोग किया है। मैंने प्रत्येक पूर्ण डेटासेट पर बायेसियन विधियों का उपयोग एक पैरामीटर (एक यादृच्छिक प्रभाव) के लिए पीछे के वितरण को प्राप्त करने के लिए किया है। मैं इस पैरामीटर के लिए परिणामों को कैसे संयोजित …

3
जुआरियों के लिए प्राथमिक आँकड़े
मुझे जूरी ड्यूटी के लिए तलब किया गया है। मैं कुछ जूरी परीक्षणों के आँकड़ों की प्रासंगिकता से अवगत हूँ। उदाहरण के लिए, "आधार दर" की अवधारणा और संभाव्यता गणनाओं के लिए इसका अनुप्रयोग कभी-कभी - शायद हमेशा - प्रासंगिक होता है। मेरी स्थिति में कोई व्यक्ति किस सांख्यिकीय विषय …

4
बीटा रिग्रेशन में 0,1 मान के साथ काम करना
मेरे पास [0,1] में कुछ डेटा है जिसे मैं बीटा रिग्रेशन के साथ विश्लेषण करना चाहूंगा। बेशक 0,1 मूल्यों को समायोजित करने के लिए कुछ किया जाना चाहिए। मैं एक मॉडल को फिट करने के लिए डेटा को संशोधित करना पसंद करता हूं। मैं यह भी नहीं मानता कि शून्य …

6
"पूरी तरह से बायेसियन" बनाम "बायेसियन"
मैं बायेसियन आंकड़ों के बारे में सीख रहा हूं, और मैंने अक्सर लेखों में पढ़ा है "हम एक बायेसियन दृष्टिकोण अपनाते हैं" या ऐसा ही कुछ। मैंने भी देखा, कम बार: "हम पूरी तरह से बायेसियन दृष्टिकोण अपनाते हैं" (मेरा जोर)। क्या किसी व्यावहारिक या सैद्धांतिक अर्थ में इन दृष्टिकोणों …
20 bayesian 

6
गैर-गौसियन डेटा का पीसीए
मेरे पास पीसीए के बारे में त्वरित प्रश्न हैं: क्या पीसीए मान लेता है कि डेटासेट गॉसियन है? क्या होता है जब मैं एक पीसीए को अंतर्निहित गैर-रैखिक डेटा पर लागू करता हूं? एक डेटासेट को देखते हुए, प्रक्रिया को पहले सामान्यीकृत करना है, 1 से विचरण सेट करें, एक …
20 pca  svd 

2
समय-श्रृंखला दी गई शक्ति और क्रॉस स्पेक्ट्रल घनत्वों का अनुकरण करना
मुझे स्थिर रंगीन समय-श्रृंखला का एक सेट उत्पन्न करने में समस्या हो रही है, उनके सहसंयोजक मैट्रिक्स (उनकी पावर वर्णक्रमीय घनत्व (PSDs) और क्रॉस-पावर वर्णक्रमीय घनत्व (CSDs)) को देखते हुए। मुझे पता है कि, दो टाइम-सीरीज़ और , मैं उनकी पावर वर्णक्रमीय घनत्व (PSDs) का अनुमान लगा सकता हूं और …

3
मुझे आर। में रोलप्ली पीसीए में "उछल" लोड हो रहा है। क्या मैं इसे ठीक कर सकता हूं?
मेरे पास 28 विभिन्न मुद्राओं के लिए दैनिक रिटर्न डेटा के 10 साल हैं। मैं पहले प्रमुख घटक को निकालना चाहता हूं, लेकिन पूरे 10 वर्षों में पीसीए संचालित करने के बजाय, मैं 2 साल की खिड़की को रोलअप करना चाहता हूं, क्योंकि मुद्राओं का व्यवहार विकसित होता है और …
20 r  pca 

1
समान सम वितरण के लिए सामान्य सन्निकटन में त्रुटि
एक सामान्य वितरण को अंजाम देने के लिए एक भोली विधि है कि केंद्रीय सीमा प्रमेय पर भरोसा करते हुए, [ 0 , 1 ] पर 100100100 आईआईडी यादृच्छिक चर समान रूप से वितरित किए जाएं , फिर पुनरावृत्ति और पुनर्विक्रय करें। ( साइड नोट : बॉक्स-मुलर ट्रांसफ़ॉर्म जैसे अधिक …

1
लॉजिस्टिक रिग्रेशन के लिए पूर्वानुमान अंतराल की गणना
मैं यह समझना चाहूंगा कि लॉजिस्टिक रिग्रेशन अनुमानों के लिए भविष्यवाणी अंतराल कैसे उत्पन्न करें । मुझे कोललेट के मॉडलिंग बाइनरी डेटा , द्वितीय एड p.98-99 में प्रक्रियाओं का पालन करने की सलाह दी गई थी । इस प्रक्रिया को लागू करने और R की तुलना करने के बाद predict.glm, …

6
एक चर के पैमाने को 0-100 में बदलना
मैंने पीसीए तकनीक का उपयोग करके एक सामाजिक पूंजी सूचकांक का निर्माण किया है। इस सूचकांक में सकारात्मक और नकारात्मक दोनों तरह के मूल्य शामिल हैं। मैं इस इंडेक्स को 0-100 स्केल में बदलना / परिवर्तित करना चाहता हूं ताकि व्याख्या करना आसान हो जाए। कृपया मुझे ऐसा करने का …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.