सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
एक असतत आरवी का निर्माण करना में सभी युक्तियों का समर्थन करता है।
यह इस सवाल का रचनात्मक उत्तरकथा है । यदि हमारे पास एक असतत समरूप रैंडम वैरिएबल नहीं हो सकता है, जो इंटरवल में सभी युक्तियों का समर्थन करता है , तो अगली सबसे अच्छी बात यह है: [0,1][0,1][0,1] एक यादृच्छिक चर निर्माण करें जिसमें यह समर्थन है, , और यह …

2
समुद्र में खो गए मछुआरे की खोज में बेयस की प्रमेय कैसे लागू करें
द ओड्स, लगातार अपडेट किए गए लेख में एक लंबे द्वीप के मछुआरे की कहानी का उल्लेख किया गया है, जो वास्तव में बायेसियन सांख्यिकी के लिए अपने जीवन का श्रेय देता है। यहाँ संक्षिप्त संस्करण है: आधी रात को एक नाव पर दो मछुआरे हैं। जबकि एक सो रहा …

1
एलडीए निर्णय सीमा की गणना और ग्राफ
मैंने एक एलडीए (रैखिक विभेदक विश्लेषण) प्लॉट को सांख्यिकीय सीखने के तत्वों से निर्णय सीमाओं के साथ देखा : मैं समझता हूं कि डेटा कम-आयामी उप-स्थान पर अनुमानित हैं। हालाँकि, मैं जानना चाहता हूं कि हमें मूल आयाम में निर्णय सीमाएं कैसे मिलती हैं, जैसे कि मैं निर्णय सीमाओं को …

3
क्या अंतर ज्यामिति आँकड़ों के साथ कुछ करना है?
मैं आंकड़ों में मास्टर कर रहा हूं और मुझे अंतर ज्यामिति सीखने की सलाह दी जा रही है। मुझे अंतर ज्यामिति के लिए सांख्यिकीय अनुप्रयोगों के बारे में सुनकर खुशी होगी क्योंकि यह मुझे प्रेरित करेगा। क्या किसी को आँकड़ों में अंतर ज्यामिति के लिए आवेदन पता है?

3
एक बॉक्सप्लॉट से तिरछापन का आकलन कैसे करें?
इस डेटा से निर्मित बॉक्सप्लॉट को देखकर तिरछाता कैसे तय करें: 340, 300, 520, 340, 320, 290, 260, 330 एक पुस्तक में कहा गया है, "यदि निचली चतुर्थक ऊपरी चतुर्थक की तुलना में माध्यिका से बहुत दूर है, तो वितरण नकारात्मक रूप से तिरछा होता है।" कई अन्य स्रोतों ने …

2
पीसीए और एक ही डाटासेट पर खोजपूर्ण कारक विश्लेषण: मतभेद और समानताएं; कारक मॉडल बनाम पीसीए
मैं जानना चाहूंगा कि क्या एक ही डेटा सेट पर प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) और एक्सप्लोसिव फैक्टर एनालिसिस (ईएफए) करने के लिए कोई तार्किक समझदारी है। मैंने पेशेवरों को स्पष्ट रूप से अनुशंसा करते सुना है: समझें कि विश्लेषण का लक्ष्य क्या है और डेटा विश्लेषण के लिए पीसीए या …

2
फिट विश्लेषण की अच्छाई के लिए मजबूत रेखीय मॉडल में एक भारित
मैंने MASS पैकेज Rका उपयोग करके एमएम वेट के साथ एक मजबूत रैखिक मॉडल का अनुमान लगाया rlm()। `R`` मॉडल के लिए मान प्रदान नहीं करता है , लेकिन अगर यह एक सार्थक मात्रा है, तो मैं एक होना चाहूंगा। मुझे यह जानने में भी दिलचस्पी है कि क्या मूल्य …

4
व्यावहारिक रूप से, जब डेटा काफी मान्यताओं को पूरा नहीं करता है, तो लोग एनोवा को कैसे संभालते हैं?
यह कड़ाई से आँकड़े का सवाल नहीं है - मैं एनोवा मान्यताओं के बारे में सभी पाठ्यपुस्तकों को पढ़ सकता हूं - मैं यह पता लगाने की कोशिश कर रहा हूं कि वास्तविक कामकाजी विश्लेषक डेटा को कैसे संभालते हैं जो मान्यताओं को पूरा नहीं करते हैं। मैं इस साइट …

4
GEE: उचित कार्य सहसंबंध संरचना चुनना
मैं एक एपिडेमियोलॉजिस्ट हूं जो जीईई को समझने की कोशिश कर रहा है ताकि कॉहोर्ट स्टडी का ठीक से विश्लेषण किया जा सके (रिलेटिव रिस्क का अनुमान लगाने के लिए लॉग लिंक के साथ पॉइसन रिग्रेशन का उपयोग करना)। मेरे पास "काम करने वाले सहसंबंध" के बारे में कुछ प्रश्न …
19 gee 

1
जब एक विश्लेषणात्मक जेकबियन उपलब्ध होता है, तो क्या
मान लीजिए कि मैं कुछ मॉडल मापदंडों की गणना कर रहा हूं, जो मेरे योग को कम कर रहे हैं, और मुझे लगता है कि मेरी त्रुटियां गौसियन हैं। मेरा मॉडल विश्लेषणात्मक व्युत्पन्न पैदा करता है, इसलिए ऑप्टिमाइज़र को परिमित अंतर का उपयोग करने की आवश्यकता नहीं है। एक बार …

3
रिज रिग्रेशन और पीसीए रिग्रेशन के बीच संबंध
मुझे याद है कि वेब पर कहीं भी रिज रिग्रेशन ( नियमितीकरण के साथ) और PCA रिग्रेशन के बीच एक कनेक्शन पढ़ा गया है : हाइपरपरमीटर साथ -इग्रेटेड रिग्रेशन का उपयोग करते समय , यदि , तो प्रतिगमन हटाने के बराबर है सबसे छोटे eigenvalue के साथ पीसी चर।ℓ2ℓ2\ell_2ℓ2ℓ2\ell_2λλ\lambdaλ→0λ→0\lambda \to …

2
बूटस्ट्रैपिंग - क्या मुझे पहले आउटलेर्स को हटाने की आवश्यकता है?
हमने एक नई उत्पाद सुविधा का विभाजन परीक्षण चलाया है और यह मापना चाहते हैं कि राजस्व का उत्थान महत्वपूर्ण है या नहीं। हमारी टिप्पणियों को निश्चित रूप से वितरित नहीं किया जाता है (हमारे अधिकांश उपयोगकर्ता खर्च नहीं करते हैं, और जो ऐसा करते हैं, उनके भीतर यह बहुत …

1
देखभाल और गुणांक (glmnet)
मैं एक विशेष डेटा सेट पर इनविटेशन बनाने के लिए कैरट का उपयोग करने में रुचि रखता हूं। क्या निम्नलिखित करना संभव है: एक glmnet मॉडल के गुणांक का उत्पादन करता हूं जिसे मैंने कैरेट में प्रशिक्षित किया था। मैं अंतर्निहित सुविधा के चयन के कारण glmnet का उपयोग करना …
19 caret  glmnet 

1
3-डी घनत्व फ़ंक्शन की कल्पना कैसे करें?
3-डी घनत्व फ़ंक्शन की कल्पना करने का सबसे अच्छा तरीका क्या है? जैसा कि मैं कल्पना करना चाहूंगा ?z= चएक्स, वाई( एक्स , वाई)z=fX,Y(x,y)z=f_{X,Y}(x,y) आवश्यक नहीं है लेकिन इसके लिए Rकोड बहुत अच्छा होगा।

2
बेतरतीब जंगल है ओवरफिटिंग?
मैं परिक्षित के साथ यादृच्छिक जंगलों के साथ प्रयोग कर रहा हूं और मुझे अपने प्रशिक्षण सेट के शानदार परिणाम मिल रहे हैं, लेकिन मेरे परीक्षण के परिणाम अपेक्षाकृत खराब हैं ... यहां समस्या (पोकर से प्रेरित) है जिसे मैं हल करने की कोशिश कर रहा हूं: खिलाड़ी ए के …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.